Карактеристики на кирилицата во регуларните изрази во Python
Голема предност на регуларните изрази во Python
е тоа што кириличните знаци
припаѓаат на групата \w. Ајде да ги замениме
сите латинични и кирилични букви во
следниот стринг:
txt = 'x232x 456 xax xтекстx'
res = re.sub('x[\w]*x', '!', txt)
print(res)
Резултат од извршувањето на кодот:
'! 456 ! !'
Исто така, кириличните букви може да се бараат со
помош на група во квадратни загради: [а-я].
Но, со неа има проблем - тука нема да влезе
буквата 'ё'. За нејзино вклучување потребно е
да се додаде оваа буква на групата:
res = re.sub('x[а-яё]*x', '!', txt)
print(res)
Резултат од извршувањето на кодот:
'! 456 xax !'
Даден е стринг:
txt = 'wйw wяw wёw wqw'
Напишете регуларен израз кој ќе ги најде стринговите
според шаблонот: на краевите стојат букви
'w', а помеѓу нив - кирилична буква.
Даден е стринг:
txt = 'ааа ббб ёёё ззз ййй ААА БББ ЁЁЁ ЗЗЗ ЙЙЙ'
Напишете регуларен израз кој ќе ги најде сите зборови според шаблонот: било која кирилична буква било кој број пати.