Особенности на кирилицата в регулярните изрази на Python
Голямо предимство на регулярните изрази в Python
е фактът, че кирилските символи
се включват в групата \w. Нека заменим
всички латински и кирилски букви в
следния низ:
txt = 'x232x 456 xax xтекстx'
res = re.sub('x[\w]*x', '!', txt)
print(res)
Резултат от изпълнението на кода:
'! 456 ! !'
Също така кирилските букви могат да се търсят
с помощта на група в квадратни скоби: [а-я].
Но с нея има проблем - тук няма да влезе
буквата 'ё'. За да бъде включена, трябва
да се добави тази буква към групата:
res = re.sub('x[а-яё]*x', '!', txt)
print(res)
Резултат от изпълнението на кода:
'! 456 xax !'
Даден е низът:
txt = 'wйw wяw wёw wqw'
Напишете регулярен израз, който ще намери низовете
по шаблон: от двете страни има букви
'w', а между тях - кирилска буква.
Даден е низът:
txt = 'ааа ббб ёёё ззз ййй ААА БББ ЁЁЁ ЗЗЗ ЙЙЙ'
Напишете регулярен израз, който ще намери всички думи по шаблон: произволна кирилска буква произволен брой пъти.