Особенности кириллицы в регулярках Python
Большим преимуществом регулярок в Python
является то, что кириллические символы
входят в группу \w
. Давайте заменим
все латинские и кириллические буквы в
следующей строке:
txt = 'x232x 456 xax xтекстx'
res = re.sub('x[\w]*x', '!', txt)
print(res)
Результат выполнения кода:
'! 456 ! !'
Также кириллические буквы можно искать с
помощью группы в квадратных скобках: [а-я]
.
Но с ней есть проблема - сюда не войдет
буква 'ё'
. Для ее включения нужно
дописать эту букву к группе:
res = re.sub('x[а-яё]*x', '!', txt)
print(res)
Результат выполнения кода:
'! 456 xax !'
Дана строка:
txt = 'wйw wяw wёw wqw'
Напишите регулярку, которая найдет строки
по шаблону: по краям стоят буквы
'w'
, а между ними - буква кириллицы.
Дана строка:
txt = 'ааа ббб ёёё ззз ййй ААА БББ ЁЁЁ ЗЗЗ ЙЙЙ'
Напишите регулярку, которая найдет все слова по шаблону: любая кириллическая буква любое количество раз.