Асаблівасці кірыліцы ў рэгулярках Python
Вялікай перавагай рэгулярак у Python
з'яўляецца тое, што кірылічныя сімвалы
ўваходзяць у групу \w. Давайце заменім
усе лацінскія і кірылічныя літары ў
наступным радку:
txt = 'x232x 456 xax xтекстx'
res = re.sub('x[\w]*x', '!', txt)
print(res)
Вынік выканання кода:
'! 456 ! !'
Таксама кірылічныя літары можна шукаць з
дапамогай групы ў квадратных дужках: [а-я].
Але з ёй ёсць праблема - сюды не ўвойдзе
літара 'ё'. Для яе ўключэння трэба
дапісаць гэтую літару да групы:
res = re.sub('x[а-яё]*x', '!', txt)
print(res)
Вынік выканання кода:
'! 456 xax !'
Дадзены радок:
txt = 'wйw wяw wёw wqw'
Напішыце рэгулярку, якая знойдзе радкі
па шаблоне: па краях стаяць літары
'w', а паміж імі - літара кірыліцы.
Дадзены радок:
txt = 'ааа ббб ёёё ззз ййй ААА БББ ЁЁЁ ЗЗЗ ЙЙЙ'
Напішыце рэгулярку, якая знойдзе ўсе словы па шаблоне: любая кірылічная літара любы колькасць разоў.