Особености ћирилице у регуларним изразима у Пајтону
Велика предност регуларних израза у Пајтону
је то што ћирилични симболи
спадају у групу \w. Заменимо
сва латинична и ћирилична слова у
следећем низу:
txt = 'x232x 456 xax xтекстx'
res = re.sub('x[\w]*x', '!', txt)
print(res)
Резултат извршавања кода:
'! 456 ! !'
Такође ћирилична слова се могу тражити
помоћу групе у угластим заградама: [а-я].
Али са њом постоји проблем - у њу неће ући
слово 'ё'. Да би се оно укључило потребно
је додати то слово групи:
res = re.sub('x[а-яё]*x', '!', txt)
print(res)
Резултат извршавања кода:
'! 456 xax !'
Дат је низ:
txt = 'wйw wяw wёw wqw'
Напишите регуларни израз који ће пронаћи низове
према шаблону: са обе стране стоје слова
'w', а између њих - ћирилично слово.
Дат је низ:
txt = 'ааа ббб ёёё ззз ййй ААА БББ ЁЁЁ ЗЗЗ ЙЙЙ'
Напишите регуларни израз који ће пронаћи све речи према шаблону: било које ћирилично слово било који број пута.