Specyfika cyrylicy w wyrażeniach regularnych Pythona
Wielką zaletą wyrażeń regularnych w Pythonie
jest to, że znaki cyrylickie
wchodzą w skład grupy \w. Zamieńmy
wszystkie litery łacińskie i cyrylickie w
następującym ciągu:
txt = 'x232x 456 xax xтекстx'
res = re.sub('x[\w]*x', '!', txt)
print(res)
Wynik wykonania kodu:
'! 456 ! !'
Litery cyrylickie można również wyszukiwać
za pomocą grupy w nawiasach kwadratowych: [а-я].
Ale jest z tym problem - nie uwzględni ona
litery 'ё'. Aby ją dołączyć, należy
dopisać tę literę do grupy:
res = re.sub('x[а-яё]*x', '!', txt)
print(res)
Wynik wykonania kodu:
'! 456 xax !'
Dany jest ciąg:
txt = 'wйw wяw wёw wqw'
Napisz wyrażenie regularne, które znajdzie ciągi
według wzorca: na brzegach stoją litery
'w', a między nimi - litera cyrylicy.
Dany jest ciąg:
txt = 'ааа ббб ёёё ззз ййй ААА БББ ЁЁЁ ЗЗЗ ЙЙЙ'
Napisz wyrażenie regularne, które znajdzie wszystkie słowa według wzorca: dowolna litera cyrylicka dowolną liczbę razy.