Kenmerken van Cyrillisch in Python reguliere expressies
Een groot voordeel van reguliere expressies in Python
is dat Cyrillische karakters
behoren tot de groep \w. Laten we alle
Latijnse en Cyrillische letters vervangen in
de volgende string:
txt = 'x232x 456 xax xтекстx'
res = re.sub('x[\w]*x', '!', txt)
print(res)
Uitvoerresultaat van de code:
'! 456 ! !'
Cyrillische letters kunnen ook worden gezocht
met een groep in vierkante haken: [а-я].
Maar hier is een probleem mee - de letter
'ё' wordt hier niet in meegenomen.
Om deze toe te voegen, moet je
deze letter aan de groep toevoegen:
res = re.sub('x[а-яё]*x', '!', txt)
print(res)
Uitvoerresultaat van de code:
'! 456 xax !'
Gegeven een string:
txt = 'wйw wяw wёw wqw'
Schrijf een reguliere expressie die strings vindt
volgens het patroon: aan de randen staan de letters
'w', en daartussen - een Cyrillische letter.
Gegeven een string:
txt = 'ааа ббб ёёё ззз ййй ААА БББ ЁЁЁ ЗЗЗ ЙЙЙ'
Schrijf een reguliere expressie die alle woorden vindt volgens het patroon: elke Cyrillische letter elk aantal keren.