Särskilda egenskaper hos kyrilliska tecken i Pythons reguljära uttryck
En stor fördel med reguljära uttryck i Python
är att kyrilliska tecken
ingår i gruppen \w. Låt oss ersätta
alla latinska och kyrilliska bokstäver i
följande sträng:
txt = 'x232x 456 xax xтекстx'
res = re.sub('x[\w]*x', '!', txt)
print(res)
Resultatet av att köra koden:
'! 456 ! !'
Kyrilliska bokstäver kan också sökas med
hjälp av en grupp inom hakparenteser: [а-я].
Men det finns ett problem med den - den
inkluderar inte bokstaven 'ё'. För att inkludera den måste
man lägga till den bokstaven till gruppen:
res = re.sub('x[а-яё]*x', '!', txt)
print(res)
Resultatet av att köra koden:
'! 456 xax !'
Given en sträng:
txt = 'wйw wяw wёw wqw'
Skriv ett reguljärt uttryck som hittar strängar
enligt mönstret: vid kanterna står bokstäverna
'w', och mellan dem - en kyrillisk bokstav.
Given en sträng:
txt = 'ааа ббб ёёё ззз ййй ААА БББ ЁЁЁ ЗЗЗ ЙЙЙ'
Skriv ett reguljärt uttryck som hittar alla ord enligt mönstret: valfri kyrillisk bokstav valfritt antal gånger.