Egenskaper ved kyrilliske tegn i Pythons regulære uttrykk
En stor fordel med regulære uttrykk i Python
er at kyrilliske tegn
inngår i gruppen \w. La oss erstatte
alle latinske og kyrilliske bokstaver i
følgende streng:
txt = 'x232x 456 xax xтекстx'
res = re.sub('x[\w]*x', '!', txt)
print(res)
Resultat av kjøring av koden:
'! 456 ! !'
Kyrilliske bokstaver kan også søkes etter med
hjelp av en gruppe i hakeparenteser: [а-я].
Men det er et problem med denne - den inkluderer ikke
bokstaven 'ё'. For å inkludere den må
man skrive denne bokstaven til gruppen:
res = re.sub('x[а-яё]*x', '!', txt)
print(res)
Resultat av kjøring av koden:
'! 456 xax !'
Gitt strengen:
txt = 'wйw wяw wёw wqw'
Skriv et regulært uttrykk som finner strenger
etter mønsteret: på kantene står bokstavene
'w', og mellom dem - en kyrillisk bokstav.
Gitt strengen:
txt = 'ааа ббб ёёё ззз ййй ААА БББ ЁЁЁ ЗЗЗ ЙЙЙ'
Skriv et regulært uttrykk som finner alle ordene etter mønsteret: en hvilken som helst kyrillisk bokstav et hvilket som helst antall ganger.