Særlige træk ved kyrilliske bogstaver i Python regex
En stor fordel ved regulære udtryk i Python
er, at kyrilliske tegn
indgår i gruppen \w. Lad os erstatte
alle latinske og kyrilliske bogstaver i
følgende streng:
txt = 'x232x 456 xax xтекстx'
res = re.sub('x[\w]*x', '!', txt)
print(res)
Resultat af kodeudførelse:
'! 456 ! !'
Kyrilliske bogstaver kan også søges efter med
en gruppe i firkantede parenteser: [а-я].
Men der er et problem med den - bogstavet
'ё' inkluderes ikke her. For at inkludere det skal
man tilføje dette bogstav til gruppen:
res = re.sub('x[а-яё]*x', '!', txt)
print(res)
Resultat af kodeudførelse:
'! 456 xax !'
Givet strengen:
txt = 'wйw wяw wёw wqw'
Skriv et regulært udtryk, der finder strenge
efter mønsteret: der er bogstaver
'w' på siderne, og imellem dem - et kyrillisk bogstav.
Givet strengen:
txt = 'ааа ббб ёёё ззз ййй ААА БББ ЁЁЁ ЗЗЗ ЙЙЙ'
Skriv et regulært udtryk, der finder alle ord efter mønsteret: ethvert kyrillisk bogstav et vilkårligt antal gange.