Kirillitsa eripärad Pythoni regulaaravaldistes
Pythoni regulaaravaldiste suur eelis
on see, et kirillitsa sümbolid
kuuluvad gruppi \w. Asendame
kõik ladina ja kirillitsa tähed
järgmises stringis:
txt = 'x232x 456 xax xтекстx'
res = re.sub('x[\w]*x', '!', txt)
print(res)
Koodi täitmise tulemus:
'! 456 ! !'
Kirillitsa tähti saab otsida ka
ruutsulgudes oleva grupiga: [а-я].
Kuid sellega on probleem - siia ei kuulu
täht 'ё'. Selle lisamiseks tuleb
see täht gruppi juurde kirjutada:
res = re.sub('x[а-яё]*x', '!', txt)
print(res)
Koodi täitmise tulemus:
'! 456 xax !'
Antud string:
txt = 'wйw wяw wёw wqw'
Kirjutage regulaaravaldis, mis leiab stringid
mustri järgi: servades on tähed
'w', ja nende vahel - kirillitsa täht.
Antud string:
txt = 'ааа ббб ёёё ззз ййй ААА БББ ЁЁЁ ЗЗЗ ЙЙЙ'
Kirjutage regulaaravaldis, mis leiab kõik sõnad mustri järgi: suvaline kirillitsa täht suvaline arv kordi.