A cirill betűk sajátosságai a Python reguláris kifejezéseiben
A Python reguláris kifejezéseinek nagy előnye,
hogy a cirill karakterek
a \w csoportba tartoznak.
Cseréljük le az összes latin és cirill betűt a
következő sztringben:
txt = 'x232x 456 xax xтекстx'
res = re.sub('x[\w]*x', '!', txt)
print(res)
A kód végrehajtásának eredménye:
'! 456 ! !'
A cirill betűk szögletes zárójelek közé tett csoporttal is kereshetők: [а-я].
De ezzel van egy probléma - az
'ё' betű nem tartozik ide.
Ennek a betűnek a belefoglalásához
hozzá kell írni ezt a betűt a csoporthoz:
res = re.sub('x[а-яё]*x', '!', txt)
print(res)
A kód végrehajtásának eredménye:
'! 456 xax !'
Adott a következő sztring:
txt = 'wйw wяw wёw wqw'
Írjon egy reguláris kifejezést, amely megtalálja a sztringeket
a következő minta szerint: a széleken 'w' betűk állnak,
közöttük pedig egy cirill betű van.
Adott a következő sztring:
txt = 'ааа ббб ёёё ззз ййй ААА БББ ЁЁЁ ЗЗЗ ЙЙЙ'
Írjon egy reguláris kifejezést, amely megtalálja az összes szót a következő minta szerint: bármilyen cirill betű bármennyiszer.