Kirilicas īpatnības Python regulārajās izteiksmēs
Liela Python regulāro izteiksmju priekšrocība
ir tā, ka kirilicas rakstzīmes
ietilpst grupā \w. Aizstāsim
visas latīņu un kirilicas burtus
šajā virknē:
txt = 'x232x 456 xax xтекстx'
res = re.sub('x[\w]*x', '!', txt)
print(res)
Koda izpildes rezultāts:
'! 456 ! !'
Arī kirilicas burtus var meklēt
ar kvadrātiekavās norādītu grupu: [а-я].
Bet ar to ir problēma - tajā neietilps
burts 'ё'. Lai to iekļautu, ir
jāpievieno šis burts grupai:
res = re.sub('x[а-яё]*x', '!', txt)
print(res)
Koda izpildes rezultāts:
'! 456 xax !'
Dota virkne:
txt = 'wйw wяw wёw wqw'
Uzrakstiet regulāro izteiksmi, kas atradīs virknes
pēc šablona: malās ir burti
'w', un starp tiem - kirilicas burts.
Dota virkne:
txt = 'ааа ббб ёёё ззз ййй ААА БББ ЁЁЁ ЗЗЗ ЙЙЙ'
Uzrakstiet regulāro izteiksmi, kas atradīs visus vārdus pēc šablona: jebkurš kirilicas burts jebkuru reižu skaitu.