Kirilicos ypatumai Python reguliariosiose išraiškose
Didelis Python reguliariųjų išraiškų pranašumas
yra tai, kad kirilicos simboliai
priklauso grupei \w. Pakeiskime
visas lotyniškas ir kirilicos raides
šiame tekste:
txt = 'x232x 456 xax xтекстx'
res = re.sub('x[\w]*x', '!', txt)
print(res)
Kodo vykdymo rezultatas:
'! 456 ! !'
Taip pat kirilicos raides galima ieškoti
naudojant grupę laužtiniuose skliaustuose: [а-я].
Bet su ja yra problema - į ją nepatenka
raidė 'ё'. Norint ją įtraukti, reikia
pridėti šią raidę prie grupės:
res = re.sub('x[а-яё]*x', '!', txt)
print(res)
Kodo vykdymo rezultatas:
'! 456 xax !'
Duotas tekstas:
txt = 'wйw wяw wёw wqw'
Parašykite reguliariąją išraišką, kuri ras eilutes
pagal šabloną: kraštuose yra raidės
'w', o tarp jų - kirilicos raidė.
Duotas tekstas:
txt = 'ааа ббб ёёё ззз ййй ААА БББ ЁЁЁ ЗЗЗ ЙЙЙ'
Parašykite reguliariąją išraišką, kuri ras visus žodžius pagal šabloną: bet kokia kirilicos raidė bet kokį kiekį kartų.