Veçoritë e alfabetit cirilik në regex të Python
Një përparësi e madhe e regex në Python
është se simbolet cirilike
përfshihen në grupin \w. Le të zëvendësojmë
të gjitha shkronjat latine dhe cirilike në
vargun e mëposhtëm:
txt = 'x232x 456 xax xтекстx'
res = re.sub('x[\w]*x', '!', txt)
print(res)
Rezultati i ekzekutimit të kodit:
'! 456 ! !'
Gjithashtu shkronjat cirilike mund të kërkohen
me ndihmën e një grupi në kllapa katrore: [а-я].
Por me të ka një problem - këtu nuk përfshihet
shkronja 'ё'. Për ta përfshirë atë duhet
t'i shtohet kjo shkronjë grupit:
res = re.sub('x[а-яё]*x', '!', txt)
print(res)
Rezultati i ekzekutimit të kodit:
'! 456 xax !'
Është dhënë vargu:
txt = 'wйw wяw wёw wqw'
Shkruani një regex që do të gjejë vargjet
sipas shabllonit: në anët janë shkronjat
'w', dhe midis tyre - një shkronjë cirilike.
Është dhënë vargu:
txt = 'ааа ббб ёёё ззз ййй ААА БББ ЁЁЁ ЗЗЗ ЙЙЙ'
Shkruani një regex që do të gjejë të gjitha fjalët sipas shabllonit: çdo shkronjë cirilike çdo numër herësh.