Particularitățile chirilicelor în expresiile regulate Python
Un mare avantaj al expresiilor regulate în Python
este faptul că caracterele chirilice
fac parte din grupul \w. Să înlocuim
toate literele latine și chirilice din
următorul șir:
txt = 'x232x 456 xax xтекстx'
res = re.sub('x[\w]*x', '!', txt)
print(res)
Rezultatul executării codului:
'! 456 ! !'
De asemenea, literele chirilice pot fi căutate
cu ajutorul unui grup în paranteze pătrate: [а-я].
Dar cu acesta există o problemă - aici nu va fi
inclusă litera 'ё'. Pentru a o include, este nevoie
să adăugați această literă la grup:
res = re.sub('x[а-яё]*x', '!', txt)
print(res)
Rezultatul executării codului:
'! 456 xax !'
Este dat șirul:
txt = 'wйw wяw wёw wqw'
Scrieți o expresie regulată care va găsi șirurile
după modelul: pe margini stau literele
'w', iar între ele - o literă chirilică.
Este dat șirul:
txt = 'ааа ббб ёёё ззз ййй ААА БББ ЁЁЁ ЗЗЗ ЙЙЙ'
Scrieți o expresie regulată care va găsi toate cuvintele după modelul: orice literă chirilică de oricâte ori.