Caratteristiche del cirillico nelle espressioni regolari di Python
Un grande vantaggio delle espressioni regolari in Python
è che i caratteri cirillici
fanno parte del gruppo \w. Sostituiamo
tutte le lettere latine e cirilliche nella
seguente stringa:
txt = 'x232x 456 xax xтекстx'
res = re.sub('x[\w]*x', '!', txt)
print(res)
Risultato dell'esecuzione del codice:
'! 456 ! !'
Le lettere cirilliche possono anche essere cercate con
l'aiuto di un gruppo tra parentesi quadre: [а-я].
Ma c'è un problema con questo - la lettera
'ё' non è inclusa. Per includerla è necessario
aggiungere questa lettera al gruppo:
res = re.sub('x[а-яё]*x', '!', txt)
print(res)
Risultato dell'esecuzione del codice:
'! 456 xax !'
Data la stringa:
txt = 'wйw wяw wёw wqw'
Scrivi un'espressione regolare che trovi le stringhe
secondo il modello: ai lati ci sono le lettere
'w', e tra di loro - una lettera cirillica.
Data la stringa:
txt = 'ааа ббб ёёё ззз ййй ААА БББ ЁЁЁ ЗЗЗ ЙЙЙ'
Scrivi un'espressione regolare che trovi tutte le parole secondo il modello: qualsiasi lettera cirillica un numero qualsiasi di volte.