Características del cirílico en las expresiones regulares de Python
Una gran ventaja de las expresiones regulares en Python
es que los símbolos cirílicos
pertenecen al grupo \w. Reemplacemos
todas las letras latinas y cirílicas en
la siguiente cadena:
txt = 'x232x 456 xax xтекстx'
res = re.sub('x[\w]*x', '!', txt)
print(res)
Resultado de la ejecución del código:
'! 456 ! !'
También se pueden buscar letras cirílicas
con un grupo entre corchetes: [а-я].
Pero tiene un problema: no incluirá
la letra 'ё'. Para incluirla, es necesario
añadir esta letra al grupo:
res = re.sub('x[а-яё]*x', '!', txt)
print(res)
Resultado de la ejecución del código:
'! 456 xax !'
Se da la cadena:
txt = 'wйw wяw wёw wqw'
Escriba una expresión regular que encuentre las cadenas
según el patrón: en los bordes hay letras
'w', y entre ellas - una letra cirílica.
Se da la cadena:
txt = 'ааа ббб ёёё ззз ййй ААА БББ ЁЁЁ ЗЗЗ ЙЙЙ'
Escriba una expresión regular que encuentre todas las palabras según el patrón: cualquier letra cirílica cualquier número de veces.