Eienskappe van Cyrilliese karakters in Python gereelde uitdrukkings
'n Groot voordeel van gereelde uitdrukkings in Python
is dat Cyrilliese karakters
binne die groep \w val. Kom ons vervang
alle Latynse en Cyrilliese letters in
die volgende string:
txt = 'x232x 456 xax xтекстx'
res = re.sub('x[\w]*x', '!', txt)
print(res)
Resultaat van kode-uitvoering:
'! 456 ! !'
Cyrilliese letters kan ook gesoek word met
behulp van 'n groep in vierkantige hakies: [а-я].
Maar daar is 'n probleem hiermee - die letter
'ё' sal nie ingesluit word nie. Om dit in te sluit, moet
daardie letter by die groep gevoeg word:
res = re.sub('x[а-яё]*x', '!', txt)
print(res)
Resultaat van kode-uitvoering:
'! 456 xax !'
Gegee 'n string:
txt = 'wйw wяw wёw wqw'
Skryf 'n gereelde uitdrukking wat stringe sal vind
volgens die patroon: aan die kante is letters
'w', en tussen hulle - 'n Cyrilliese letter.
Gegee 'n string:
txt = 'ааа ббб ёёё ззз ййй ААА БББ ЁЁЁ ЗЗЗ ЙЙЙ'
Skryf 'n gereelde uitdrukking wat al die woorde sal vind volgens die patroon: enige Cyrilliese letter enige aantal kere.