Kyrillisten merkkien erityispiirteet Pythonin säännöllisissä lausekkeissa
Suuri etu Pythonin säännöllisissä lausekkeissa
on, että kyrilliset merkit
kuuluvat ryhmään \w. Korvataan
kaikki latinalaiset ja kyrilliset kirjaimet
seuraavassa merkkijonossa:
txt = 'x232x 456 xax xтекстx'
res = re.sub('x[\w]*x', '!', txt)
print(res)
Koodin suorituksen tulos:
'! 456 ! !'
Kyrillisiä kirjaimia voidaan myös etsiä
käyttämällä hakasulkuissa olevaa ryhmää: [а-я].
Mutta siinä on ongelma - kirjain 'ё'
ei sisälly tähän. Sen sisällyttämiseksi tämä
kirjain on lisättävä ryhmään:
res = re.sub('x[а-яё]*x', '!', txt)
print(res)
Koodin suorituksen tulos:
'! 456 xax !'
Annettu merkkijono:
txt = 'wйw wяw wёw wqw'
Kirjoita säännöllinen lauseke, joka löytää merkkijonot
kaavion mukaan: reunoissa on kirjaimet
'w', ja niiden välissä on kyrillinen kirjain.
Annettu merkkijono:
txt = 'ааа ббб ёёё ззз ййй ААА БББ ЁЁЁ ЗЗЗ ЙЙЙ'
Kirjoita säännöllinen lauseke, joka löytää kaikki sanat kaavion mukaan: mikä tahansa kyrillinen kirjain määrä kertoja.