Хусусиятҳои ҳарфҳои кириллӣ дар Regular Expression-ҳои Python
Имтиёзи бузурги Regular Expression-ҳо дар Python
ин аст, ки аломатҳои кириллӣ
ба гурӯҳи \w дохил мешаванд. Биёед ҳамаи
ҳарфҳои лотинӣ ва кириллиро дар
сатри зерин иваз кунем:
txt = 'x232x 456 xax xтекстx'
res = re.sub('x[\w]*x', '!', txt)
print(res)
Натиҷаи иҷрои код:
'! 456 ! !'
Ҳамчунин ҳарфҳои кириллиро бо ёрии
гурӯҳ дар қавсҳои квадратӣ ҷустуҷӯ кардан мумкин аст: [а-я].
Вале бо он мушкилие ҳаст - ҳарфи
'ё' ба он дохил нахоҳад шуд. Барои дохил кардани он зарур аст,
ки ин ҳарфро ба гурӯҳ илова кунед:
res = re.sub('x[а-яё]*x', '!', txt)
print(res)
Натиҷаи иҷрои код:
'! 456 xax !'
Сатр дода шудааст:
txt = 'wйw wяw wёw wqw'
Regular Expression нависед, ки сатрҳоро
ба шаблон пайдо кунад: дар канорҳо ҳарфҳои
'w' истодаанд, ва байни онҳо - ҳарфи кириллӣ.
Сатр дода шудааст:
txt = 'ааа ббб ёёё ззз ййй ААА БББ ЁЁЁ ЗЗЗ ЙЙЙ'
Regular Expression нависед, ки ҳамаи калимаҳоро ба шаблон пайдо кунад: ҳар гуна ҳарфи кириллӣ ҳар чанд маротиба.