Ciri-ciri Aksara Kiril dalam Regex Python
Satu kelebihan besar regex dalam Python
ialah aksara Kiril
termasuk dalam kumpulan \w. Mari kita gantikan
semua huruf Latin dan Kiril dalam
talian berikut:
txt = 'x232x 456 xax xтекстx'
res = re.sub('x[\w]*x', '!', txt)
print(res)
Hasil pelaksanaan kod:
'! 456 ! !'
Aksara Kiril juga boleh dicari dengan
menggunakan kumpulan dalam kurungan segi empat: [а-я].
Tetapi terdapat masalah dengannya - huruf
'ё' tidak akan termasuk di sini.
Untuk memasukkannya, kita perlu
menambahkan huruf ini pada kumpulan:
res = re.sub('x[а-яё]*x', '!', txt)
print(res)
Hasil pelaksanaan kod:
'! 456 xax !'
Diberi rentetan:
txt = 'wйw wяw wёw wqw'
Tulis regex yang akan mencari rentetan
mengikut corak: huruf 'w' berada di tepi,
dan di antaranya ialah huruf Kiril.
Diberi rentetan:
txt = 'ааа ббб ёёё ззз ййй ААА БББ ЁЁЁ ЗЗЗ ЙЙЙ'
Tulis regex yang akan mencari semua perkataan mengikut corak: sebarang huruf Kiril sebarang bilangan kali.