පයිතන් රෙගුලරුවල සිරිලික් අකුරුවල විශේෂතා
පයිතන්හි රෙගුලරුවල විශාල වාසියක් වන්නේ
සිරිලික් සංකේත \w කණ්ඩායමට ඇතුළත් වීමයි.
පහත දැක්වෙන ස්ට්රින්ගයේ ඇති සියලුම
ලතින් සහ සිරිලික් අකුරු අපි ප්රතිස්ථාපනය කරමු:
txt = 'x232x 456 xax xтекстx'
res = re.sub('x[\w]*x', '!', txt)
print(res)
කේතය ක්රියාත්මක කිරීමේ ප්රතිඵලය:
'! 456 ! !'
චතුරස්ර වරහන් තුළ ඇති කණ්ඩායම භාවිතයෙන්
සිරිලික් අකුරු සෙවිය හැකිය: [а-я].
නමුත් එහි ගැටලුවක් ඇත - 'ё' අකුර
මෙහි ඇතුළත් නොවේ. එය ඇතුළත් කිරීම සඳහා
මෙම අකුර කණ්ඩායමට එකතු කළ යුතුය:
res = re.sub('x[а-яё]*x', '!', txt)
print(res)
කේතය ක්රියාත්මක කිරීමේ ප්රතිඵලය:
'! 456 xax !'
ස්ට්රින්ගයක් ලබා දී ඇත:
txt = 'wйw wяw wёw wqw'
රටාවට අනුව ස්ට්රින්ග සොයා ගන්නා
රෙගුලරුවක් ලියන්න: කෙළවරේ 'w'
අකුරු සිටී, ඒවායේ මැද - සිරිලික් අකුරක්.
ස්ට්රින්ගයක් ලබා දී ඇත:
txt = 'ааа ббб ёёё ззз ййй ААА БББ ЁЁЁ ЗЗЗ ЙЙЙ'
රටාවට අනුව සියලු වචන සොයා ගන්නා රෙගුලරුවක් ලියන්න: ඕනෑම සිරිලික් අකුරක් ඕනෑම ගණනක්.