पायथन में रेगुलर एक्सप्रेशन में सिरिलिक की विशेषताएं
पायथन में रेगुलर एक्सप्रेशन का एक बड़ा फायदा
यह है कि सिरिलिक वर्ण
समूह \w में शामिल हैं। आइए
निम्नलिखित स्ट्रिंग में
सभी लैटिन और सिरिलिक अक्षरों को प्रतिस्थापित करें:
txt = 'x232x 456 xax xтекстx'
res = re.sub('x[\w]*x', '!', txt)
print(res)
कोड निष्पादन का परिणाम:
'! 456 ! !'
सिरिलिक अक्षरों को वर्गाकार कोष्ठकों के समूह के साथ
भी खोजा जा सकता है: [а-я].
लेकिन इसके साथ एक समस्या है - इसमें
अक्षर 'ё' शामिल नहीं होगा। इसे शामिल करने के लिए
इस अक्षर को समूह में जोड़ना होगा:
res = re.sub('x[а-яё]*x', '!', txt)
print(res)
कोड निष्पादन का परिणाम:
'! 456 xax !'
एक स्ट्रिंग दी गई है:
txt = 'wйw wяw wёw wqw'
एक रेगुलर एक्सप्रेशन लिखें जो स्ट्रिंग्स
फॉर्मेट के अनुसार ढूंढे: किनारों पर अक्षर
'w' हैं, और उनके बीच में - एक सिरिलिक अक्षर।
एक स्ट्रिंग दी गई है:
txt = 'ааа ббб ёёё ззз ййй ААА БББ ЁЁЁ ЗЗЗ ЙЙЙ'
एक रेगुलर एक्सप्रेशन लिखें जो सभी शब्दों को फॉर्मेट के अनुसार ढूंढे: कोई भी सिरिलिक अक्षर किसी भी संख्या में बार।