পাইথনে রেগুলার এক্সপ্রেশনে সিরিলিকের বৈশিষ্ট্য
পাইথনে রেগুলার এক্সপ্রেশনের একটি বড় সুবিধা হল
যে সিরিলিক অক্ষরগুলি \w গ্রুপের অন্তর্ভুক্ত।
আসুন নিম্নলিখিত স্ট্রিংটিতে সমস্ত ল্যাটিন এবং
সিরিলিক অক্ষর প্রতিস্থাপন করি:
txt = 'x232x 456 xax xтекстx'
res = re.sub('x[\w]*x', '!', txt)
print(res)
কোড 실행ের ফলাফল:
'! 456 ! !'
বর্গাকার বন্ধনীতে গ্রুপ ব্যবহার করেও সিরিলিক অক্ষর
খুঁজে পাওয়া যায়: [а-я]।
কিন্তু এটির একটি সমস্যা আছে - এখানে 'ё'
অক্ষরটি অন্তর্ভুক্ত হবে না। একে অন্তর্ভুক্ত করার জন্য
এই অক্ষরটি গ্রুপে যোগ করতে হবে:
res = re.sub('x[а-яё]*x', '!', txt)
print(res)
কোড 실행ের ফলাফল:
'! 456 xax !'
একটি স্ট্রিং দেওয়া হয়েছে:
txt = 'wйw wяw wёw wqw'
একটি রেগুলার এক্সপ্রেশন লিখুন যা নিম্নলিখিত প্যাটার্ন অনুযায়ী
স্ট্রিংগুলি খুঁজে পাবে: প্রান্তে 'w' অক্ষর আছে,
এবং তাদের মধ্যে - একটি সিরিলিক অক্ষর।
একটি স্ট্রিং দেওয়া হয়েছে:
txt = 'ааа ббб ёёё ззз ййй ААА БББ ЁЁЁ ЗЗЗ ЙЙЙ'
একটি রেগুলার এক্সপ্রেশন লিখুন যা নিম্নলিখিত প্যাটার্ন অনুযায়ী সমস্ত শব্দ খুঁজে পাবে: যেকোনো সিরিলিক অক্ষর যেকোনো সংখ্যক বার।