Python 정규식에서 키릴 문자의 특징
Python 정규식의 큰 장점은
키릴 문자가 \w 그룹에 포함된다는 것입니다.
다음 문자열에서 모든 라틴 문자와
키릴 문자를 교체해 봅시다:
txt = 'x232x 456 xax xтекстx'
res = re.sub('x[\w]*x', '!', txt)
print(res)
코드 실행 결과:
'! 456 ! !'
또한 키릴 문자는 대괄호 안의 그룹 [а-я]을(를) 사용하여
검색할 수 있습니다.
하지만 여기에는 문제가 있습니다 - 여기에는
'ё' 문자가 포함되지 않습니다. 이를 포함하려면
이 문자를 그룹에 추가로 작성해야 합니다:
res = re.sub('x[а-яё]*x', '!', txt)
print(res)
코드 실행 결과:
'! 456 xax !'
주어진 문자열:
txt = 'wйw wяw wёw wqw'
패턴: 양쪽 가장자리에 문자
'w'가 있고, 그 사이에 키릴 문자가 있는 문자열을(를)
찾는 정규식을 작성하세요.
주어진 문자열:
txt = 'ааа ббб ёёё ззз ййй ААА БББ ЁЁЁ ЗЗЗ ЙЙЙ'
패턴: 키릴 문자 임의의 횟수에 따라 모든 단어를 찾는 정규식을 작성하세요.