파이썬 정규 표현식에서 세트 내부의 하이픈
하이픈도 [ ] 내부에서는 특수 문자입니다
(그러나 외부에서는 아닙니다). 하이픈 자체를 문자로 필요로 한다면, 하이픈이 그룹 구분자로 인식되지 않는 위치에 놓아야 합니다.
이것이 중요한 이유: 당신도 모르게 문자 그룹을 만들 수 있습니다. 예를 들어, '[:-@]' - 당신은 콜론, 하이픈, 앳 기호(@)를 선택한다고 생각하지만, 실제로는 :와 @ 사이의 문자 그룹이 됩니다. 이 그룹에는 다음 문자들이 포함됩니다: ? < = > :
이것들은 어디서 왔을까요? ASCII 테이블에서 - 콜론은 앳 기호(@)보다 번호가 낮습니다 - 그래서 그룹이 만들어집니다. 즉, 모든 그룹은 ASCII 테이블에 따라 생성됩니다 (원한다면 이를 활용할 수 있습니다).
이 문제를 해결하는 방법: 하이픈이 그룹 문자로 확실히 인식되지 않을 위치, 예를 들어 시작이나 끝(즉, [ 뒤나 ] 앞)에 하이픈을 배치하세요.
하이픈을 이스케이프 처리할 수도 있습니다 - 그러면 위치에 관계없이 하이픈 자체를 나타냅니다. 예를 들어, [:-@] 대신 [:\-@]를 쓰면 - 그룹이 생기지 않고, 세 문자 - 콜론, 하이픈, 앳 기호 @가 됩니다.
예제
다음 예제에서 검색 패턴은 다음과 같습니다:
숫자 1, 그 다음 'a'부터 'z'까지의 문자, 그 다음 숫자 2:
txt = '1a2 1-2 1c2 1z2'
res = re.sub('1[a-z]2', '!', txt)
print(res)
코드 실행 결과:
'! 1-2 ! !'
예제
이제 하이픈을 이스케이프 해 봅시다.
결과적으로 검색 패턴은 다음과 같습니다: 숫자
1, 그 다음 문자 'a', 또는
하이픈, 또는 문자 'z', 그 다음 숫자
2:
txt = '1a2 1-2 1c2 1z2'
res = re.sub('1[a\-z]2', '!', txt)
print(res)
코드 실행 결과:
'! ! 1c2 !'
예제
이스케이프하지 않고 하이픈의 위치만 바꿀 수도 있습니다:
txt = '1a2 1-2 1c2 1z2'
res = re.sub('1[az-]2', '!', txt)
print(res)
코드 실행 결과:
'! ! 1c2 !'
예제
다음 예제에서 검색 패턴은 다음과 같습니다:
첫 번째 문자는 소문자 또는
하이픈 '-', 그 다음 두 글자는
'x':
txt = 'axx Axx -xx @xx'
res = re.sub('[a-z-]xx', '!', txt)
print(res)
코드 실행 결과:
'! Axx ! @xx'
예제
다음 예제에서 검색 패턴은 다음과 같습니다:
첫 번째 문자는 소문자, 대문자
또는 하이픈 '-', 그 다음 두 글자는
'x':
txt = 'axx Axx -xx @xx'
res = re.sub('[a-zA-Z-]xx', '!', txt)
print(res)
코드 실행 결과:
'! ! ! @xx'
예제
하이픈을 두 그룹 사이에 놓을 수도 있습니다 - 거기서는 확실히 또 다른 그룹을 만들지 않습니다:
txt = 'axx 9xx -xx @xx'
res = re.sub('[a-z-0-9]xx', '!', txt)
print(res)
코드 실행 결과:
'! ! ! @xx'
실습 문제
다음 문자열이 주어집니다:
txt = 'xaz xBz xcz x-z x@z'
다음 패턴에 맞는 모든 문자열을 찾으세요:
문자 'x', 대문자 또는 소문자
또는 하이픈, 문자 'z'.
다음 문자열이 주어집니다:
txt = 'xaz x$z x-z xcz x+z x%z x*z'
다음 패턴에 맞는 모든 문자열을 찾으세요:
문자 'x', 그 다음 달러 표시, 또는
하이픈 또는 더하기 기호, 그 다음 문자 'z'.