Команда 'или' в регулярных выражениях Python
Команда '|', которая представляет
собой более мощный вариант 'или'
по сравнению с командой [ ]. Данная команда
позволяет разделить регулярку на несколько
частей. При этом искомое может попасть
либо под одну часть регулярки, либо под
другую. Давайте посмотрим на примерах.
Пример
В данном примере шаблон поиска такой:
три буквы 'a' или три буквы
'b':
txt = 'aaa bbb abb'
res = re.sub('a{3}|b{3}', '!', txt)
print(res)
Результат выполнения кода:
'! ! abb'
Пример
В данном примере шаблон поиска такой:
три буквы 'a' или от 1 и
более букв 'b':
txt = 'aaa bbb bbbb bbbbb axx'
res = re.sub('a{3}|b+', '!', txt)
print(res)
Результат выполнения кода:
'! ! ! ! axx'
Пример
В данном примере шаблон поиска такой: одна или более буквы или три цифры:
txt = 'a ab abc 1 12 123'
res = re.sub('[a-z]+|\d{3}', '!', txt)
print(res)
Результат выполнения кода:
'! ! ! 1 12 !'
Пример
Вертикальная черта может делить регулярку не на две части, а на любое количество частей:
txt = 'aaa bbb ccc ddd'
res = re.sub('a+|b+|c+', '!', txt)
print(res)
Результат выполнения кода:
'! ! ! ddd'
Пример
Если вертикальная черта стоит внутри круглых
скобок, то 'или' работает только
внутри этих скобок.
Для примера давайте найдем строки по
следующему шаблону: в начале стоит или
'a', или 'b' один или более
раз, а потом две буквы 'x':
txt = 'axx bxx bbxx exx'
res = re.sub('(a|b+)xx', '!', txt)
print(res)
Результат выполнения кода:
'! ! ! exx'
Практические задачи
Дана строка:
txt = 'aeeea aeea aea axa axxa axxxa'
Напишите регулярку, которая найдет строки
по шаблону: по краям стоят буквы
'a', а между ними - или буква
'e' любое количество раз или буква
'x' любое количество раз.
Дана строка:
txt = 'aeeea aeea aea axa axxa axxxa'
Напишите регулярку, которая найдет строки
по шаблону: по краям стоят буквы
'a', а между ними - или буква
'e' два раза или буква 'x'
любое количество раз.