Bindestreck inom uppsättningar i Pythons reguljära uttryck
Bindestreck är också ett specialtecken inom [ ]
(men utanför - inte). Om du behöver själva
bindestrecket som ett tecken - placera det där
det inte kommer att uppfattas som en avgränsare
för en grupp.
Varför detta är viktigt: du kan skapa en grupp
av tecken utan att märka det. Till exempel,
så här - '[:-@]' - du tror att du
väljer kolon, bindestreck och snabel-a, men
i verkligheten blir det en grupp tecken mellan
: och @. Denna grupp inkluderar
följande tecken: ? < = > :
Var kommer de ifrån? Från ASCII-tabellen - kolon har ett lägre nummer än snabel-a - och det blir en grupp. Det vill säga, alla grupper skapas enligt ASCII-tabellen (om så önskas kan man använda detta).
Hur man hanterar detta: placera bindestreckstecknet
där det definitivt inte kommer att uppfattas
som ett grupptecken, till exempel i början eller
i slutet (det vill säga efter [ eller före
]).
Man kan också escapea bindestrecket - då
kommer det att representera sig själv oavsett
position. Till exempel, istället för [:-@]
skriva [:\-@] - och då finns det ingen
grupp längre, utan det blir tre tecken - kolon,
bindestreck och snabel-a @.
Exempel
I följande exempel är sökmönstret så här:
siffra 1, sedan bokstav från 'a'
till 'z', sedan siffra 2:
txt = '1a2 1-2 1c2 1z2'
res = re.sub('1[a-z]2', '!', txt)
print(res)
Resultat av kodkörning:
'! 1-2 ! !'
Exempel
Låt oss nu escapea bindestrecket. Som
resultat blir sökmönstret så här: siffra
1, sedan bokstaven 'a', eller
bindestreck, eller bokstaven 'z', sedan siffra
2:
txt = '1a2 1-2 1c2 1z2'
res = re.sub('1[a\-z]2', '!', txt)
print(res)
Resultat av kodkörning:
'! ! 1c2 !'
Exempel
Man kan helt enkelt flytta om bindestrecket utan att escapea det:
txt = '1a2 1-2 1c2 1z2'
res = re.sub('1[az-]2', '!', txt)
print(res)
Resultat av kodkörning:
'! ! 1c2 !'
Exempel
I följande exempel är sökmönstret så här:
det första tecknet är små bokstäver eller
bindestreck '-', sedan två bokstäver
'x':
txt = 'axx Axx -xx @xx'
res = re.sub('[a-z-]xx', '!', txt)
print(res)
Resultat av kodkörning:
'! Axx ! @xx'
Exempel
I följande exempel är sökmönstret så här:
det första tecknet är små eller stora
bokstäver eller bindestreck '-', sedan två bokstäver
'x':
txt = 'axx Axx -xx @xx'
res = re.sub('[a-zA-Z-]xx', '!', txt)
print(res)
Resultat av kodkörning:
'! ! ! @xx'
Exempel
Man kan placera bindestrecket mellan två grupper - där kommer det definitivt inte att skapa en ytterligare grupp:
txt = 'axx 9xx -xx @xx'
res = re.sub('[a-z-0-9]xx', '!', txt)
print(res)
Resultat av kodkörning:
'! ! ! @xx'
Praktiska uppgifter
Given en sträng:
txt = 'xaz xBz xcz x-z x@z'
Hitta alla strängar enligt följande mönster:
bokstaven 'x', stor eller liten
bokstav eller bindestreck, bokstaven 'z'.
Given en sträng:
txt = 'xaz x$z x-z xcz x+z x%z x*z'
Hitta alla strängar enligt följande mönster:
bokstaven 'x', sedan antingen dollar,
bindestreck eller plus, sedan bokstaven 'z'.