Tutorial i parsing med PHP
Grunnleggende
Innføring i parsing
Begrensninger i PHP
Tidsbegrensning for utførelse
Minnebegrensning
Ignorere nettleseravbrudd
Plassering av parser
Forberedende manipulasjoner
Regulære uttrykk
Introduksjon
Analysering av linjer med linjebryting
Analysering av russisk tekst
Analysering av enkle tagger
Analysering av tagger med attributter
Analysering av repeterende tagger
Analysering av tekstblokker
To-trinns analysering av blokker
Problemet med mellomrom i attributter
Problemet med anførselstegn i attributter
Problemet med taggnavn
Forhåndsrensning av tekst
Rensking av data under analysering
Problemer med analysering ved hjelp av regulære uttrykk
Praksis i analysering med regulære uttrykk
Biblioteker
DiDom-biblioteket
Installasjon
Analysere tekst fra variabel
Analysere tekst fra URL
Første elementets tekst
HTML-kode for element
Indre HTML-kode for element
CSS-selectorer
Tag-attributter
Søk inni elementer
Elementmatrise
Attributter for elementmatrise
Dokumentasjon
Praksis
Stier
Normalisering av absolutte stier
Normalisering av relative stier
Normalisering av forskyvde stier
Universell stinormalisering
Lenker til andre nettsteder
Kodinger
Metoder
Funksjon for å hente side
Funksjon for å hente lenker
Parsing via lenker
Trinnvis parsingsmetode
Edderkoppmetode på array
Edderkoppmetode på database
Edderkoppmetode med utsifting
Parsing basert på sitemap.xml
Filer
Analysering av filer
Analysering av bilder
Analysering av CSS-filer
Analysering av JavaScript-filer
Analysering av lydfiler
Analysering av videofiler
Skjemaer
Å sende skjemaer med GET-metoden
Å sende skjemaer med POST-metoden
Uforutsette problemer ved utsending av skjemaer
Automatisk autorisasjon
Captcha
Automasjon
Logger ved parsing
Cache ved parsing
Lagring ved avbrudd
Planlagt oppstart i nettleser
Planlagt oppstart på hosting
Om å omgå beskyttelse
Å omgå beskyttelse mot parsing
Forsinkelser ved parsing
Å endre IP-adresse hjemme
IP-endring ved parsing
Informasjonskapsler ved parsing
HTTP-headere ved parsing
USERAGENT ved parsing
Mobilversjonen av nettstedet
Bruk av API