Handledning i parsing med PHP
Grundläggande
Introduktion till parsing
Begränsningar i PHP
Tidsgräns för exekvering
Minnesgräns
Ignorera avbrott från webbläsaren
Placering av parser
Förberedande manipulationer
Reguljära uttryck
Introduktion
Parsning av rader med radbrytningar
Parsning av rysk text
Parsning av enkla taggar
Parsning av taggar med attribut
Parsning av upprepande taggar
Parsning av taggblock
Tvåstegsparsning av block
Problemet med mellanslag i attribut
Problemet med citattecken i attribut
Problemet med taggnamn
Förreningstextning av text
Rensning av data vid parsning
Problem med parsning med reguljära uttryck
Praktik i parsning med reguljära uttryck
Bibliotek
DiDom-biblioteket
Installation
Analysera text från variabel
Analysera text från URL
Första elementets text
Elementets HTML-kod
Elementets inre HTML-kod
CSS-selektorer
Taggars attribut
Sökning inom element
Elementarray
Attribut för elementarray
Dokumentation
Praktik
Sökvägar
Normalisering av absoluta sökvägar
Normalisering av relativa sökvägar
Normalisering av förskjutna sökvägar
Universell sökvägsnormalisering
Länkar till externa webbplatser
Teckenkodningar
Metoder
Funktion för att hämta sida
Funktion för att hämta länkar
Parsning via länkar
Stegvis parsningsmetod
Spindelmetod på array
Spindelmetod på databas
Spindelmetod med bortfall
Parsning baserad på sitemap.xml
Filer
Parsning av filer
Parsning av bilder
Parsning av CSS-filer
Parsning av JavaScript-filer
Parsning av ljudfiler
Parsning av videofiler
Formulär
Skicka formulär med GET-metoden
Skicka formulär med POST-metoden
Fallgropar vid formulärutsändning
Automatisk auktorisering
Captcha
Automatisering
Loggar vid parsing
Cache vid parsing
Sparning vid avbrott
Schemalagd start i webbläsare
Schemalagd start på webbhotell
Kringgå skydd
Kringgå skydd mot parsing
Fördröjningar vid parsing
Att byta IP-adress hemma
Att byta IP-adress vid parsing
Kakor (cookies) vid parsing
HTTP-huvuden vid parsing
USERAGENT vid parsing
Webbplatsens mobilversion
Använda API