Handledning i parsing med PHP

Grundläggande

Introduktion till parsing Begränsningar i PHP Tidsgräns för exekvering Minnesgräns Ignorera avbrott från webbläsaren Placering av parser Förberedande manipulationer

Reguljära uttryck

Introduktion Parsning av rader med radbrytningar Parsning av rysk text Parsning av enkla taggar Parsning av taggar med attribut Parsning av upprepande taggar Parsning av taggblock Tvåstegsparsning av block Problemet med mellanslag i attribut Problemet med citattecken i attribut Problemet med taggnamn Förreningstextning av text Rensning av data vid parsning Problem med parsning med reguljära uttryck Praktik i parsning med reguljära uttryck

Bibliotek

Lista över bibliotek

DiDom-biblioteket

Installation Analysera text från variabel Analysera text från URL Första elementets text Elementets HTML-kod Elementets inre HTML-kod CSS-selektorer Taggars attribut Sökning inom element Elementarray Attribut för elementarray Dokumentation Praktik

Sökvägar

Normalisering av absoluta sökvägar Normalisering av relativa sökvägar Normalisering av förskjutna sökvägar Universell sökvägsnormalisering Länkar till externa webbplatser

Teckenkodningar

Hämta sidans teckenkodning Normalisering av teckenkodning

Metoder

Funktion för att hämta sida Funktion för att hämta länkar Parsning via länkar Stegvis parsningsmetod Spindelmetod på array Spindelmetod på databas Spindelmetod med bortfall Parsning baserad på sitemap.xml

Filer

Parsning av filer Parsning av bilder Parsning av CSS-filer Parsning av JavaScript-filer Parsning av ljudfiler Parsning av videofiler

Formulär

Skicka formulär med GET-metoden Skicka formulär med POST-metoden Fallgropar vid formulärutsändning Automatisk auktorisering

Captcha

Introduktion Hur captcha fungerar Kringgå captcha Tjänster för igenkänning

Automatisering

Loggar vid parsing Cache vid parsing Sparning vid avbrott Schemalagd start i webbläsare Schemalagd start på webbhotell

Kringgå skydd

Kringgå skydd mot parsing Fördröjningar vid parsing Att byta IP-adress hemma Att byta IP-adress vid parsing Kakor (cookies) vid parsing HTTP-huvuden vid parsing USERAGENT vid parsing Webbplatsens mobilversion Använda API

Dynamiskt innehåll

Problem Parsning av AJAX

Praxis

Startpraxis Praxis på autopostning Slutpraxis
Svenska
AzərbaycanБългарскиবাংলাБеларускаяČeštinaDanskDeutschΕλληνικάEnglishEspañolEestiSuomiFrançaisहिन्दीMagyarՀայերենIndonesiaItalianoქართულიҚазақLietuviųLatviešuМакедонскиMelayuNederlandsNorskPolskiPortuguêsRomânăРусскийSlovenčinaSlovenščinaShqipKiswahiliTürkçeЎзбекOʻzbek
Vi använder kakor för webbplatsens funktion, analys och personalisering. Behandling av data sker i enlighet med Integritetspolicyn.
acceptera alla anpassa avvisa