Bibliothèques pour le parsing en PHP
Le parsing avec des expressions régulières n'est pas très pratique car pour obtenir les données des balises, il faut écrire différentes commandes peu évidentes. Cela ralentit le travail et expose notre code à des erreurs.
Une méthode plus pratique consiste à obtenir les éléments de la page via des sélecteurs CSS. Pour cela, il existe en PHP diverses bibliothèques, maintenues par des passionnés.
Voici une liste de bibliothèques populaires actuellement : DiDOM, Nokogiri, DomCrawler, Simple HTML DOM, Zend Dom.
En général, toutes ces bibliothèques possèdent des fonctionnalités similaires. Pour travailler, il suffit de connaître l'une d'entre elles. C'est pourquoi ensuite dans le tutoriel nous en étudierons une. Mon choix s'est porté sur DiDOM, car elle m'a semblé être la plus simple à comprendre et la plus pratique.
Par la suite, vous pourrez examiner les possibilités des autres bibliothèques de la liste et choisir une bibliothèque selon vos préférences.