Библиотеки для парсинга на PHP

Парсинг регулярками не очень удобный из-за того, что для получения данных тегов приходится писать разные неочевидные команды. Это замедляет работу и подвергает наш код ошибкам.

Более удобным является получение элементов страницы через CSS селекторы. Для этого в PHP существуют различные библиотеки, поддерживаемые энтузиастами.

Вот список библиотек, популярных в настоящее время: DiDOM, Nokogiri, DomCrawler, Simple HTML DOM, Zend Dom.

В целом, все эти библиотеки обладают похожими возможностями. Для работы достаточно знать одну из библиотек. Поэтому далее в учебнике мы изучим одну из них. Мой выбор пал на DiDOM, так как мне она показалась наиболее простой для понимания и удобства.

В дальнейшем можете посмотртеть возможности и других библиотеки из списка и подобрать библиотеку по своему вкусу.