PHP Simple HTML DOM Parser или jQuery на php
Автор: SysaninНоя 8
Давно искал какой-нибудь класс для пхп, который бы позволял писать быстро и просто html парсеры. Бо писать регулярки муторно, долго и неудобно, а дебажить их вобще сакс. Вот сбылась моя мечта
Наткнулся на замечательный класс PHP Simple HTML DOM Parser. Вот офф сайтик . С ним парсить страницы одно удовольствие. Это осуществляется по моделе DOM. Собственно синтаксис команд аналогичен командам JavaScript фрамеворка jQuery для поиска DOM объектов на странице, что несомненно, большой плюс (не надо сильно читать маны, просто достаточно быстро просмотреть примеры).
Самый простой вызов можно оформить вроде этого:
$temp = file_get_html("http://formata.net/");
$text = $temp -> find('div[id=text]');
foreach($text as $tmp) print($tmp->outertext);
Код вывидит тег
Вобщем всем рекомендую, кому надо парсить чего то вроде html
Я до этого пробовал дефолтные функции DOM из php v5, но чет парсер с html плохо дружил, для парсинга rss он хорошо подходил, а тут не в какую.
Скачать можно тут или на офф сайте.
5 коммент.
Пишет Wet | дата: 12 декабря 2008 в 14:14
Больно уж медленный. Для задач, где ожидаются высокие нагрузки, использовать этот класс не рекомендуется.
Пишет Sysanin | дата: 12 декабря 2008 в 14:46
ну да, скорость не ахти, чем-то приходиться жертвовать удобству использования. Так же как и регулярки нагружают по сильнее, чем обычные строковые функции.
Пишет Artem | дата: 25 февраля 2009 в 22:43
Расскажите побольше про написание скриптов под Simple HTML DOM Parser
Есть уже 11-я версия этого скрипта. Больше интересует парсить сайты с генерацией и распознованием ссылок (категорий — товаров или что то вроде)…. Спасибо
Пишет Sysanin | дата: 26 февраля 2009 в 15:47
спасибо за версию.
не совсем понял про что вы, как я понимаю показать на примере парсинг какой-нибудь категории в инет магазине? Дума сегодня что-нибудь напишу, в качестве примера.
Пишет Пример работы с PHP Simple HTML DOM Parser | Формата.нет | дата: 28 февраля 2009 в 22:06
[...] в комментариях поста, где я рассказывал про PHP Simple HTML DOM Parser, написать более [...]