Давно искал какой-нибудь класс для пхп, который бы позволял писать быстро и просто html парсеры. Бо писать регулярки муторно, долго и неудобно, а дебажить их вобще сакс. Вот сбылась моя мечта :) Наткнулся на замечательный класс PHP Simple HTML DOM Parser. Вот офф сайтик . С ним парсить страницы одно удовольствие. Это осуществляется по моделе DOM. Собственно синтаксис команд аналогичен командам JavaScript фрамеворка jQuery для поиска DOM объектов на странице, что несомненно, большой плюс (не надо сильно читать маны, просто достаточно быстро просмотреть примеры).

Самый простой вызов можно оформить вроде этого:

include_once("simple_html_dom.php");

$temp = file_get_html("http://formata.net/");
$text = $temp -> find('div[id=text]');
foreach($text as $tmp) print($tmp->outertext);

Код вывидит тег

и все, что лежит в нем.

Вобщем всем рекомендую, кому надо парсить чего то вроде html :) Я до этого пробовал дефолтные функции DOM из php v5, но чет парсер с html плохо дружил, для парсинга rss он хорошо подходил, а тут не в какую.

Скачать можно тут или на офф сайте.