![]() |
Требуется совет по парсингу на PHP
Уважаемые, есть проблема.
Нужно проверить, есть ли на чужой странице моя полноценная рабочая ссылка, т. е. не просто есть ли http://mydomain.com, а чтобы он был в тегах A HREF. При этом может быть или не быть приписано www, как http://www.mydomain.com, еще это может быть записано большими / маленькими буквами, еще люди по-разному используют кавычки и апострофы или их не используют в этом теге. Плюс могут быть лишние пробелы. Страницу получаю с помощью CURL, а парсить уже убился. В общем, помогите кто может выпарсить рабочий линк. Спасибо. |
попробуй: http://ru.php.net/preg_match_all
|
да я думаю стоит глянуть в сторону регулярынх выражений.
is_absent, просто человек просит наглядных примеров. А я в регулярных не силен. |
preg_match_all('/<a.*href=[\'"]?(.*)\b/', $subject, $result);
по идее должно помочь |
Цитата:
Цитата:
foreach ($result as $val) но я что-то туплю... |
прошу прощения.. немножко неверное регулярное выражение..
так должно быть лучше: PHP код:
|
Цитата:
$subject делаю так: $subject='text1: <a href="www.abc.com">abc.com</a> text2'; Финиш вроде близко... Спасибо P.S. C $url = $match[0]; вроде бы дает в $url линк. Чтоли все работает? P.P.S. Нет, не все :( Если ссылок больше 1, то никак. |
так. давно не писал :)
нужно или preg_match_all($regexp, $subject, $result, PREG_SET_ORDER); или foreach ($result[1] as $url) |
Ура, заработало (с) Денвер.
Цитата:
|
| Часовой пояс GMT +4, время: 02:47. |
Powered by vBulletin® Version 3.8.5
Copyright ©2000 - 2026, Jelsoft Enterprises Ltd.