![]() |
Массовая обработка html-файлов на сайте
Нужно из html-файла считать строки, заключённые в тэги <title></title> (получим $titletext), <body></body> (получим $bodytext), при этом нужно выбросить все html-тэги и оставить только чистый текст.
Также требуется записать имя обрабатываемого файла в переменную $filename, причём должен сохраняться путь к этому файлу от корня сайта (forum/index.html, например). Предполагается массовая обработка html-файлов на сайте с заходом во все директори и поддиректории, которые есть на сайте. Как это правильно сделать на PHP? |
Зайди в раздел eBooks и попроси книгу по PHP.
|
вообще то это смахивает на работы поискового робота и парочкой функции здесь не ограничиться. тут нужен полновесный движок. если есть $, тебе его быстренко создадут, а расскать это не возможно, только так, общие принципы.
|
Kirill Mezintsev
Цитата:
Цитата:
или $filename = $_SERVER['SCRIPT_FILENAME']; Цитата:
|
//Держи пример
$strin=urlencode($search_w);..преобразование url $fp=fopen("http://www.ru/","r");считывание сайта по инету $content=""; if($fp) { while (!feof ($fp)) { $content.= fgets ($fp, 1024); }//end while fclose($fp); //парсинг .ru $s=ereg('(<title>)(.*)</title>',$content,$regs); $titletext=$regs[2]; и так для остальных |
esergey
Вот работающая конструкция: PHP код:
На самом деле открывается только один файл index.htm, по сайту скрипт не ходит и не пытается открывать другие файлы. $filename = $_SERVER['PHP_SELF']; - выводит имя php-скрипта, а не открытый для обработки файл. $filename = $_SERVER['SCRIPT_FILENAME']; - аналогично, только путь до имени скрипта включает ещё и вышестоящие директории. |
Часовой пояс GMT +4, время: 20:07. |
Powered by vBulletin® Version 3.8.5
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.