imho.ws |
![]() |
![]() |
![]() |
# 1 |
Junior Member
Регистрация: 30.03.2003
Адрес: В избушке на окраине Москвы
Сообщения: 109
![]() |
Массовая обработка html-файлов на сайте
Нужно из html-файла считать строки, заключённые в тэги <title></title> (получим $titletext), <body></body> (получим $bodytext), при этом нужно выбросить все html-тэги и оставить только чистый текст.
Также требуется записать имя обрабатываемого файла в переменную $filename, причём должен сохраняться путь к этому файлу от корня сайта (forum/index.html, например). Предполагается массовая обработка html-файлов на сайте с заходом во все директори и поддиректории, которые есть на сайте. Как это правильно сделать на PHP?
__________________
Kirill |
![]() |
![]() |
# 3 |
::VIP::
Регистрация: 12.10.2003
Пол: Male
Сообщения: 593
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() |
вообще то это смахивает на работы поискового робота и парочкой функции здесь не ограничиться. тут нужен полновесный движок. если есть $, тебе его быстренко создадут, а расскать это не возможно, только так, общие принципы.
__________________
...за пачку печенья и банку варенья... |
![]() |
![]() |
# 4 | |||
::VIP::
Регистрация: 12.11.2002
Адрес: Nicosia, Cyprus
Сообщения: 1 285
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() |
Kirill Mezintsev
Цитата:
Цитата:
или $filename = $_SERVER['SCRIPT_FILENAME']; Цитата:
__________________
"If people only knew how hard I work to gain my mastery, it wouldn't seem so wonderful at all." Michelangelo Buonarroti |
|||
![]() |
![]() |
# 5 |
Junior Member
Регистрация: 13.02.2004
Сообщения: 61
![]() |
//Держи пример
$strin=urlencode($search_w);..преобразование url $fp=fopen("http://www.ru/","r");считывание сайта по инету $content=""; if($fp) { while (!feof ($fp)) { $content.= fgets ($fp, 1024); }//end while fclose($fp); //парсинг .ru $s=ereg('(<title>)(.*)</title>',$content,$regs); $titletext=$regs[2]; и так для остальных
__________________
- здесь была реклама. увижу еще раз - заменю на 6ть баллов. Plague - |
![]() |
![]() |
# 6 |
Junior Member
Регистрация: 30.03.2003
Адрес: В избушке на окраине Москвы
Сообщения: 109
![]() |
esergey
Вот работающая конструкция: PHP код:
На самом деле открывается только один файл index.htm, по сайту скрипт не ходит и не пытается открывать другие файлы. $filename = $_SERVER['PHP_SELF']; - выводит имя php-скрипта, а не открытый для обработки файл. $filename = $_SERVER['SCRIPT_FILENAME']; - аналогично, только путь до имени скрипта включает ещё и вышестоящие директории.
__________________
Kirill Последний раз редактировалось Kirill Mezintsev; 17.02.2004 в 11:22. |
![]() |