IMHO.WS

IMHO.WS (https://www.imho.ws/index.php)
-   Веб-программирование (https://www.imho.ws/forumdisplay.php?f=29)
-   -   Дорвеи. (https://www.imho.ws/showthread.php?t=95635)

Frenzy_lost 10.11.2005 01:57

Дорвеи.
 
Дорвеи.

Кто нибудь занимается? Если да, то не поленитесь, подскажите пионеру.

Вобщем создал скрипт.

0. Общие
- Хтмл страницы через модреврайт все идут на один файл, а он уже распоряжается их содержимым.
- ссылки вида key-keyword.html создаются путем транслитерования кейвордов!
- ссылки на другие доры справа в блоке "друзья"
- рандомно выбирается кол-во новостей, параграфов, ссылок в меню и друзей
- или ссылка ведет на другую страницу, или на партнерку. рандом. Хотя
это и не важно. все равно через яваскрипт редиректит.

1. Инсталлятор.

- получает кучу ключевых слов\фраз, и выбирает заданное кол-во слов.
- получает шаблоны для параграфов
- получает теги для ключевых слов
- списки друзей
- списки горизонтальных и вертикальных разделителей
- разные файлы ключевых слов эротика, секс, и т.п. выбираются в конф. файле.

- имеется куча заранее заготовленных шаблонов текста, в них вставляются
ключевые и создаются НОВОСТИ. В НОВОСТИ есть ссылки.

- из ключевых и разделителей создаются ПАРАГРАФЫ, в них нет ссылок - просто ключевые слова.

2. Фичи.

- время создания страницы
- счетчик посещений каждой паги.

3. Нету пока.

- импорт новостей с какого нить новостного сайта серверным скрпитом.
- при малой посещаемости пага давится.



Создаю дор не очень быстро. Запускаю на локалхосте инсталлятор, затем
программой Teleport Pro копирую то что получается. Причем т.к. кол-во
кейвордов ограничено, то получаются полностью рабочие перекрестные
ссылки.

Если хостинг с рнр, то просто заливаю и все прекрасно.

Заранее Сорри за непонятность изложения.


Вопросы.

1. Жизнеспособна ли такая сеть доров?
2. Дорвейщики, что используете вы, давайте меняться опытом?
3. Такой скрипт можно продать? Если да то за сколько?

helldomain 12.12.2005 12:46

Kak pokaziwaet moi opit, slowa nado brat s overture ;-). Soft dlya podobnih weschei ispolzuju swoi samopisnij. PHP ne ispolzuetsya kategoricheski, ibo gugla ne liubit saitow w kotorih yawno widen php. Statistika pokaziwaet, chto iz 500 dorweew probiwaetsya k mestu pod solncem w srednem 1.

Frenzy_lost 12.12.2005 17:23

Ха,ну кроме овертюры есть ее вордтрекер к примеру... ну а вообще я беру
не с овертюры, а с другого сервиса, который и биды сразу показывает.
А он наверное с овертюры :)

Софт? Что именно ты используешь? доргены спамилки, все вместе?... И на
чем написано?? Или ты имеешь в виду серверные настройки?

А вот про РНР ты загнул.. как это определить где используется РНР?
modrewrite тебе и .shtml прикрутит :)

число 500\1 это неверно помоему. если на поток ставит ьто может так и
будет...

apoc 15.12.2005 18:04

Цитата:

Сообщение от Frenzy_lost
А вот про РНР ты загнул.. как это определить где используется РНР?
modrewrite тебе и .shtml прикрутит :)

Google определяет такие дорвеи, уж как... да скорее всего по заголовкам которые твой скрипт возвращает... видать чувствует :) Но лично мной проверено, статические страницы лучше берет чем динамические, несмотря на то что установлены заголовки, установлены даты правильно, размер... ан нет, как то замечает :)

кстати я тут немножко опыты провел, так вот:

X-Powered-By: PHP/4.3.11 - этот заголовок вполне может говорить гуглу о том что страницы сгенерирована PHP-шником... а еще, может ты и не задумывался, но гугл может пытаться во время загрузки страницы проверить ее на докачку :) как вы думаете поймет он что страницы динамическая? :) думаю, да... так что ВЫВОД: статика лучше... хоть и не гибко все это, зато надежно

Hubbitus 15.12.2005 21:36

Ну про индексацию Гуглом я ничего говорить не буду - к SEO-специалитстом себя не отношу, а по технической стороне вставлю свои пять копеек:
Цитата:

apoc:
X-Powered-By: PHP/4.3.11
Легко отключается в конфиге.
Цитата:

apoc:
но гугл может пытаться во время загрузки страницы проверить ее на докачку
Думаю нет, а с чего бы? Ну что сгенерированную он докачает, что статиченскую, какая разница?

apoc 16.12.2005 10:30

Цитата:

Hubbitus:
Легко отключается в конфиге
Это если есть доступ к серверным настройкам? или можна и прямо из скрипта?

Цитата:

Hubbitus:
Ну что сгенерированную он докачает, что статиченскую, какая разница?
В том что при докачке гугл может запросить документ скажем так:
Код:

Range: bytes=18912-
на что скрипт, если в нем не предусмотрен перехват и обработка такого хидера, просто начнет выдавать документ с "нуля". Конечно это еще не 100%-ая уверенность в том что это динамический документ... но на сегодня с уверенностью на 95 процентов это так... :) так что если кто пишет нечто похожее, учтите такую вещь.

Hubbitus 16.12.2005 12:11

Цитата:

apoc:
Это если есть доступ к серверным настройкам? или можна и прямо из скрипта?
Из скрипта нельзя, параметр определяться может только в php.ini http://php.rinet.ru/manual/ru/ini.co...ini.expose-php НО, на большинстве хостингов можно использовать на выбор ПХП как модуль Апача, или ПХП как CGI, соответственно во вотором случае получаем свой php.ini - таким образом настройка доступна вобщем-то пользователям.

А по второму - разве Апач сам не выдаст нужную часть? Честно если, то не уверен, но мне почему-то так казалось :) , в любом случае, если надо, это не сложно предусмотреть и самому, если есть необходимость. Да и сомневаюсь я что Гугл на подобное ориентируется.

apoc 16.12.2005 12:18

Цитата:

Hubbitus:
на большинстве хостингов можно использовать на выбор ПХП как модуль Апача, или ПХП как CGI,
Буквально на прошлой неделе хостер перевел мой сервак на CGI... это уже второй мой сервак, который перевели... тенденция...
насчет php.ini - прав! :) соглашусь!!! это есть
Цитата:

Hubbitus:
по второму - разве Апач сам не выдаст нужную часть?
это уже даже не смешно... :( но острить не буду... :( никогда в жизни апач не формровал заголовки для докачек динамических скриптов... он незнает о длине твоего файла он просто отдает его в поток... а файлы которые статически лежат, они для него ведомы, он знает их длину и ему не составляет труда поддерживать докачку.

Что касается гугла, то никто кроме гугла не знает на 100 как он работает.
Все строят догадки на собственном опыте, и мой опыт мне посказал, что однажды переведя свой движок на возможность докачки, я заметил, что спайдер задерживался на сайте дольше и брал больше страниц... так что каждому решать самому, лучше не слушайте моих советов, т.к. конкуренция... делайте как делали, а я лучше буду делать как делал :))))
мне же в итоге и тем кто понял лучше

Hubbitus 16.12.2005 12:54

Цитата:

apoc:
это уже даже не смешно... :( но острить не буду... :( никогда в жизни апач не формровал заголовки для докачек динамических скриптов... он незнает о длине твоего файла он просто отдает его в поток... а файлы которые статически лежат, они для него ведомы, он знает их длину и ему не составляет труда поддерживать докачку.
А разве кто-то смеется??

По Вашему утверждению о том что Апач не знает размера выдаваемого документа, как же он тогда выдает для документа заголовок Content-Length???? Да и потом, Апач какраз не так работает, ПХП он пропускает через интерпретатор ПХП и потом выдает результат, как ту же статику!

Кстати, наблюдения за Гуглом конечно хорошо, но зачем же так тыкать носом других, утверждая то о чем, видимо, не знаете (никого не хочу обидеть)?

Итак, провел простенький эксперимент, кто хочет, может проверить:

Создал файл t.php с единственным содержанием <? echo '123456789' ?>

Запросил его по телнету - нормально, получил 200 ответ сервера, Content-Length = 9 и, как ожидалось 123456789 в теле ответа.

Далее, запросил то же самое, указав еще и заголовок Range 3-
В итоге, получил нормальный ответ 206 Partial Content, Content-Length = 6 и на выходе 456789. Таким образом, могу утверждать что Апач таки нормально обрабатывает неполняй контент, даже в случае ПХП (что и следовало вобщем-то ожидать).

Так что поведение Гугла, в описанном далее Вами случае скорее совпадение, или реакция на что-то другое.

P.S. _Никаких_ специальных настроек не производилось, обычный Апач, что стоял на сервере - 2.0.53, обычный ПХП (5.0.4).

apoc 16.12.2005 13:07

Цитата:

Hubbitus:
как же он тогда выдает для документа заголовок Content-Length
Никак... можете поэкспериментировать здесь:
вот запрос на докачку: Range: bytes=5299-
вот ответ: HTTP/1.0 200 OK

можно это проверить здесь:
http://triada.com.ua/ru/main/main.print
( это если кто-то сомневается ;) )
никакой токачки, все с нуля...

насчет того что тут длина установлена, так это движок устанавливает...

насчет гугла...я уже говорил :)

Hubbitus 16.12.2005 14:38

Цитата:

apoc:
Никак... можете поэкспериментировать здесь:
вот запрос на докачку: Range: bytes=5299-
вот ответ: HTTP/1.0 200 OK
Ну незнаю, либо сервер неправильно настроен, либо, сейчас еще пришла догадка - старый Апач (там 1.3) не может этого делать...

Сейчас еще раз проверил, все работает у меня прекрасно, вот тот файлик, можете сами проверить http://o-range.ru/t.php все выдается влет, нормально, сразу 206...

Ах, да. И используйте все-таки HTTP 1.1 - не у всех же есть деньги чтобы ставить сервер на домен - хост-байсед на моих серваках, тоесть заголовок Host необходим.

apoc 16.12.2005 14:49

вот что я получил:
Fri Dec 16 12:47:42 2005 Соединение установлено
Fri Dec 16 12:47:42 2005 GET http://o-range.ru/t.php HTTP/1.1
Fri Dec 16 12:47:42 2005 Host: o-range.ru
Fri Dec 16 12:47:42 2005 Accept: */*
Fri Dec 16 12:47:42 2005 Referer: http://o-range.ru
Fri Dec 16 12:47:42 2005 User-Agent: Mozilla/4.0 (compatible; MSIE 5.00; Windows 98)
Fri Dec 16 12:47:42 2005 Pragma: no-cache
Fri Dec 16 12:47:42 2005 Cache-Control: no-cache
Fri Dec 16 12:47:42 2005 Connection: close
Fri Dec 16 12:47:43 2005 HTTP/1.0 200 OK
Fri Dec 16 12:47:43 2005 Date: Fri, 16 Dec 2005 10:49:45 GMT
Fri Dec 16 12:47:43 2005 Server: Apache
Fri Dec 16 12:47:43 2005 Content-Type: text/html; charset=WINDOWS-1251
Fri Dec 16 12:47:43 2005 Размер файла неизвестен

не понял, что значит "заголовок Host необходим" где его нужно добавить?

Hubbitus 16.12.2005 15:19

Странный какой-то лог если честно.
Вот, попробовал еще несколько раз, как с минимальным количеством заголовков, так и со Всеми приведенными у тебя (не могу понять нафига столько нужно было для теста типа реферера, агента и т.д...) чтобы не говорили потом, также попробовал с этими же заголовками и с Range... Ах да, чтобы опять же, исключить случайность - попробовал с разных мест, с разных серверов, вот два файла, во всех случаях все выдалось нормально как и должно - с длиной документа, и с 206 заголовком, там где часть запрашивалась:
http://o-range.ru/telnet.log
http://o-range.ru/telnet2.log

apoc 16.12.2005 15:27

Я согласен что лог странный... потому как того что было сказано о длине я не увидел... лог этот из качалки, флешгетовской, но это неважно, она докачку поддерживает.
Короче думаю что пленум пора завязывать :) т.к. ничего нового мы не узнаем в результате этого спора. Почему у тебя есть заголовки а у меня нету... я незнаю :( возможно прокси, хотя, если же я формирую в движке длину контент-ленгз... то он же есть... :( странно, очень странно...

Sheryld 29.12.2005 14:36

А текст получается осмысленный или белиберда с ключевиками?

Frenzy_lost 29.12.2005 23:29

Это мне вопрос? Не белиберда. А осмысленный текст разбавленный ключевиками :))

Если ты про цепи маркова - то такое я не юзаю.

Sheryld 29.12.2005 23:47

т.е. ты заранее под ключевики делаешь текст? ведь не в любой текст вставишь скажем, «сотовые телефоны»?


Часовой пояс GMT +4, время: 04:54.

Powered by vBulletin® Version 3.8.5
Copyright ©2000 - 2026, Jelsoft Enterprises Ltd.