Надежная идентификация поисковых систем
Может кто знает, как можно программно на сервере относительно точно идентифицировать поисковую систему, зашедшую на сайт.
Первичную информацию можно конечно получить из USER_AGENT, но я подозреваю, что для некоторых роботов он не заполняется. Может по IP адресу можно как-то дополнительно отлеживать? Никто не сталкивался с такой проблемой? Буду благодарен за советы. :) |
|
Можно записывать IP тех, кто заглядывает в Robots.txt :)
|
Для поисковых роботов достаточно USER_AGENT
|
Действительно, можно что-то типа влепить
Код:
RewriteEngine on |
Цитата:
|
Как вариант для роботов не читающих роботс.txt - сделать на сайте скрытую ссылку на файл, запрещенный в роботс.txt. Кто зайдет - плохой робот! :D
|
Вложений: 1
Вот файлик с собранными идентификаторами ботов. Собирался для vbulletin. Может найдете в нем, что-нить интересного
|
Хлам этот файлик, 90% этих роботов заходят на сайт раз в год.
Активны только 7 ботов - Я,Г,Рам,Гога,Лайф,Служебный Микрософта, ПСбот и Яху.. остальные генерят в сотни раз меньший траф |
Какой у gogo юзер агент или он роботом mail.ru заходит?
Что такое Лайф? liveinternet? Ве-бальта, я так понял, умерла? |
Часовой пояс GMT +3, время: 08:50. |
Работает на vBulletin® версия 3.8.7.
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Перевод: zCarot
SAPE.RU — система купли-продажи ссылок с главных и внутренних страниц сайтов.