Вернуться   Форум SAPE.RU > Общие вопросы > Разработка и сопровождение сайтов

-->
Ответ
 
Опции темы
Старый 17.05.2008, 17:55   #1
Мастер
 
Регистрация: 17.03.2008
Сообщений: 638
Вес репутации: 237
ahsinis - прекрасное будущееahsinis - прекрасное будущееahsinis - прекрасное будущееahsinis - прекрасное будущееahsinis - прекрасное будущееahsinis - прекрасное будущееahsinis - прекрасное будущееahsinis - прекрасное будущееahsinis - прекрасное будущееahsinis - прекрасное будущееahsinis - прекрасное будущее
Exclamation Надежная идентификация поисковых систем

Может кто знает, как можно программно на сервере относительно точно идентифицировать поисковую систему, зашедшую на сайт.
Первичную информацию можно конечно получить из USER_AGENT, но я подозреваю, что для некоторых роботов он не заполняется. Может по IP адресу можно как-то дополнительно отлеживать?
Никто не сталкивался с такой проблемой?
Буду благодарен за советы.
ahsinis вне форума   Ответить с цитированием
Старый 17.05.2008, 18:48   #2
Специалист
 
Регистрация: 03.11.2007
Сообщений: 200
Вес репутации: 205
formalist на пути к лучшему
По умолчанию

Юзер-агент прописывается для всех ботов, которые не маскируются под соседа.
Этого ващето вполне хватает.
Если тока не надо жестко клоачить.
А если надо - то тебе сюда или сюда
formalist вне форума   Ответить с цитированием
Старый 17.05.2008, 18:56   #3
Дикий
 
Аватар для D.iK.iJ
 
Регистрация: 02.06.2007
Адрес: <Noindex>
Сообщений: 2,551
Вес репутации: 355
D.iK.iJ - прекрасное будущееD.iK.iJ - прекрасное будущееD.iK.iJ - прекрасное будущееD.iK.iJ - прекрасное будущееD.iK.iJ - прекрасное будущееD.iK.iJ - прекрасное будущееD.iK.iJ - прекрасное будущееD.iK.iJ - прекрасное будущееD.iK.iJ - прекрасное будущееD.iK.iJ - прекрасное будущееD.iK.iJ - прекрасное будущее
Smile

Можно записывать IP тех, кто заглядывает в Robots.txt
D.iK.iJ вне форума   Ответить с цитированием
Старый 17.05.2008, 19:06   #4
Злой модератор
 
Аватар для Wink
 
Регистрация: 25.03.2007
Адрес: Deep forest
Сообщений: 5,343
Вес репутации: 503
Wink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущее
По умолчанию

Для поисковых роботов достаточно USER_AGENT
Wink вне форума   Ответить с цитированием
Старый 17.05.2008, 19:07   #5
Специалист
 
Регистрация: 03.11.2007
Сообщений: 200
Вес репутации: 205
formalist на пути к лучшему
По умолчанию

Действительно, можно что-то типа влепить
Код:
RewriteEngine on 
Options +FollowSymlinks 
RewriteBase / 
RewriteRule ^robots.txt$ /cgi-bin/count.cgi?%{REQUEST_URI}
formalist вне форума   Ответить с цитированием
Старый 17.05.2008, 19:11   #6
Дикий
 
Аватар для D.iK.iJ
 
Регистрация: 02.06.2007
Адрес: <Noindex>
Сообщений: 2,551
Вес репутации: 355
D.iK.iJ - прекрасное будущееD.iK.iJ - прекрасное будущееD.iK.iJ - прекрасное будущееD.iK.iJ - прекрасное будущееD.iK.iJ - прекрасное будущееD.iK.iJ - прекрасное будущееD.iK.iJ - прекрасное будущееD.iK.iJ - прекрасное будущееD.iK.iJ - прекрасное будущееD.iK.iJ - прекрасное будущееD.iK.iJ - прекрасное будущее
По умолчанию

Цитата:
Сообщение от formalist Посмотреть сообщение
Действительно, можно что-то типа влепить
Код:
RewriteEngine on 
Options +FollowSymlinks 
RewriteBase / 
RewriteRule ^robots.txt$ /cgi-bin/count.cgi?%{REQUEST_URI}
Просто включить PHP обработку для роботс (txt файлы) и добавить туда пару строк кода
D.iK.iJ вне форума   Ответить с цитированием
Старый 17.05.2008, 19:13   #7
Дикий
 
Аватар для D.iK.iJ
 
Регистрация: 02.06.2007
Адрес: <Noindex>
Сообщений: 2,551
Вес репутации: 355
D.iK.iJ - прекрасное будущееD.iK.iJ - прекрасное будущееD.iK.iJ - прекрасное будущееD.iK.iJ - прекрасное будущееD.iK.iJ - прекрасное будущееD.iK.iJ - прекрасное будущееD.iK.iJ - прекрасное будущееD.iK.iJ - прекрасное будущееD.iK.iJ - прекрасное будущееD.iK.iJ - прекрасное будущееD.iK.iJ - прекрасное будущее
По умолчанию

Как вариант для роботов не читающих роботс.txt - сделать на сайте скрытую ссылку на файл, запрещенный в роботс.txt. Кто зайдет - плохой робот!
D.iK.iJ вне форума   Ответить с цитированием
Старый 17.05.2008, 23:41   #8
Специалист
 
Аватар для Dreamer.rus
 
Регистрация: 08.03.2008
Сообщений: 246
Вес репутации: 204
Dreamer.rus - как роза среди колючекDreamer.rus - как роза среди колючекDreamer.rus - как роза среди колючекDreamer.rus - как роза среди колючек
По умолчанию

Вот файлик с собранными идентификаторами ботов. Собирался для vbulletin. Может найдете в нем, что-нить интересного
Вложения
Тип файла: zip spiders_vbulletin.xml.zip (6.8 Кб, 11 просмотров)
Dreamer.rus вне форума   Ответить с цитированием
Старый 18.05.2008, 08:40   #9
Специалист
 
Аватар для Kashey
 
Регистрация: 02.07.2007
Сообщений: 453
Вес репутации: 217
Kashey - очень-очень хороший человекKashey - очень-очень хороший человекKashey - очень-очень хороший человекKashey - очень-очень хороший человек
По умолчанию

Хлам этот файлик, 90% этих роботов заходят на сайт раз в год.
Активны только 7 ботов - Я,Г,Рам,Гога,Лайф,Служебный Микрософта, ПСбот и Яху..
остальные генерят в сотни раз меньший траф
__________________
Нужны новости? - На скане полмиллиона новостей. Всяко разных.
И как всегда это все ScanLog записывает
Kashey вне форума   Ответить с цитированием
Старый 18.05.2008, 10:54   #10
Мастер
 
Регистрация: 17.03.2008
Сообщений: 638
Вес репутации: 237
ahsinis - прекрасное будущееahsinis - прекрасное будущееahsinis - прекрасное будущееahsinis - прекрасное будущееahsinis - прекрасное будущееahsinis - прекрасное будущееahsinis - прекрасное будущееahsinis - прекрасное будущееahsinis - прекрасное будущееahsinis - прекрасное будущееahsinis - прекрасное будущее
По умолчанию

Какой у gogo юзер агент или он роботом mail.ru заходит?
Что такое Лайф? liveinternet?
Ве-бальта, я так понял, умерла?
ahsinis вне форума   Ответить с цитированием
Ответ


Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход

Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
База поисковых спамеров Serge_vet Деловое сотрудничество 6 11.12.2008 11:36
Идентификация О mnemonic Пожелания пользователей системы 7 19.12.2007 01:37
Дружественные для поисковых систем URL MixLSD Google, MSN, Yahoo 1 07.10.2007 12:10
Язык поисковых запросов Avish Пожелания пользователей системы 0 26.07.2007 20:06
Пожелания по новым категориям для добавления сайтов в систем WebNamo Пожелания пользователей системы 2 05.06.2007 05:22


Часовой пояс GMT +3, время: 00:06.