25.06.2010, 22:09 | #11 | |
Мастер
Регистрация: 29.03.2010
Адрес: <html></html>
Сообщений: 626
Вес репутации: 198
|
вот это я и имел введу под нарушием порядка размещения директив
Добавлено через 58 секунд Цитата:
Нет инструкции Allow, есть только Disallow. Файл robots.txt ничего не разрешает, только запрещает! Что роботу можно "разрешат", он индексирует ВСЕ что не запрещено (как говорится разрешено). Последний раз редактировалось WEB-Master; 25.06.2010 в 22:10. Причина: Добавлено сообщение |
|
25.06.2010, 22:11 | #12 | |
Эксперт
Регистрация: 12.12.2009
Адрес: Ростов-на-Дону
Сообщений: 1,537
Вес репутации: 242
|
Цитата:
Отсюда: http://help.yandex.ru/webmaster/?id=996567#996571 Чтобы разрешить доступ робота к некоторым частям сайта или сайту целиком, используйте директиву 'Allow'
__________________
Самый удобный Хостинг (в т.ч. сейчас - бесплатное полугодовое тестирование хостинга Node.JS) |
|
25.06.2010, 22:23 | #13 |
Мастер
Регистрация: 29.03.2010
Адрес: <html></html>
Сообщений: 626
Вес репутации: 198
|
eresik, возможно сейчас и поддерживает, но похоже у него только одно применение, когда запрещаешь весь сайт к индексации и разрешаешь конкретные урлы (до данного момента не приходило на ум такое использование), иначе разрешать что-то нет смысла, потому что оно и так разрешено по умолчанию.
|
25.06.2010, 22:26 | #14 | |
Эксперт
Регистрация: 12.12.2009
Адрес: Ростов-на-Дону
Сообщений: 1,537
Вес репутации: 242
|
Цитата:
Возможны ситуации, когда проще перечислить что разрешено, чем перечислять что запрещено.
__________________
Самый удобный Хостинг (в т.ч. сейчас - бесплатное полугодовое тестирование хостинга Node.JS) |
|
25.06.2010, 22:39 | #15 |
К черту кодекс !!
Регистрация: 19.12.2009
Адрес: [ forum.sape.ru ]
Сообщений: 2,168
Вес репутации: 375
|
Харэ ругаться, ёптэ.. сделайте лучше человеку нормальный robots.txt - чтоб все работало и индексировалось..
__________________
|
25.06.2010, 22:46 | #16 | |
Эксперт
Регистрация: 12.12.2009
Адрес: Ростов-на-Дону
Сообщений: 1,537
Вес репутации: 242
|
Цитата:
Оба узнали для себя новое Чтоб сапой индексировалось - убрать последние две строчки. Юзер агента сапы не знаю, и наверняка он "иногда меняется"
__________________
Самый удобный Хостинг (в т.ч. сейчас - бесплатное полугодовое тестирование хостинга Node.JS) |
|
25.06.2010, 23:02 | #17 |
Мастер
Регистрация: 29.03.2010
Адрес: <html></html>
Сообщений: 626
Вес репутации: 198
|
|
25.06.2010, 23:02 | #18 |
Новичок
Регистрация: 11.01.2010
Сообщений: 34
Вес репутации: 0
|
Спасибо. Все, что требовалось узнать, что робот сапы безымянен.
WEB-Master - robots.txt текущий составлен правильно и уже пару лет исправно работает со всеми роботами. Насчет директив вы не правы. Просто обычно либо allow либо disallow, тут частный случай |
25.06.2010, 23:05 | #19 |
Мастер
Регистрация: 29.03.2010
Адрес: <html></html>
Сообщений: 626
Вес репутации: 198
|
Вроде где-то на форуме видел что сотрудник сапе писал что юзерагент робота что-то вроде "САПА блаблабла".
НЕ думаю что в данном случает проблема в узерагент, просто тут столько раз употр****ется Disallow: / что бот думает что сайт вообще запрещен к индексации. |
25.06.2010, 23:07 | #20 | |
Эксперт
Регистрация: 12.12.2009
Адрес: Ростов-на-Дону
Сообщений: 1,537
Вес репутации: 242
|
Цитата:
В частности он разрешает яндексу и гуглу индексировать ВСЁ. Т.к. фактически в вашем роботсе указано "для яндекса и гугла - директив нет" Проерка - http://webmaster.yandex.ru/robots.xml (аналогичный сервис есть и у гугла)
__________________
Самый удобный Хостинг (в т.ч. сейчас - бесплатное полугодовое тестирование хостинга Node.JS) |
|
|
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Робот Сапы и Crawl-delay | Sea | Вопросы по работе системы | 10 | 13.02.2012 12:17 |
Робот сапы не видит установленный код | karizma | Установка кода на различные движки | 7 | 16.07.2009 11:22 |
Понимает ли робот сапы allow в robots.txt? | Danila | Вопросы по работе системы | 6 | 04.02.2009 17:59 |
робот сапы не видит ссылки | stremlenie1 | Ошибки при работе с системой | 2 | 26.11.2008 13:22 |
Робот сапы не видит код на .narod.ru | Эмка | Ошибки при работе с системой | 2 | 23.10.2008 11:47 |
Часовой пояс GMT +3, время: 15:48.