Вернуться   Форум SAPE.RU > Система SAPE.ru > Вопросы по работе системы

-->
Ответ
 
Опции темы
Старый 04.02.2009, 16:20   #1
Эксперт
 
Регистрация: 13.07.2007
Сообщений: 1,292
Вес репутации: 234
Danila - очень-очень хороший человекDanila - очень-очень хороший человекDanila - очень-очень хороший человекDanila - очень-очень хороший человекDanila - очень-очень хороший человек
По умолчанию Понимает ли робот сапы allow в robots.txt?

Понимает ли робот сапы allow в robots.txt? Складывается такое впечатление что нет. У меня прописано:

Цитата:
User-agent: Yandex
Allow: /novosti/
Allow: /page/
Allow: /articles/
Allow: /rss
Allow: /index.php?do=search&mode=advanced
Allow: /index.php?do=feedback
Allow: /articles.php
Disallow: /

User-agent: *
Disallow: /engine/
Disallow: /backup/
Disallow: /language/
Disallow: /webalizer/
Disallow: /user/
Disallow: /templates/
Disallow: /print
Disallow: /novosti/print
Disallow: /articles/print
Disallow: /news/print
Связано это с тем, что Яндекс неправильно идексирует мой сайт (не по тем УРЛам, которые нужны). Я ему явно указал что и где можно индексировать, а сапа всё в еррор сбросила. Что делать?
Danila вне форума   Ответить с цитированием
Старый 04.02.2009, 16:51   #2
Добрый модератор
 
Аватар для zhegloff
 
Регистрация: 09.07.2007
Адрес: глобус Украины
Сообщений: 27,600
Вес репутации: 1025
zhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущее
По умолчанию

Цитата:
Сообщение от Danila Посмотреть сообщение
Понимает ли робот сапы allow в robots.txt?
Не понимает.
__________________
Установка кода сапы от $9.95. Пишите в личку.
Правильный хостинг.
В личке бесплатно не отвечаю обычно.
zhegloff вне форума   Ответить с цитированием
Старый 04.02.2009, 16:54   #3
Эксперт
 
Регистрация: 13.07.2007
Сообщений: 1,292
Вес репутации: 234
Danila - очень-очень хороший человекDanila - очень-очень хороший человекDanila - очень-очень хороший человекDanila - очень-очень хороший человекDanila - очень-очень хороший человек
По умолчанию

И чего делать? У меня страница доступна по 2-м адресам:

site.ru/xxx-url1.html
и
site.ru/novosti/xxx-url1.html

Яндекс после апдейта проиндексировал site.ru/xxx-url1.html, а ссылки расположены на site.ru/novosti/xxx-url1.html

Вот я поэтому такой роботс и замутил, чтобы он правильно всё понял.
Danila вне форума   Ответить с цитированием
Старый 04.02.2009, 17:00   #4
Добрый модератор
 
Аватар для zhegloff
 
Регистрация: 09.07.2007
Адрес: глобус Украины
Сообщений: 27,600
Вес репутации: 1025
zhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущее
По умолчанию

уберите с сайта страницы
Цитата:
Сообщение от Danila Посмотреть сообщение
site.ru/xxx-url1.html
и ждите пока яша переиндексит.
__________________
Установка кода сапы от $9.95. Пишите в личку.
Правильный хостинг.
В личке бесплатно не отвечаю обычно.
zhegloff вне форума   Ответить с цитированием
Старый 04.02.2009, 17:50   #5
Эксперт
 
Регистрация: 13.07.2007
Сообщений: 1,292
Вес репутации: 234
Danila - очень-очень хороший человекDanila - очень-очень хороший человекDanila - очень-очень хороший человекDanila - очень-очень хороший человекDanila - очень-очень хороший человек
По умолчанию

Цитата:
Сообщение от zhegloff Посмотреть сообщение
уберите с сайта страницы
и ждите пока яша переиндексит.
А что лучше и быстрей, чтобы с адреса site.ru/xxx-url1.html шла 301 переадресация на site.ru/novosti/xxx-url1.html или всё же лучше просто удалить страницы по адресу site.ru/xxx-url1.html чтобы 404 отдавалось?

З.Ы. УРЛы страниц через мод рерайт генерятся.
Danila вне форума   Ответить с цитированием
Старый 04.02.2009, 17:53   #6
Добрый модератор
 
Аватар для zhegloff
 
Регистрация: 09.07.2007
Адрес: глобус Украины
Сообщений: 27,600
Вес репутации: 1025
zhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущее
По умолчанию

Цитата:
Сообщение от Danila Посмотреть сообщение
А что лучше и быстрей, чтобы с адреса site.ru/xxx-url1.html шла 301 переадресация на site.ru/novosti/xxx-url1.html или всё же лучше просто удалить страницы по адресу site.ru/xxx-url1.html чтобы 404 отдавалось?
Лучше 404. Яша недолюбливает редиректы.

Добавлено через 1 минуту
И еще ЯВМ вам в руки
__________________
Установка кода сапы от $9.95. Пишите в личку.
Правильный хостинг.
В личке бесплатно не отвечаю обычно.

Последний раз редактировалось zhegloff; 04.02.2009 в 17:53. Причина: Добавлено сообщение
zhegloff вне форума   Ответить с цитированием
Старый 04.02.2009, 17:59   #7
Эксперт
 
Регистрация: 13.07.2007
Сообщений: 1,292
Вес репутации: 234
Danila - очень-очень хороший человекDanila - очень-очень хороший человекDanila - очень-очень хороший человекDanila - очень-очень хороший человекDanila - очень-очень хороший человек
По умолчанию

Цитата:
Сообщение от zhegloff Посмотреть сообщение
Лучше 404. Яша недолюбливает редиректы.

Добавлено через 1 минуту
И еще ЯВМ вам в руки
Вот с помощью ЯВМ и нашел, что проиндексировано совсем не то. Жаль оттуда страницы нельзя удалить...
Danila вне форума   Ответить с цитированием
Ответ


Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход

Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Робот Сапы и Crawl-delay Sea Вопросы по работе системы 10 13.02.2012 12:17
Робот SAPE игнорирует robots.txt lex Ошибки при работе с системой 33 15.12.2010 13:20
Можно ли закрыть от робота Сапы ссылки через robots.txt? dadda Вопросы по работе системы 6 29.10.2008 15:46
Бот сапы смотрит на файл robots.txt? mekal Вопросы по работе системы 13 18.10.2008 15:20
Робот сапы пропускает станицы которые стоят в ноиндексе в файле robots.txt gdv Вопросы по работе системы 2 14.10.2008 21:42


Часовой пояс GMT +3, время: 22:38.