Форум SAPE.RU

Форум SAPE.RU (http://forum.sape.ru/index.php)
-   Вопросы по работе системы (http://forum.sape.ru/forumdisplay.php?f=13)
-   -   Дубли страниц в индексе сапы (http://forum.sape.ru/showthread.php?t=70606)

Заур 06.07.2011 09:48

Дубли страниц в индексе сапы
 
Здравствуйте! Скажите почему робот сапы нашел на моем сайте такие адреса типа - http://www.site.ru/material.html?sta...th=1&year=2012, тогда как вбив данный адрес в адресную строку браузера перекидывает по 301 редиректу на нужную страницу - www.site.ru/material.html. Движок джумла. От дублей решил избавиться, настроив 301 редирект. В роботсе тоже закрыл от индексации все то, что можно было. Скажите как избавиться от таких страниц?

Последний Герой 06.07.2011 09:53

Цитата:

Сообщение от Заур (Сообщение 1101678)
почему робот сапы нашел на моем сайте такие адреса типа - http://www.site.ru/material.html?sta...th=1&year=2012,

есть на них такие ссылки

Цитата:

Сообщение от Заур (Сообщение 1101678)
тогда как вбив данный адрес в адресную строку браузера перекидывает по 301 редиректу на нужную страницу - www.site.ru/material.html.

уверены, что редирект через 301 код, а не яваскрипт?

Цитата:

Сообщение от Заур (Сообщение 1101678)
В роботсе тоже закрыл от индексации все то, что можно было.

После индексации? И покажите как именно закрыли.

Цитата:

Сообщение от Заур (Сообщение 1101678)
Скажите как избавиться от таких страниц?

Удалить вручную.

Заур 06.07.2011 10:00

Цитата:

Сообщение от Последний Герой (Сообщение 1101682)
Удалить вручную.

Вы имеете ввиду удалить из сапы? Но ведь при следующей переиндексации они опять там появятся?
Вот мой роботс:
User-agent: *
Disallow: /administrator/
Disallow: /cache/
Disallow: /components/
Disallow: /images/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /libraries/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/
Disallow: /xmlrpc/
Disallow: /index.html
Disallow: /oboi-dlya-rabochego-stola/
Disallow: /*.pdf$
Disallow: /*print=1
Disallow: /*mailto/
Disallow: /component/
Disallow: /index.php/
Disallow: /index/
Disallow: /index.php/index.php?option=com_content&view=frontpage
Host: spravkapc.ru

Последний Герой 06.07.2011 10:02

Цитата:

Сообщение от Заур (Сообщение 1101689)
Но ведь при следующей переиндексации они опять там появятся?

удалить навсегда.

Цитата:

Сообщение от Заур (Сообщение 1101689)
Disallow: /*.pdf$
Disallow: /*print=1
Disallow: /*mailto/

это ересь

Заур 06.07.2011 10:09

Цитата:

Сообщение от Последний Герой (Сообщение 1101691)
удалить навсегда

Т.е. как я понял если удалить страницы навсегда робот сапы при следующей переиндексации включать их в индекс не будет?

Цитата:

Сообщение от Последний Герой (Сообщение 1101691)
Disallow: /*.pdf$
Disallow: /*print=1
Disallow: /*mailto/

А что тут не так?
А есть ли еще замечания по роботсу?

Последний Герой 06.07.2011 10:13

Цитата:

Сообщение от Заур (Сообщение 1101697)
Т.е. как я понял если удалить страницы навсегда робот сапы при следующей переиндексации включать их в индекс не будет?

Не будет.

Цитата:

Сообщение от Заур (Сообщение 1101697)
А что тут не так?

А что такое robots.txt знаете?

Заур 06.07.2011 10:19

Цитата:

Сообщение от Последний Герой (Сообщение 1101701)
А что такое robots.txt знаете?

Конечно знаю, а что?

Последний Герой 06.07.2011 10:21

Цитата:

Сообщение от Заур (Сообщение 1101707)
Конечно знаю, а что?

Тогда в чем вопрос?

Заур 06.07.2011 10:25

Цитата:

Сообщение от Последний Герой (Сообщение 1101691)
Disallow: /*.pdf$
Disallow: /*print=1
Disallow: /*mailto/

Вы сказали, что это ересть. Может я не правильно вас понял, что вы имели ввиду?

Последний Герой 06.07.2011 10:29

Цитата:

Сообщение от Заур (Сообщение 1101711)
Вы сказали, что это ересть

Вы почему от моего имени свой код цитируете? Я эту ересь не писал.

Цитата:

Сообщение от Заур (Сообщение 1101711)
Может я не правильно вас понял, что вы имели ввиду?

Что это ересь. Закрывает от индексации совсем не то, что Вы хотите.

К примеру
Цитата:

Сообщение от Заур (Сообщение 1101711)
Disallow: /*.pdf$

закрывает все адреса, которые начинаются на /*.pdf$, к примеру http://site.ru/*.pdf$aaaaaaaaa


Часовой пояс GMT +3, время: 07:17.

Работает на vBulletin® версия 3.8.7.
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Перевод: zCarot
SAPE.RU — система купли-продажи ссылок с главных и внутренних страниц сайтов.