Форум SAPE.RU

Форум SAPE.RU (http://forum.sape.ru/index.php)
-   Разработка и сопровождение сайтов (http://forum.sape.ru/forumdisplay.php?f=29)
-   -   Robots.txt для DLE (http://forum.sape.ru/showthread.php?t=20524)

NIG 16.10.2008 03:34

Robots.txt для DLE
 
Здрасьте. У меня опять проблема: поисковики индексируют мои сайты какимто непонятным образом - в индексе не все страницы, но те которые есть проиндексированы несколько раз 3 способами: с чпу, без чпу и страница для печати.
Хотелось бы узнать, что нужно прописать в robots.txt чтобы убрать из индексации ненужные копии страницы и оставить только чпу?

Odine 16.10.2008 07:53

Цитата:

Сообщение от NIG (Сообщение 280441)
Здрасьте. У меня опять проблема: поисковики индексируют мои сайты какимто непонятным образом - в индексе не все страницы, но те которые есть проиндексированы несколько раз 3 способами: с чпу, без чпу и страница для печати.
Хотелось бы узнать, что нужно прописать в robots.txt чтобы убрать из индексации ненужные копии страницы и оставить только чпу?

Мой Robots Выглядит так
User-agent: *
Disallow: /autobackup.php
Disallow: /admin.php
Disallow: /user/
Disallow: /favorites/
Disallow: /statistics.html
Disallow: /newposts/
Disallow: /*print
Host: www.site.ru

Для Сапы Самая Важная строка.
Disallow: /*print
Так как Сапа страницы для печати не находит а Яша если их нашел страницы с Новостью он игнорирует

V!rus 16.10.2008 14:59

robotstxt.org - ТС, сделайте себе свой файл

Vite4eG 11.06.2009 15:14

Ниже содержание моего файла, но у меня некоторые страницы попали в индекс, это страницы печати, страницы пользователей, страница регистрации, хотя они запрещены. Почему так, кто подскажет?

User-agent: *
Disallow: /autobackup.php
Disallow: /admin.php
Disallow: /user/
Disallow: /cache/
Disallow: /favorites/
Disallow: /cgi-bin/
Disallow: /engine/
Disallow: /language/
Disallow: /*print
Disallow: /templates/
Disallow: /uploads/
Disallow: /backup/
Disallow: /languages/
Disallow: /index.php?do=pm
Disallow: /index.php?do=search
Disallow: /index.php?do=register
Disallow: /index.php?do=feedback
Disallow: /index.php?do=lostpassword
Disallow: /index.php?do=stats
Disallow: /index.php?do=addnews
Disallow: /index.php?subaction=newposts
Disallow: /?do=lastcomments
Disallow: /statistics.html
User-agent: *
Allow: /
Sitemap: http://svadbakerch.com/sitemap.xml
User-agent: Yandex
Host: svadbakerch.com

V I P 11.07.2009 09:33

Цитата:

Allow: /
В роботс нет поддержки "Allow", насколько я знаю..

V I P 13.07.2009 05:53

Цитата:

но у меня некоторые страницы попали в индекс
неоднократно слышал о попадании в индекс запрещенных страниц

Клон 04.08.2010 01:09

Цитата:

Сообщение от Vite4eG (Сообщение 474082)
хотя они запрещены. Почему так, кто подскажет?

роботс неправильно написан потому что, никакие запреты не работают
исправь на так:

Код HTML:

User-agent: Yandex
Disallow: /autobackup.php
Disallow: /admin.php
Disallow: /user/
Disallow: /cache/
Disallow: /favorites/
Disallow: /cgi-bin/
Disallow: /engine/
Disallow: /language/
Disallow: /templates/
Disallow: /uploads/
Disallow: /backup/
Disallow: /languages/
Disallow: /index.php?do=pm
Disallow: /index.php?do=search
Disallow: /index.php?do=register
Disallow: /index.php?do=feedback
Disallow: /index.php?do=lostpassword
Disallow: /index.php?do=stats
Disallow: /index.php?do=addnews
Disallow: /index.php?subaction=newposts
Disallow: /?do=lastcomments
Disallow: /statistics.html
Disallow: /*/print*
Sitemap: http://svadbakerch.com/sitemap.xml
Host: svadbakerch.com

User-agent: Googlebot
Disallow: /autobackup.php
Disallow: /admin.php
Disallow: /user/
Disallow: /cache/
Disallow: /favorites/
Disallow: /cgi-bin/
Disallow: /engine/
Disallow: /language/
Disallow: /templates/
Disallow: /uploads/
Disallow: /backup/
Disallow: /languages/
Disallow: /index.php?do=pm
Disallow: /index.php?do=search
Disallow: /index.php?do=register
Disallow: /index.php?do=feedback
Disallow: /index.php?do=lostpassword
Disallow: /index.php?do=stats
Disallow: /index.php?do=addnews
Disallow: /index.php?subaction=newposts
Disallow: /?do=lastcomments
Disallow: /statistics.html
Disallow: /*/print*
Sitemap: http://svadbakerch.com/sitemap.xml
Host: svadbakerch.com


Добавлено через 4 минуты
вот лопух )))
http://svadbakerch.com/main/print:pa...ir-svadbi.html

ну ка поищи там подозрительные вещи, ниче странного не видно? не?

Добавлено через 4 часа 5 минут
чиорт, я тоже лопух =)))

повелся на спамера некропостера :D

Sergoff 04.08.2010 03:24

Цитата:

Сообщение от Odine (Сообщение 280511)
Мой Robots Выглядит так
User-agent: *
Disallow: /autobackup.php
Disallow: /admin.php
Disallow: /user/
Disallow: /favorites/
Disallow: /statistics.html
Disallow: /newposts/
Disallow: /*print
Host: www.site.ru

Для Сапы Самая Важная строка.
Disallow: /*print
Так как Сапа страницы для печати не находит а Яша если их нашел страницы с Новостью он игнорирует


Ваш роботс бездумно скопирован откуда-то. Много лишнего...

autobackup.php - изначально нужно переименовывать, это даже говориться в мануалах по движку. Потенциальная уязвимость копирования бекапов...

admin.php - нужно переименовывать для защиты и тем более не указывать название этого файла в роботсе.

/*print - излишне, т.к. в админке нужно запрещать индексирование поисковыми роботами версий для печати...

zhegloff 04.08.2010 13:30

Некропостеры... ррррыыы.


Часовой пояс GMT +3, время: 13:42.

Работает на vBulletin® версия 3.8.7.
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Перевод: zCarot
SAPE.RU — система купли-продажи ссылок с главных и внутренних страниц сайтов.