19.08.2007, 14:54 | #1 |
Специалист
Регистрация: 04.04.2007
Сообщений: 312
Вес репутации: 215
|
robots.txt
У меня у статических страниц, например /index.htm , появляются дубли ввиде динамических страниц /index.htm?sid=e23ca4cfbd4a3b140087e97e0c74f28c
и иногда эти динамичекские странички подают в индекс вместо основной статической. Я читал, что в robots.txt можно сделать общий запрет для индексации всех динамических страниц (страниц с вопросительным знаком), но нигде не нашел примера как это прописать. Для конкретной страницы понятно можно написать Disallow: /index.htm?sid=e23ca4cfbd4a3b140087e97e0c74f28c А вот как написать для всех подобных страниц, чтобы их не перечислять. Если кто знает подскажите пожалуйста?
__________________
|
19.08.2007, 15:00 | #2 |
Администратор
Регистрация: 05.02.2007
Сообщений: 18,405
Вес репутации: 714
|
сессии через роботс не закрыть. Вам зачем сессия? У Вас магазин? Ваши пользователи ходят залогинеными? Может дешевле саму сессию грохнуть..
__________________
Читаем ФАК |
19.08.2007, 16:09 | #3 | |
Специалист
Регистрация: 04.04.2007
Сообщений: 312
Вес репутации: 215
|
Цитата:
http://www.google.com/support/webmas...y?answer=35303 Блокировка или удаление страниц с помощью файла robots.txt Чтобы запретить роботу Google сканировать динамически создаваемые страницы, добавьте в файл robots.txt такую запись: User-agent: Googlebot Disallow: /*? мне это нужно чтобы дубли не индексировались.
__________________
|
|
20.08.2007, 10:54 | #6 |
Специалист
Регистрация: 04.04.2007
Сообщений: 312
Вес репутации: 215
|
Простые статические странички .htm
тип сервера Apache 1.3.* [s8], aux9 / модуль PHP 4 стоит файл .htaccess в нём две строчки: AddHandler application/x-httpd-php .htm .html .shtm .shtml AddType image/x-icon .ico .htaccess был установлен, чтобы работала доска объявлений написанная на PHP
__________________
|
20.08.2007, 11:36 | #7 | |
Специалист
Регистрация: 04.04.2007
Сообщений: 312
Вес репутации: 215
|
Цитата:
Я не программист поэтому не разбираюсь в движках, PHP и других языках программирования. У статических страниц типа .htm появляются дубли типа /index.htm?sid=e23ca4cfbd4a3b140087e97e0c74f28c если можно как то запретить появление этих дублей подскажите пожалуйста. Запись в robots.txt User-agent: Googlebot Disallow: /*? лишь запретит индексацию этих дублей, а не их появление. Поэтому согласен с Alexey это действительно *****решение "через задницу".***** Но всётаки это хоть какое-то решение проблемы, пусть и не устраняющее первопричину этой проблемы.
__________________
|
|
22.08.2007, 14:18 | #9 |
Специалист
Регистрация: 28.06.2007
Адрес: Odessa
Сообщений: 104
Вес репутации: 207
|
PS: .htaccess тут не причем.
AddType image/x-icon .ico - это нахрен не надо а вот AddHandler application/x-httpd-php .htm .html .shtm .shtml - означает , ЧТО. PHP использует html, htm, shtm и shtml файлы как файлы *.php PHP может передавать сессии. Потому используя HTML как PHP вы будете получать такую хрень. Второй возможный вариант решения проблемы, в настройках php.ini поставить след параметры: session.auto_start = 0 session.serialize_handler = php session.use_trans_sid = 0 Для того чтобы узнать КАК менять настройки ПХП - опять таки надо связаться с супортом. Или если вы знаете где у вас лежит ПХП.ini то просто добавьте туда эти параметры. Если эти параметры уже имеются (исп. поиск) то измените их. |
Опции темы | |
|
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Подскажите про robots.txt | админ | Курилка | 8 | 19.04.2008 19:19 |
вопрос по robots.txt | exe2 | Разработка и сопровождение сайтов | 11 | 08.04.2008 21:00 |
301 для robots.txt | eveningspend | Вопросы от новичков | 4 | 24.02.2008 12:42 |
Robots.txt что то с гуглем не то...... | Sergeixp | Google, MSN, Yahoo | 2 | 15.01.2008 19:33 |
Robots.txt | leszkin | Вопросы по работе системы | 7 | 17.09.2007 09:37 |
Часовой пояс GMT +3, время: 15:06.