Форум SAPE.RU

Форум SAPE.RU (http://forum.sape.ru/index.php)
-   Вопросы по работе системы (http://forum.sape.ru/forumdisplay.php?f=13)
-   -   ссылки в сапе и Яндексе - не совпадают! (http://forum.sape.ru/showthread.php?t=35294)

vladische 29.07.2009 18:55

ссылки в сапе и Яндексе - не совпадают!
 
в общем суть вопроса вот в чём... сайт проиндексирован, страниц куча, многие ссылки вида ../?c=Ялта - то есть по городам... почему в ссылке кириллица - не спрашивайте, это было изначально, уже 3 года как, поисковики и броузеры понимают нормально... но вот сапе и Яндекс страницы эти видят как бы по разному, в сапе страница ../?c=Ялта, а вот в яндексе перекодированная - ../?c=%DF%EB%F2%E0
если я в сапе жму "проверить страницу в яндексе", то яндекс говорит - нет такой... страницу ../?c=Ялта он не знает, но прекрасно знает страницу ../?c=%DF%EB%F2%E0
и ещё более бредово, если в Яндексе запросить все страницы вида http://имя-домена/?c= с данного сайта, он выдаёт кучу страниц именно с кириллическими ссылками, то есть как раз http://имя-домена/?c=Ялта и прочие города...
но вот как объяснить модераторам и покупателям ссылок, что страницы-то в поиске есть, просто сапа их проверяет не совсем корректно?
я вообще-то пока вижу только один выход - подменить только для бота сапы все ссылки на перекодированные и заново проиндексировать сайт...

WebFX 29.07.2009 18:59

кириллица в урл это вообще нонсенс. Типа блевотного кода 1С.
Если робот сейпа не видит ваши страницы - делайте транслит и ждите индексации Я.

vladische 29.07.2009 19:14

ответ - полный бред... робот всё видит, и сапы и яндекса, я об этом написал... и транслит тут не при чём, точнее это был бы самый тупой выход (при проиндексированных 30 тысячах страниц менять всю структуру для поисковиков и ждать переиндексации, пусть даже используя редиректы)...

Алексей Барыкин 29.07.2009 20:18

Было у меня на одном сайте пара страниц с кириллицей в урле (потом прибил их на всякий случай)
Так они успешно в сапе и в яндексе отображались и числились проиндексированными.
Так что дело в кривых руках.

Кириллица в урле - зло. Разрешено только википедии.

zhegloff 29.07.2009 20:26

Цитата:

Сообщение от vladische (Сообщение 518550)
сапа их проверяет не совсем корректно?

сапа их проверяет так как вы ей их отдали.

Если у вас кривые руки и вы не читали спецификацию на урлы, то это не значит, что сапа в чем то виновата.

phantomas 29.07.2009 22:55

Все просто.
Боты всех поисковиков (по крайней мере Яндекса и Гугла точно) при сканировании все урлы кодируют в уникод (так же как это делают кстати браузеры) и имено в этом виде заносят страницы в индекс.
Бот сапы берет ссылки как есть и делает только urlencode.
Таким образом для решения проблемы необходимо либо чтобы бот-индексатор сапы научили вести седя подобно ботам поисковиков, т.е при индексировании кодировать в уникод урлы страниц и так заносить в базу, либо чтобы в html страницы все ссылки уже были не ../?c=Ялта а ../?c=%DF%EB%F2%E0
надеюсь понятно изложил. спешу, расписывать подробно недосуг


Часовой пояс GMT +3, время: 18:17.

Работает на vBulletin® версия 3.8.7.
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Перевод: zCarot
SAPE.RU — система купли-продажи ссылок с главных и внутренних страниц сайтов.