ссылки в сапе и Яндексе - не совпадают!
в общем суть вопроса вот в чём... сайт проиндексирован, страниц куча, многие ссылки вида ../?c=Ялта - то есть по городам... почему в ссылке кириллица - не спрашивайте, это было изначально, уже 3 года как, поисковики и броузеры понимают нормально... но вот сапе и Яндекс страницы эти видят как бы по разному, в сапе страница ../?c=Ялта, а вот в яндексе перекодированная - ../?c=%DF%EB%F2%E0
если я в сапе жму "проверить страницу в яндексе", то яндекс говорит - нет такой... страницу ../?c=Ялта он не знает, но прекрасно знает страницу ../?c=%DF%EB%F2%E0 и ещё более бредово, если в Яндексе запросить все страницы вида http://имя-домена/?c= с данного сайта, он выдаёт кучу страниц именно с кириллическими ссылками, то есть как раз http://имя-домена/?c=Ялта и прочие города... но вот как объяснить модераторам и покупателям ссылок, что страницы-то в поиске есть, просто сапа их проверяет не совсем корректно? я вообще-то пока вижу только один выход - подменить только для бота сапы все ссылки на перекодированные и заново проиндексировать сайт... |
кириллица в урл это вообще нонсенс. Типа блевотного кода 1С.
Если робот сейпа не видит ваши страницы - делайте транслит и ждите индексации Я. |
ответ - полный бред... робот всё видит, и сапы и яндекса, я об этом написал... и транслит тут не при чём, точнее это был бы самый тупой выход (при проиндексированных 30 тысячах страниц менять всю структуру для поисковиков и ждать переиндексации, пусть даже используя редиректы)...
|
Было у меня на одном сайте пара страниц с кириллицей в урле (потом прибил их на всякий случай)
Так они успешно в сапе и в яндексе отображались и числились проиндексированными. Так что дело в кривых руках. Кириллица в урле - зло. Разрешено только википедии. |
Цитата:
Если у вас кривые руки и вы не читали спецификацию на урлы, то это не значит, что сапа в чем то виновата. |
Все просто.
Боты всех поисковиков (по крайней мере Яндекса и Гугла точно) при сканировании все урлы кодируют в уникод (так же как это делают кстати браузеры) и имено в этом виде заносят страницы в индекс. Бот сапы берет ссылки как есть и делает только urlencode. Таким образом для решения проблемы необходимо либо чтобы бот-индексатор сапы научили вести седя подобно ботам поисковиков, т.е при индексировании кодировать в уникод урлы страниц и так заносить в базу, либо чтобы в html страницы все ссылки уже были не ../?c=Ялта а ../?c=%DF%EB%F2%E0 надеюсь понятно изложил. спешу, расписывать подробно недосуг |
Часовой пояс GMT +3, время: 18:17. |
Работает на vBulletin® версия 3.8.7.
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Перевод: zCarot
SAPE.RU — система купли-продажи ссылок с главных и внутренних страниц сайтов.