Вернуться   Форум SAPE.RU > Система SAPE.ru > Ошибки при работе с системой

-->
Ответ
 
Опции темы
Старый 03.11.2010, 13:43   #1
Новичок
 
Регистрация: 12.10.2010
Сообщений: 31
Вес репутации: 0
ITT не любят в этих краях
По умолчанию Енкодированные урл не проходят проверку индекса

Опять же по мотивам темы: http://forum.sape.ru/showthread.php?t=60810

Ссылки с содержанием енкода не могут пройти проверку в индексе яндекса, т.к. передаётся не правильный урл для проверки. Система дополнительно енкодирует символ "%" в "%25" и никакой урл, содержащий такие символы не пройдёт проверку.

Цитата:
Сообщение от ITT Посмотреть сообщение
Нашёл ещё несколько примеров в интернете, где используется кириллица ЧПУ урл. И проверяются они в индексе именно по русскому урлу (не важно есть там кириллица или нет, соль не в этом). Вот пример: _http://zipo.com.ua/%D0%A7%D0%B5%D0%BB%D0%BE%D0%B2%D0%B5%D0%BA%D1%83+% D0%BF%D0%BE%D0%BD%D1%8F%D1%82%D0%BD%D1%8B%D0%B9+%D 0%A3%D0%A0%D0%9B+%28%D0%A7%D0%9F%D0%A3%29+%D0%B8+% D0%BA%D0%B8%D1%80%D0%B8%D0%BB%D0%BB%D0%B8%D1%86%D0 %B0.html он же _http://zipo.com.ua/Человеку+понятный+УРЛ+(ЧПУ)+и+кириллица.html
Сайт работает на CMS Wordpress, там по умолчанию используются такие урл. Насколько знаю для него существует плагин, которые транслитирует урл. Но факт, что в данном случае используются нормальные енкодированные кириллические символы в урле. Всё чисто? Всё как надо?

Проверяем в индексе данный урл: http://yandex.ru/yandsearch?text=url...%25D0%22&lr=50 - в индексе его нет (в урле запроса все "%" превращаются в "%25" вот и всё отличие запросов, но от этого уже совсем по другому представляется запрос).
Проверяем http://yandex.ru/yandsearch?text=url....html%22&lr=50 - страница в индексе.

Получается достаточно Sape изменить в урле проверки индекса "%25" на просто "%", как должно быть и урлы проверяются правильно.

Если Вы утверждаете, что я не прав - приведите пример (хоть в личку) урла в таком формате, который проходит проверку на индекс из системы Sape.
Добавлено через 1 час 7 минут
Подведу итог исследований:
Ссылки попадают в сапе правильно (я в этом и не сомневаюсь уже), они уже енкодированы на сайте и отображаются енкодированными в системе. Далее при передаче ссылки на проверку индекса в Яндекс - урл ещё раз енкодируется, т.е. латинница остаётся в порядке, покое и добре, а все знаки "%" ещё раз енкодируются и получается совсем другой урл. Вместо "%" мы видим "%25" и у нас уже не ссылка, в которой человек видит кириллические символы, а ссылка, которая содержит знаки "%" и то, что осталось в латиннице от енкодированной ссылки. Т.е. в Яндексе проверяется на наличие уже совсем другая ссылка. Теперь я правильно выразился?

Т.е. берём ссылку вида:
Код:
ru.wikipedia.org/wiki/Кашалот
При енкодированнии на сайте получаем:
Код:
ru.wikipedia.org/wiki/%D0%9A%D0%B0%D1%88%D0%B0%D0%BB%D0%BE%D1%82
При декоде получаем ссылку предыдущего вида.

При передаче из Сапе в проверку индекса получаем:
Код:
ru.wikipedia.org/wiki/%25D0%259A%25D0%25B0%25D1%2588%25D0%25B0%25D0%25BB%25D0%25BE%25D1%2582
А при декоде (т.е. представлении человеческом) получаем предыдущую ссылку, которая не является первой.

Т.е. мы пытаемся проверить ссылку с реальным адресом http://ru.wikipedia.org/wiki/%25D0%2...25BE%25D1%2582 (попробуйте на неё зайти), которая по человечески представляется как енкодированная наша ссылка.

Вот такой дом, который построил Джек.

Последний раз редактировалось ITT; 03.11.2010 в 13:43. Причина: Добавлено сообщение
ITT вне форума   Ответить с цитированием
Ответ


Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход

Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Енкодированные кириллические урлы - плохо? ITT Вопросы по работе системы 38 15.11.2011 11:23
Сайты не проходят индексацию BlackinWhite Вопросы по работе системы 3 07.03.2010 23:28
сайты не проходят модерацию seomih Ошибки при работе с системой 3 31.08.2009 02:04
Сайты не проходят модерацию Serj_17 Вопросы по работе системы 24 22.08.2008 15:48
XML запрос на проверку индекса nvrskozzy Яндекс 4 28.06.2008 01:27


Часовой пояс GMT +3, время: 16:21.