Форум SAPE.RU

Форум SAPE.RU (http://forum.sape.ru/index.php)
-   Вопросы по работе системы (http://forum.sape.ru/forumdisplay.php?f=13)
-   -   Паук не различает ссылки с "собакой" (http://forum.sape.ru/showthread.php?t=3198)

Продавец 16.07.2007 16:24

Паук не различает ссылки с "собакой"
 
Паук sape.ru не различает ссылки ввида:

http://site.ru/articles.php@id=208

т.е. любую ссылку, где есть символ @. Из-за этого, очень много страниц бездействует.

Когда планируется исправить данный глюк ?

zhegloff 16.07.2007 17:10

Это не глюк сапы, это глюк вашего движка....

Ank 16.07.2007 18:13

обратимся к авторитетам :)
http://www.google.ru/support/webmast...y?answer=35653
Приведите пример стандарта по которому собака (@) допустимый символ урла (не емейла!).

Продавец 16.07.2007 20:06

согласен, знак @ - в адресе URL не является правильным. Но такие сайты есть, страницы - существуют. Яндекс и др. поисковики их прекрасно индексирует. Почему на них не продавать ссылки ?!

Евген 17.07.2007 05:36

юзайте htaccess

Продавец 18.07.2007 10:33

как мне кажется, файл дирректив апача .htaccess не поможет пауку sape.ru лучше парсить уже скаченный html текст документа или правильно фильтровать распарсенные ссылки

Евген 18.07.2007 13:34

зато может изменить урлы ссылок на статичные.

Alexey 18.07.2007 13:55

Что вы спорите? Символы в URL регулируются при помощи RFC (как и все в инете). В данном случае http://www.faqs.org/rfcs/rfc1738.html (RFC1738 - Uniform Resource Locators (URL)).

Где сказано:
Код:

Many URL schemes reserve certain characters for a special meaning:
  their appearance in the scheme-specific part of the URL has a
  designated semantics. If the character corresponding to an octet is
  reserved in a scheme, the octet must be encoded.  The characters ";",
  "/", "?", ":", "@", "=" and "&" are the characters which may be
  reserved for special meaning within a scheme. No other characters may
  be reserved within a scheme.

....

Thus, only alphanumerics, the special characters "$-_.+!*'(),", and
  reserved characters used for their reserved purposes may be used
  unencoded within a URL.

что означает что символ '@' должен быть url-кодирован только если в данной схеме он не является специальным и не используется в своем специальном предназначении.

Рассмотрим схему HTTP, которой отведена часть 3.3 вышеуазанного RFC.
Там сказано

Код:

Within the <path> and <searchpart> components, "/", ";", "?" are
  reserved.  The "/" character may be used within HTTP to designate a
  hierarchical structure.

Т.е. "@" не входит в список зарезервированных символов и должен быть URL-кодирован. Т.е. URL с собакой являются не верными.


Часовой пояс GMT +3, время: 07:11.

Работает на vBulletin® версия 3.8.7.
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Перевод: zCarot
SAPE.RU — система купли-продажи ссылок с главных и внутренних страниц сайтов.