Форум SAPE.RU

Форум SAPE.RU (http://forum.sape.ru/index.php)
-   Вопросы по работе системы (http://forum.sape.ru/forumdisplay.php?f=13)
-   -   Как в Сапе определяется похожесть страниц с уже закешированными? (http://forum.sape.ru/showthread.php?t=90444)

xintrea 12.09.2013 11:22

Как в Сапе определяется похожесть страниц с уже закешированными?
 
Ситуация:

Проиндексировал сайт в Сапе, когда на сайте были некрасивые технические URL на 200-300 символов. Такие страницы никто не покупал.

Месяц назад поменял систему адресации на сайте, URL стали короткие (30 символов).

После чего переиндексировал сайт и обнаружил следующую особенность Сапы: в Сапе есть кеш страниц, и при индексации происходит сравнение с кешем. И если в кеше найдена страница с таким же содержанием, то она добавляется в список страниц по старому URL. В результате у меня опять в списке страниц все URL-ы старые технические на 200-300 символов.

Я выделял все эти старые страницы и применял им действия "Удалить страницы навсегда". Но при последующей индексации они опять находились в кеше Сапы и снова добавлялись под длинными техническими URL-ами.

Техподдержка ответила что так и должно быть, и нет возможности переиндексировать сайт "вчистовую", без вспоминания старых URL уже внесенных в кеш Сапы страниц.

* * *

В связи с вышесказанным, хочу спросить. Кто-нибудь знает, как в Сапе определяется "похожесть" закешированных в базе страниц? По точному совпадению слепка текстового содержания? По проценту отличий (например, 95% - считается что найдена та же страница)?

То есть, я хочу изменить все страницы путем добавления нескольких(~15-20) символов в текст и попросить сделать переиндексаю.

В этом случае будут найдены в кеше Сапе совпадающие страницы, или сайт наконец проиндексируется вчистовую?


Часовой пояс GMT +3, время: 14:06.

Работает на vBulletin® версия 3.8.7.
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Перевод: zCarot
SAPE.RU — система купли-продажи ссылок с главных и внутренних страниц сайтов.