Как в Сапе определяется похожесть страниц с уже закешированными?
Ситуация:
Проиндексировал сайт в Сапе, когда на сайте были некрасивые технические URL на 200-300 символов. Такие страницы никто не покупал. Месяц назад поменял систему адресации на сайте, URL стали короткие (30 символов). После чего переиндексировал сайт и обнаружил следующую особенность Сапы: в Сапе есть кеш страниц, и при индексации происходит сравнение с кешем. И если в кеше найдена страница с таким же содержанием, то она добавляется в список страниц по старому URL. В результате у меня опять в списке страниц все URL-ы старые технические на 200-300 символов. Я выделял все эти старые страницы и применял им действия "Удалить страницы навсегда". Но при последующей индексации они опять находились в кеше Сапы и снова добавлялись под длинными техническими URL-ами. Техподдержка ответила что так и должно быть, и нет возможности переиндексировать сайт "вчистовую", без вспоминания старых URL уже внесенных в кеш Сапы страниц. * * * В связи с вышесказанным, хочу спросить. Кто-нибудь знает, как в Сапе определяется "похожесть" закешированных в базе страниц? По точному совпадению слепка текстового содержания? По проценту отличий (например, 95% - считается что найдена та же страница)? То есть, я хочу изменить все страницы путем добавления нескольких(~15-20) символов в текст и попросить сделать переиндексаю. В этом случае будут найдены в кеше Сапе совпадающие страницы, или сайт наконец проиндексируется вчистовую? |
Часовой пояс GMT +3, время: 14:06. |
Работает на vBulletin® версия 3.8.7.
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Перевод: zCarot
SAPE.RU — система купли-продажи ссылок с главных и внутренних страниц сайтов.