Форум SAPE.RU

Форум SAPE.RU (http://forum.sape.ru/index.php)
-   Вопросы от новичков (http://forum.sape.ru/forumdisplay.php?f=25)
-   -   Страницы похожие на другие с этого же сайта (http://forum.sape.ru/showthread.php?t=61923)

lipkiy 24.11.2010 07:49

Страницы похожие на другие с этого же сайта
 
На яндексе около 500 страниц, в сапе нашлись 3 и ещё 16 якобы являются копией, хотя адрес и содержимое отличаются.
Содержимое отличается только описанием фильмов, названием и т.д.. В принципе все страницы разные. Копии ссылаются на одну страницу. Изменил эту страницу, удалил нормальные страницы до переиндексации.
Теперь нашлось 5 нормальных страниц и снова с десяток копий одной страницы (но теперь другой)...
Может быть есть процент разного содержимого по которому исчисляется одинаковость страниц? Есть похожие слова типа "название"
И почему нашёл столь мало страниц :(
Поиск мне не помог... Уже час листаю форум...

BurnLife 24.11.2010 10:33

lipkiy, а сайтмапы делали?

lipkiy 25.11.2010 06:00

XML и ссылку на главной, правда после этого ещё небыло переиндексации, поначалу думал, что код плохо поставил..

Добавлено через 13 часов 21 минуту
Народ?

chahlic 25.11.2010 10:53

Цитата:

Сообщение от lipkiy (Сообщение 959230)
XML и ссылку на главной

Сапе нужна хтмл-карта

ПысЫ: если не собираетесь копии страниц удалять с сайта, то мож урл скинете, я в ГБЛ закину? ;)

BurnLife 25.11.2010 11:07

lipkiy, sape не понимает xml. Разбивайте xml на html по 150 ссылок в каждом и переиндексируйте.

lipkiy 25.11.2010 15:16

Цитата:

Сообщение от chahlic (Сообщение 959832)
ПысЫ: если не собираетесь копии страниц удалять с сайта, то мож урл скинете, я в ГБЛ закину? ;)

Я бы удалил и собираюсь, но как? В смысле не с сайта, а из сапы =) Или кроме как так, больше никак? И это же ветка для новичков... что такое ГБЛ? Яндекс утверждает, что "Горелка газовая блочная"..

BurnLife, разбить xml на html по 150 ссылок это вроде понятно, а потом на все html делать ссылки c главной :confused:

BurnLife 25.11.2010 15:36

lipkiy, ну да. сделали сайтмапы->ccылки поставили на главную->заказали переиндексацию->???->PROFIT!

lipkiy 25.11.2010 15:42

Ладн, вечером попробую, спасибо.
Дык как же от якобы повторов избавится?

chahlic 25.11.2010 16:01

Цитата:

Сообщение от lipkiy (Сообщение 960087)
Дык как же от якобы повторов избавится?

Крутить движок, чтобы не давал индексировать страницы с одинаковым содержанием. Поисковики очень не любят такого и все равно выкидывают их из индекса. Да еще и в таком кол-ве, как 16 штук.....

ПысЫ: ГБЛ: - Global Black list. У каждого ВМ (и О) свой. У ВМ нах-ся здесь :)

lipkiy 25.11.2010 17:56

Дело в том, что страницы разные !!!
Каждая страница имеет разные картинки, разное содержимое (описание).
И схожа только тем, что на каждую страничку подгружается плеер, названия ячеек типа "название, год, и т.д." и тем, что в конце каждой траницы дописывается текст типа оставляйте коментарии, но большего содержания...

Цитата:

Сапа утверждает, что страница "/2010/11/22/nachalo-inception.html" похожа на другие, точнее все следующие страницы являются копией этой.

/2010/09/10/gruzovik-road-train.html
/2010/09/10/ty-ne-znaesh-dzheka-you-dont-know-jack.html
/2010/09/10/vrata-the-hole.html
/2010/09/10/bajker.html
/2010/09/10/killery-killers.html
/2010/09/10/v-centuriya-v-poiskax-zacharovannyx-sokrovishh.html
/2010/09/14/gruppa-riska-at-risk.html
/2010/09/14/front-the-front.html
/2010/10/19/master.html
/2010/11/22/socialnaya-set-the-social-network.html
/2010/10/11/vysota-altitude.html
/2010/09/27/pobeg-iz-vegasa-get-him-to-the-greek.html
/2010/09/18/dvenadcat-twelve.html
/2010/09/22/machete-machete.html


Часовой пояс GMT +3, время: 02:25.

Работает на vBulletin® версия 3.8.7.
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Перевод: zCarot
SAPE.RU — система купли-продажи ссылок с главных и внутренних страниц сайтов.