Форум SAPE.RU

Форум SAPE.RU (http://forum.sape.ru/index.php)
-   Софт для оптимизаторов и вебмастеров (http://forum.sape.ru/forumdisplay.php?f=36)
-   -   Вытаскивание всех проиндексированных ссылок сайта из Яндекс (http://forum.sape.ru/showthread.php?t=47908)

DeamonShan 01.03.2010 18:43

Вытаскивание всех проиндексированных ссылок сайта из Яндекс
 
Всем известно, что ПС Яндекс на выдаче выдает максимум 1000 результатов. В общем написан скрипт, который дергает абсолютно все ссылки сайта из ПС. Есть тут заинтересованные лица?

Для чего нужно? Имея такой список, можно регулировать поведения индексатора сапы, так чтобы он добавлял не все подряд найденные страницы, а именно те, которые находятся в поисковой системе.

Апокалипсис 01.03.2010 18:51

Приму в дар. :rolleyes:

sitestyler 01.03.2010 18:58

Цитата:

Сообщение от DeamonShan (Сообщение 743931)
Яндекс на выдаче выдает максимум 1000 результатов. В общем написан скрипт, который дергает абсолютно все ссылки сайта из ПС

Не совсем понятно. На выходе у скрипта имеем 1000 страниц сайта, которые в индексе яши, или каждая из тысячи страниц парсится и на выходе имеем полный список внешних ссылок с тех страниц сайта, которые в индексе?

ig0r 01.03.2010 19:29

Цитата:

Сообщение от sitestyler (Сообщение 743943)
Не совсем понятно. На выходе у скрипта имеем 1000 страниц сайта, которые в индексе яши, или каждая из тысячи страниц парсится и на выходе имеем полный список внешних ссылок с тех страниц сайта, которые в индексе?

Скрипт вытаскивает все страницы которые проиндексировал Яндекс. Если в яшке 15000 страниц, скрипт выдаст список из 15000 страниц.

DeamonShan 01.03.2010 19:46

Ig0r верно заметил...

MonAmur 01.03.2010 20:05

я заинтересован...

sitestyler 01.03.2010 21:56

Цитата:

Сообщение от ig0r (Сообщение 743964)
Скрипт вытаскивает все страницы которые проиндексировал Яндекс. Если в яшке 15000 страниц, скрипт выдаст список из 15000 страниц.

На выходе имеем что-то типа sitemap.xml (яндексовская карта сайта) содержащий только проиндексированные яшей страницы.
И каким же образом можно его использовать для управления саповским индексатором?

Апокалипсис 01.03.2010 21:57

sitestyler, разбить на файлы по 150

seomika 01.03.2010 23:22

Прошу прощения, если я неправильно понял смысл этого
Цитата:

Сообщение от Апокалипсис (Сообщение 744165)
sitestyler, разбить на файлы по 150

,
или всей темы, но разбитие этого хмл файла, на карты по 150 не исключает того, что сапа скушает страницы, которые не в этих картах...(ИМХО)

Апокалипсис 01.03.2010 23:25

seomika, сапа кушает по 150 ссылок со стр. в хтмл формате, а не в xml.
ТС, ау, где условия предоставления скрипта?


Часовой пояс GMT +3, время: 17:17.

Работает на vBulletin® версия 3.8.7.
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Перевод: zCarot
SAPE.RU — система купли-продажи ссылок с главных и внутренних страниц сайтов.