Вернуться   Форум SAPE.RU > Практика оптимизации > Софт для оптимизаторов и вебмастеров

-->
Ответ
 
Опции темы
Старый 01.03.2010, 18:43   #1
Новичок
 
Регистрация: 26.12.2008
Сообщений: 19
Вес репутации: 0
DeamonShan на пути к лучшему
По умолчанию Вытаскивание всех проиндексированных ссылок сайта из Яндекс

Всем известно, что ПС Яндекс на выдаче выдает максимум 1000 результатов. В общем написан скрипт, который дергает абсолютно все ссылки сайта из ПС. Есть тут заинтересованные лица?

Для чего нужно? Имея такой список, можно регулировать поведения индексатора сапы, так чтобы он добавлял не все подряд найденные страницы, а именно те, которые находятся в поисковой системе.
DeamonShan вне форума   Ответить с цитированием
Старый 01.03.2010, 18:51   #2
Эксперт
 
Регистрация: 13.05.2008
Сообщений: 7,497
Вес репутации: 386
Апокалипсис - прекрасное будущееАпокалипсис - прекрасное будущееАпокалипсис - прекрасное будущееАпокалипсис - прекрасное будущееАпокалипсис - прекрасное будущееАпокалипсис - прекрасное будущееАпокалипсис - прекрасное будущееАпокалипсис - прекрасное будущееАпокалипсис - прекрасное будущееАпокалипсис - прекрасное будущееАпокалипсис - прекрасное будущее
По умолчанию

Приму в дар.
Апокалипсис вне форума   Ответить с цитированием
Старый 01.03.2010, 18:58   #3
Специалист
 
Регистрация: 19.03.2009
Сообщений: 147
Вес репутации: 187
sitestyler - весьма и весьма положительная личностьsitestyler - весьма и весьма положительная личность
Отправить сообщение для sitestyler с помощью ICQ
По умолчанию

Цитата:
Сообщение от DeamonShan Посмотреть сообщение
Яндекс на выдаче выдает максимум 1000 результатов. В общем написан скрипт, который дергает абсолютно все ссылки сайта из ПС
Не совсем понятно. На выходе у скрипта имеем 1000 страниц сайта, которые в индексе яши, или каждая из тысячи страниц парсится и на выходе имеем полный список внешних ссылок с тех страниц сайта, которые в индексе?
sitestyler вне форума   Ответить с цитированием
Старый 01.03.2010, 19:29   #4
Новичок
 
Регистрация: 19.01.2009
Сообщений: 43
Вес репутации: 186
ig0r на пути к лучшему
По умолчанию

Цитата:
Сообщение от sitestyler Посмотреть сообщение
Не совсем понятно. На выходе у скрипта имеем 1000 страниц сайта, которые в индексе яши, или каждая из тысячи страниц парсится и на выходе имеем полный список внешних ссылок с тех страниц сайта, которые в индексе?
Скрипт вытаскивает все страницы которые проиндексировал Яндекс. Если в яшке 15000 страниц, скрипт выдаст список из 15000 страниц.
ig0r вне форума   Ответить с цитированием
Старый 01.03.2010, 19:46   #5
Новичок
 
Регистрация: 26.12.2008
Сообщений: 19
Вес репутации: 0
DeamonShan на пути к лучшему
По умолчанию

Ig0r верно заметил...
DeamonShan вне форума   Ответить с цитированием
Старый 01.03.2010, 20:05   #6
Эксперт
 
Аватар для MonAmur
 
Регистрация: 03.07.2007
Адрес: Chinatown
Сообщений: 7,265
Вес репутации: 609
MonAmur - прекрасное будущееMonAmur - прекрасное будущееMonAmur - прекрасное будущееMonAmur - прекрасное будущееMonAmur - прекрасное будущееMonAmur - прекрасное будущееMonAmur - прекрасное будущееMonAmur - прекрасное будущееMonAmur - прекрасное будущееMonAmur - прекрасное будущееMonAmur - прекрасное будущее
По умолчанию

я заинтересован...
MonAmur вне форума   Ответить с цитированием
Старый 01.03.2010, 21:56   #7
Специалист
 
Регистрация: 19.03.2009
Сообщений: 147
Вес репутации: 187
sitestyler - весьма и весьма положительная личностьsitestyler - весьма и весьма положительная личность
Отправить сообщение для sitestyler с помощью ICQ
По умолчанию

Цитата:
Сообщение от ig0r Посмотреть сообщение
Скрипт вытаскивает все страницы которые проиндексировал Яндекс. Если в яшке 15000 страниц, скрипт выдаст список из 15000 страниц.
На выходе имеем что-то типа sitemap.xml (яндексовская карта сайта) содержащий только проиндексированные яшей страницы.
И каким же образом можно его использовать для управления саповским индексатором?
sitestyler вне форума   Ответить с цитированием
Старый 01.03.2010, 21:57   #8
Эксперт
 
Регистрация: 13.05.2008
Сообщений: 7,497
Вес репутации: 386
Апокалипсис - прекрасное будущееАпокалипсис - прекрасное будущееАпокалипсис - прекрасное будущееАпокалипсис - прекрасное будущееАпокалипсис - прекрасное будущееАпокалипсис - прекрасное будущееАпокалипсис - прекрасное будущееАпокалипсис - прекрасное будущееАпокалипсис - прекрасное будущееАпокалипсис - прекрасное будущееАпокалипсис - прекрасное будущее
По умолчанию

sitestyler, разбить на файлы по 150
Апокалипсис вне форума   Ответить с цитированием
Старый 01.03.2010, 23:22   #9
Новичок
 
Регистрация: 09.01.2010
Сообщений: 39
Вес репутации: 174
seomika на пути к лучшему
Отправить сообщение для seomika с помощью ICQ
По умолчанию

Прошу прощения, если я неправильно понял смысл этого
Цитата:
Сообщение от Апокалипсис Посмотреть сообщение
sitestyler, разбить на файлы по 150
,
или всей темы, но разбитие этого хмл файла, на карты по 150 не исключает того, что сапа скушает страницы, которые не в этих картах...(ИМХО)
seomika вне форума   Ответить с цитированием
Старый 01.03.2010, 23:25   #10
Эксперт
 
Регистрация: 13.05.2008
Сообщений: 7,497
Вес репутации: 386
Апокалипсис - прекрасное будущееАпокалипсис - прекрасное будущееАпокалипсис - прекрасное будущееАпокалипсис - прекрасное будущееАпокалипсис - прекрасное будущееАпокалипсис - прекрасное будущееАпокалипсис - прекрасное будущееАпокалипсис - прекрасное будущееАпокалипсис - прекрасное будущееАпокалипсис - прекрасное будущееАпокалипсис - прекрасное будущее
По умолчанию

seomika, сапа кушает по 150 ссылок со стр. в хтмл формате, а не в xml.
ТС, ау, где условия предоставления скрипта?
Апокалипсис вне форума   Ответить с цитированием
Ответ


Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход

Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Sitemap и количество проиндексированных страниц сайта Fason Общие вопросы оптимизации 11 23.09.2009 01:55
Получить список ВСЕХ ссылок sape для сайта(ов)? Shasoft Вопросы по работе системы 2 12.12.2008 13:01
Как получить список проиндексированных страниц сайта в Яндекс? anb2005 Яндекс 12 23.09.2008 00:02
Нет проиндексированных ссылок dibart Вопросы по работе системы 3 13.03.2008 13:18
От сайта осталось 5 проиндексированных страниц, что делать? Latin Яндекс 68 01.01.2008 18:50


Часовой пояс GMT +3, время: 02:22.