Вернуться   Форум SAPE.RU > Система SAPE.ru > Пожелания пользователей системы

-->
Ответ
 
Опции темы
Старый 10.06.2009, 12:26   #101
Мастер
 
Регистрация: 17.03.2008
Сообщений: 638
Вес репутации: 236
ahsinis - прекрасное будущееahsinis - прекрасное будущееahsinis - прекрасное будущееahsinis - прекрасное будущееahsinis - прекрасное будущееahsinis - прекрасное будущееahsinis - прекрасное будущееahsinis - прекрасное будущееahsinis - прекрасное будущееahsinis - прекрасное будущееahsinis - прекрасное будущее
По умолчанию

да не надо сравнивать поисковые роботы и робот сапы.
поисковые роботы могут приходить раз в месяц, скачать несколько страниц и все.
сапа скачивает сайт два раза в сутки
вопрос только - почему сайт надо скачивать за несколько минут, вызывая "раздражения хостеров"
ahsinis вне форума   Ответить с цитированием
Старый 10.06.2009, 12:31   #102
Bannеd
 
Регистрация: 17.09.2008
Сообщений: 6,446
Вес репутации: 368
Последний Герой - прекрасное будущееПоследний Герой - прекрасное будущееПоследний Герой - прекрасное будущееПоследний Герой - прекрасное будущееПоследний Герой - прекрасное будущееПоследний Герой - прекрасное будущееПоследний Герой - прекрасное будущееПоследний Герой - прекрасное будущееПоследний Герой - прекрасное будущееПоследний Герой - прекрасное будущееПоследний Герой - прекрасное будущее
По умолчанию

Цитата:
Сообщение от ahsinis Посмотреть сообщение
вопрос только - почему сайт надо скачивать за несколько минут, вызывая "раздражения хостеров"
текущий робот сапы берет только 1 страницу с сайта за раз
можно просто умышленно замедлить ответ вставив в конец скрипта flush и sleep, а значит замедлится и сканирование сайта
Последний Герой вне форума   Ответить с цитированием
Старый 10.06.2009, 13:03   #103
Новичок
 
Регистрация: 30.01.2008
Сообщений: 68
Вес репутации: 201
www32 - весьма и весьма положительная личностьwww32 - весьма и весьма положительная личностьwww32 - весьма и весьма положительная личность
По умолчанию

объясните, почему боты Sapient Solution не могут сканировать страницы разных пользователей рандомно, так как это делают УМНЫЕ боты поисковых систем?

И не говорите мне, что боты поисковиков заходят раз в неделю и индексируют пару страниц. Возможно это и правда для говносайта, но у меня информационные ресурсы, на которых за сутки появляются десятки тысяч новых страниц и практически моментально они появляются в результатах поиска Гугле, а через какое-то время и в других поисковиках. Нагрузка на сервер нормальная, только во время сканирования сапой возникают пиковые нагрузки. Это не перегружает сервер и не останавливает работу сайтов, но реальные проблемы возникнут тогда когда такая пиковая нагрузка от сапы будет случайно накладываться на другие нагрузки.

Это же максимум день работы, а в результате будут счастливы тысячи пользователей, десятки хостеров, служба поддержки Сапы не будет получать сообщений и жалоб об Errors на площадках, на форуме можно будет закрыть целый раздел из-за отсутствия проблем.
www32 вне форума   Ответить с цитированием
Старый 10.06.2009, 13:35   #104
Мастер
 
Регистрация: 17.03.2008
Сообщений: 638
Вес репутации: 236
ahsinis - прекрасное будущееahsinis - прекрасное будущееahsinis - прекрасное будущееahsinis - прекрасное будущееahsinis - прекрасное будущееahsinis - прекрасное будущееahsinis - прекрасное будущееahsinis - прекрасное будущееahsinis - прекрасное будущееahsinis - прекрасное будущееahsinis - прекрасное будущее
По умолчанию

www32, потому что гуглу "по-барабану", когда он просканирует ваши страницы, вот он и раскидывает посещения на протяжении суток.
А сапа "обязана" просканировать два раза в сутки (Сетлинкс вон заявляет, что каждый час ссылки проверяет). Согласитесь, маленько разные задачи?
ahsinis вне форума   Ответить с цитированием
Старый 10.06.2009, 13:35   #105
Добрый модератор
 
Аватар для zhegloff
 
Регистрация: 09.07.2007
Адрес: глобус Украины
Сообщений: 27,600
Вес репутации: 1025
zhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущее
По умолчанию

Цитата:
Сообщение от www32 Посмотреть сообщение
Это же максимум день работы,
Сразу видно профессионального программиста...

Разработка нового робота идет, но это не день и не неделя работы.
__________________
Установка кода сапы от $9.95. Пишите в личку.
Правильный хостинг.
В личке бесплатно не отвечаю обычно.
zhegloff вне форума   Ответить с цитированием
Старый 10.06.2009, 14:13   #106
Новичок
 
Регистрация: 24.09.2007
Сообщений: 50
Вес репутации: 203
nickolas на пути к лучшему
По умолчанию

Речь же не о том, чтобы замедлить работу сапабота, а о том, чтобы рендомно делать проверки страниц РАЗНЫХ сайтов, а не подряд идти по сайту с максимальной скоростью...

Добавлено через 48 секунд
Цитата:
Разработка нового робота идет, но это не день и не неделя работы.
Спасибо большое, это и хотелось услышать! )

Последний раз редактировалось nickolas; 10.06.2009 в 14:13. Причина: Добавлено сообщение
nickolas вне форума   Ответить с цитированием
Старый 10.06.2009, 20:35   #107
Bannеd
 
Регистрация: 17.09.2008
Сообщений: 6,446
Вес репутации: 368
Последний Герой - прекрасное будущееПоследний Герой - прекрасное будущееПоследний Герой - прекрасное будущееПоследний Герой - прекрасное будущееПоследний Герой - прекрасное будущееПоследний Герой - прекрасное будущееПоследний Герой - прекрасное будущееПоследний Герой - прекрасное будущееПоследний Герой - прекрасное будущееПоследний Герой - прекрасное будущееПоследний Герой - прекрасное будущее
По умолчанию

Цитата:
Сообщение от nickolas Посмотреть сообщение
чтобы рендомно делать проверки страниц РАЗНЫХ сайтов
1) увеличится нагрузка на ЦП
2) как построить такую очередь проверки, если ссылки постоянно покупаются и снимаются? это непростая задача. единственное решение пришедшее мне в голову, которое подходит для таких размеров проверки, это создать в базе еще один индекс - md5-сумму от айди страницы - тогда в обычном лексикографическом порядке по md5 страницы будут расположены хаотически, но это плохое решение

P.S. возникает интересный вопрос, а как найти такой порядок для md5-хешей, в котором исходные данные (наименьшая последовательность данных соответствующая хешу) идут в обычном лексикографическом порядке.
Последний Герой вне форума   Ответить с цитированием
Старый 10.06.2009, 20:58   #108
Bannеd
 
Регистрация: 17.09.2008
Сообщений: 6,446
Вес репутации: 368
Последний Герой - прекрасное будущееПоследний Герой - прекрасное будущееПоследний Герой - прекрасное будущееПоследний Герой - прекрасное будущееПоследний Герой - прекрасное будущееПоследний Герой - прекрасное будущееПоследний Герой - прекрасное будущееПоследний Герой - прекрасное будущееПоследний Герой - прекрасное будущееПоследний Герой - прекрасное будущееПоследний Герой - прекрасное будущее
По умолчанию

Цитата:
Сообщение от slva200 Посмотреть сообщение
Это будет обозначать, что любой БОТ попадая на ваш сайт
это делает robots.txt недействительным и все
Последний Герой вне форума   Ответить с цитированием
Старый 10.06.2009, 21:23   #109
Специалист
 
Аватар для pinkponk
 
Регистрация: 03.05.2008
Сообщений: 109
Вес репутации: 0
pinkponk не любят в этих краяхpinkponk не любят в этих краях
По умолчанию

другие сайты работают. надо попробывать уменьшить кол-во ссылок
pinkponk вне форума   Ответить с цитированием
Старый 11.06.2009, 00:50   #110
Специалист
 
Регистрация: 27.02.2009
Сообщений: 400
Вес репутации: 201
Grand1234 - просто великолепная личностьGrand1234 - просто великолепная личностьGrand1234 - просто великолепная личностьGrand1234 - просто великолепная личностьGrand1234 - просто великолепная личностьGrand1234 - просто великолепная личностьGrand1234 - просто великолепная личность
По умолчанию

Цитата:
Сообщение от Последний Герой Посмотреть сообщение
это делает robots.txt недействительным и все
С какого такого перепугу?

http://webmaster.ya.ru/replies.xml?item_no=1338
Grand1234 вне форума   Ответить с цитированием
Ответ


Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход

Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Робот Сапы и Crawl-delay Sea Вопросы по работе системы 10 13.02.2012 12:17
Робот сапы не видит установленный код karizma Установка кода на различные движки 7 16.07.2009 11:22
Понимает ли робот сапы allow в robots.txt? Danila Вопросы по работе системы 6 04.02.2009 17:59
робот сапы не видит ссылки stremlenie1 Ошибки при работе с системой 2 26.11.2008 13:22
Робот сапы не видит код на .narod.ru Эмка Ошибки при работе с системой 2 23.10.2008 11:47


Часовой пояс GMT +3, время: 00:24.