10.06.2009, 12:26 | #101 |
Мастер
Регистрация: 17.03.2008
Сообщений: 638
Вес репутации: 236
|
да не надо сравнивать поисковые роботы и робот сапы.
поисковые роботы могут приходить раз в месяц, скачать несколько страниц и все. сапа скачивает сайт два раза в сутки вопрос только - почему сайт надо скачивать за несколько минут, вызывая "раздражения хостеров" |
10.06.2009, 12:31 | #102 |
Bannеd
Регистрация: 17.09.2008
Сообщений: 6,446
Вес репутации: 368
|
|
10.06.2009, 13:03 | #103 |
Новичок
Регистрация: 30.01.2008
Сообщений: 68
Вес репутации: 201
|
объясните, почему боты Sapient Solution не могут сканировать страницы разных пользователей рандомно, так как это делают УМНЫЕ боты поисковых систем?
И не говорите мне, что боты поисковиков заходят раз в неделю и индексируют пару страниц. Возможно это и правда для говносайта, но у меня информационные ресурсы, на которых за сутки появляются десятки тысяч новых страниц и практически моментально они появляются в результатах поиска Гугле, а через какое-то время и в других поисковиках. Нагрузка на сервер нормальная, только во время сканирования сапой возникают пиковые нагрузки. Это не перегружает сервер и не останавливает работу сайтов, но реальные проблемы возникнут тогда когда такая пиковая нагрузка от сапы будет случайно накладываться на другие нагрузки. Это же максимум день работы, а в результате будут счастливы тысячи пользователей, десятки хостеров, служба поддержки Сапы не будет получать сообщений и жалоб об Errors на площадках, на форуме можно будет закрыть целый раздел из-за отсутствия проблем. |
10.06.2009, 13:35 | #104 |
Мастер
Регистрация: 17.03.2008
Сообщений: 638
Вес репутации: 236
|
www32, потому что гуглу "по-барабану", когда он просканирует ваши страницы, вот он и раскидывает посещения на протяжении суток.
А сапа "обязана" просканировать два раза в сутки (Сетлинкс вон заявляет, что каждый час ссылки проверяет). Согласитесь, маленько разные задачи? |
10.06.2009, 13:35 | #105 |
Добрый модератор
Регистрация: 09.07.2007
Адрес: глобус Украины
Сообщений: 27,600
Вес репутации: 1025
|
Сразу видно профессионального программиста...
Разработка нового робота идет, но это не день и не неделя работы.
__________________
Правильный хостинг. В личке бесплатно не отвечаю обычно. |
10.06.2009, 14:13 | #106 | |
Новичок
Регистрация: 24.09.2007
Сообщений: 50
Вес репутации: 203
|
Речь же не о том, чтобы замедлить работу сапабота, а о том, чтобы рендомно делать проверки страниц РАЗНЫХ сайтов, а не подряд идти по сайту с максимальной скоростью...
Добавлено через 48 секунд Цитата:
Последний раз редактировалось nickolas; 10.06.2009 в 14:13. Причина: Добавлено сообщение |
|
10.06.2009, 20:35 | #107 |
Bannеd
Регистрация: 17.09.2008
Сообщений: 6,446
Вес репутации: 368
|
1) увеличится нагрузка на ЦП
2) как построить такую очередь проверки, если ссылки постоянно покупаются и снимаются? это непростая задача. единственное решение пришедшее мне в голову, которое подходит для таких размеров проверки, это создать в базе еще один индекс - md5-сумму от айди страницы - тогда в обычном лексикографическом порядке по md5 страницы будут расположены хаотически, но это плохое решение P.S. возникает интересный вопрос, а как найти такой порядок для md5-хешей, в котором исходные данные (наименьшая последовательность данных соответствующая хешу) идут в обычном лексикографическом порядке. |
10.06.2009, 20:58 | #108 |
Bannеd
Регистрация: 17.09.2008
Сообщений: 6,446
Вес репутации: 368
|
|
11.06.2009, 00:50 | #110 |
Специалист
Регистрация: 27.02.2009
Сообщений: 400
Вес репутации: 201
|
|
|
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Робот Сапы и Crawl-delay | Sea | Вопросы по работе системы | 10 | 13.02.2012 12:17 |
Робот сапы не видит установленный код | karizma | Установка кода на различные движки | 7 | 16.07.2009 11:22 |
Понимает ли робот сапы allow в robots.txt? | Danila | Вопросы по работе системы | 6 | 04.02.2009 17:59 |
робот сапы не видит ссылки | stremlenie1 | Ошибки при работе с системой | 2 | 26.11.2008 13:22 |
Робот сапы не видит код на .narod.ru | Эмка | Ошибки при работе с системой | 2 | 23.10.2008 11:47 |
Часовой пояс GMT +3, время: 00:24.