04.08.2008, 17:53 | #1 |
Новичок
Регистрация: 12.10.2007
Сообщений: 80
Вес репутации: 203
|
robot sape
Я как то писал про систематические ERROR (страница не отвечает) разных страниц, которые стали появляться по утрам и исчезать после дневных проверок. Сайт старый давно в системе и на нём ничего не делалось за это время. Высказывалось много предположений о их происхождении, которые не подтвердились. Велась переписка с хостером, насчёт бана IP и так далее. По сотне раз вовремя индексации роботом sape просматривалась статистика доступа разных страниц сайта с разных стран. Всё показывало, что страницы живенько отвечают.
Количество ссылок между тем росло и уже после дневных проверок стали оставаться ERROR-ы. Сегодня утром было более сотни, днём осталось 10. Я глянул повнимательнее логи доступа и обнаружил, что бот sape слишком часто дёргает страницы. Ну, например 10 запросов за 8 секунд по моему многовато. Или вот 50 запросов за 11 секунд - это уже перебор. id 51612 В связи с этим вопрос к администрации. Нельзя ли сделать так, чтобы робот не дёргал так часто сервер? Отпишитесь у кого такая же проблема. ps Please, не нужно в эту тему постить советы по смене хостера, предлагать выделенные сервера из личного курятника и т.п. |
04.08.2008, 20:14 | #2 |
Специалист
Регистрация: 25.11.2007
Адрес: Москва, Рассея
Сообщений: 297
Вес репутации: 209
|
Коллега, наблюдал у себя аналогичную проблему в течении достаточно длительного времени.
По моему мнению причина была в слишком длительном ожидании ответа страницы боту Сапе на запрос, другими словами страница не отвечала вовремя. Боролся с этой болезнью долго, но ничего не помагало, потом сам по себе выздоровел. Мля, но в дополнение скажу, что запросов к базе My SQL во время одновременных апдейтов ПС и проверок Сапе создавалось столько, что сервер ложился и тихо умирал. |
05.08.2008, 14:39 | #3 |
Новичок
Регистрация: 12.10.2007
Сообщений: 80
Вес репутации: 203
|
50 ответов за 11 секунд - это длительное ожидание? Очень смешно.
|
05.08.2008, 14:51 | #4 |
Мастер
Регистрация: 04.11.2007
Сообщений: 747
Вес репутации: 220
|
Централизованно Системе лучше контролировать количество обращений в минуту на один IP-адрес сервера. Очень было бы полезно! Например, добавил одновременно 4 сайта на индексацию. В этот момент они все одновременно индексируются, и хостер на такой рост посещаемости реагирует неадекватно - временным баном подсети. В итоге сайты необходимо переиндексировать вручную.
Сделайте ограничение роботов Системы на один IP! |
05.08.2008, 15:27 | #5 |
Специалист
Регистрация: 19.06.2008
Сообщений: 111
Вес репутации: 198
|
у себя наблюдал ситуацию в час ночи. сайт работал. зашел- проверил. дальше форум сапы. потом панел ВМ. вижу - все!! ссылки сайта отвалились. на сайте ничего не делал. зашел на сайт - он работает, ссылки нет. проверил через панельку сапы - написало что ссылки размещены. через пару часов ссылки вернулись в ок.
однозначно глюк сапы. вот только где - алгоритм работы или БД. сегодня такая же ситуация повторилась на другом сайте, днем.
__________________
checkbox не поднимать цену... on |
05.08.2008, 19:57 | #6 |
Злой модератор
Регистрация: 25.03.2007
Адрес: Deep forest
Сообщений: 5,343
Вес репутации: 502
|
Скорость сканирования уменьшена не будет и об этом уже было написано - иначе робот не успеет обойти все сайты. Если ошибки возникают именно из-за этого (что далеко не факт еще, кстати) то там же были и полезные рецепты по этому поводу. Поиском то пользоваться никто не любит, и старые темы читать тоже, ага.
Ну так сам и виноват, значит. Куда спешить то? |
05.08.2008, 20:00 | #7 | |
Эксперт
Регистрация: 12.03.2008
Адрес: будете смеяться, но я-таки нерезидент
Сообщений: 2,663
Вес репутации: 296
|
Цитата:
Т.е., сделать нагрузку непиковой по отношению к площадкам. PS: Решение в лоб: Сканировать страницы, номера которых заканчиваются на 0, потом на 1, потом на 2 и т.д.
__________________
|
|
05.08.2008, 22:13 | #8 | ||
Новичок
Регистрация: 12.10.2007
Сообщений: 80
Вес репутации: 203
|
Цитата:
Цитата:
Я пользуюсь поиском и читаю старые темы. Подскажите, где вразумительные решения по этой проблеме? |
||
06.08.2008, 07:55 | #10 |
Мастер
Регистрация: 05.06.2008
Адрес: Somali
Сообщений: 648
Вес репутации: 232
|
Длительно время у себя наблюдал аналогичные эрроры - вылечил перемещением блока сТсылок выше по коду страницы, придя к выводу, что (парадоксально, но факт) бот сапы просто не дожидается пока страница догрузится и бежит дальше, а в момент икс бот нагружает сам сервак так лихо, что тот начинает тормозить и генерить страницы по 50-60 миллисекунд. Кто-то из админов пояснил, что бот ждет не более 30 миллисекунд. Так что пробуйде перекинуть ссылки повыше..
__________________
помог? отблагодари! |
|
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Sape WM Analyzer - увеличьте Ваши продажи в Sape | andrey-k | Вопросы по работе системы | 11 | 27.08.2008 13:43 |
одновременно файл sape.php и SAPE.pm | slovo | Вопросы по работе системы | 23 | 06.03.2008 15:08 |
WinHTTP Robot? | Indigo | Разработка и сопровождение сайтов | 6 | 02.03.2008 18:57 |
Часовой пояс GMT +3, время: 05:12.