Вернуться   Форум SAPE.RU > Система SAPE.ru > Ошибки при работе с системой

-->
Ответ
 
Опции темы
Старый 04.08.2008, 17:53   #1
Новичок
 
Регистрация: 12.10.2007
Сообщений: 80
Вес репутации: 203
Krokus скоро станет известен
По умолчанию robot sape

Я как то писал про систематические ERROR (страница не отвечает) разных страниц, которые стали появляться по утрам и исчезать после дневных проверок. Сайт старый давно в системе и на нём ничего не делалось за это время. Высказывалось много предположений о их происхождении, которые не подтвердились. Велась переписка с хостером, насчёт бана IP и так далее. По сотне раз вовремя индексации роботом sape просматривалась статистика доступа разных страниц сайта с разных стран. Всё показывало, что страницы живенько отвечают.
Количество ссылок между тем росло и уже после дневных проверок стали оставаться ERROR-ы.
Сегодня утром было более сотни, днём осталось 10.
Я глянул повнимательнее логи доступа и обнаружил, что бот sape слишком часто дёргает страницы.
Ну, например 10 запросов за 8 секунд по моему многовато. Или вот 50 запросов за 11 секунд - это уже перебор. id 51612

В связи с этим вопрос к администрации. Нельзя ли сделать так, чтобы робот не дёргал так часто сервер?

Отпишитесь у кого такая же проблема.

ps Please, не нужно в эту тему постить советы по смене хостера, предлагать выделенные сервера из личного курятника и т.п.
Krokus вне форума   Ответить с цитированием
Старый 04.08.2008, 20:14   #2
Специалист
 
Аватар для klimov4382
 
Регистрация: 25.11.2007
Адрес: Москва, Рассея
Сообщений: 297
Вес репутации: 209
klimov4382 - луч света в тёмном царствеklimov4382 - луч света в тёмном царствеklimov4382 - луч света в тёмном царствеklimov4382 - луч света в тёмном царствеklimov4382 - луч света в тёмном царстве
По умолчанию

Коллега, наблюдал у себя аналогичную проблему в течении достаточно длительного времени.
По моему мнению причина была в слишком длительном ожидании ответа страницы боту Сапе на запрос, другими словами страница не отвечала вовремя.
Боролся с этой болезнью долго, но ничего не помагало, потом сам по себе выздоровел.
Мля, но в дополнение скажу, что запросов к базе My SQL во время одновременных апдейтов ПС и проверок Сапе создавалось столько, что сервер ложился и тихо умирал.
klimov4382 вне форума   Ответить с цитированием
Старый 05.08.2008, 14:39   #3
Новичок
 
Регистрация: 12.10.2007
Сообщений: 80
Вес репутации: 203
Krokus скоро станет известен
По умолчанию

Цитата:
Сообщение от klimov4382 Посмотреть сообщение
Коллега, наблюдал у себя аналогичную проблему в течении достаточно длительного времени.
По моему мнению причина была в слишком длительном ожидании ответа страницы боту Сапе на запрос, другими словами страница не отвечала вовремя.
50 ответов за 11 секунд - это длительное ожидание? Очень смешно.
Krokus вне форума   Ответить с цитированием
Старый 05.08.2008, 14:51   #4
Мастер
 
Аватар для big.bon
 
Регистрация: 04.11.2007
Сообщений: 747
Вес репутации: 220
big.bon - это имя известно всемbig.bon - это имя известно всемbig.bon - это имя известно всемbig.bon - это имя известно всемbig.bon - это имя известно всемbig.bon - это имя известно всем
По умолчанию

Централизованно Системе лучше контролировать количество обращений в минуту на один IP-адрес сервера. Очень было бы полезно! Например, добавил одновременно 4 сайта на индексацию. В этот момент они все одновременно индексируются, и хостер на такой рост посещаемости реагирует неадекватно - временным баном подсети. В итоге сайты необходимо переиндексировать вручную.

Сделайте ограничение роботов Системы на один IP!
big.bon вне форума   Ответить с цитированием
Старый 05.08.2008, 15:27   #5
Специалист
 
Аватар для poiuyt
 
Регистрация: 19.06.2008
Сообщений: 111
Вес репутации: 198
poiuyt - как роза среди колючекpoiuyt - как роза среди колючекpoiuyt - как роза среди колючекpoiuyt - как роза среди колючек
По умолчанию

у себя наблюдал ситуацию в час ночи. сайт работал. зашел- проверил. дальше форум сапы. потом панел ВМ. вижу - все!! ссылки сайта отвалились. на сайте ничего не делал. зашел на сайт - он работает, ссылки нет. проверил через панельку сапы - написало что ссылки размещены. через пару часов ссылки вернулись в ок.

однозначно глюк сапы. вот только где - алгоритм работы или БД.
сегодня такая же ситуация повторилась на другом сайте, днем.
__________________
ID: 324807 (5/1700)
checkbox не поднимать цену... on
poiuyt вне форума   Ответить с цитированием
Старый 05.08.2008, 19:57   #6
Злой модератор
 
Аватар для Wink
 
Регистрация: 25.03.2007
Адрес: Deep forest
Сообщений: 5,343
Вес репутации: 502
Wink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущее
По умолчанию

Скорость сканирования уменьшена не будет и об этом уже было написано - иначе робот не успеет обойти все сайты. Если ошибки возникают именно из-за этого (что далеко не факт еще, кстати) то там же были и полезные рецепты по этому поводу. Поиском то пользоваться никто не любит, и старые темы читать тоже, ага.

Цитата:
Сообщение от big.bon Посмотреть сообщение
Например, добавил одновременно 4 сайта на индексацию.
Ну так сам и виноват, значит. Куда спешить то?
Wink вне форума   Ответить с цитированием
Старый 05.08.2008, 20:00   #7
Эксперт
 
Регистрация: 12.03.2008
Адрес: будете смеяться, но я-таки нерезидент
Сообщений: 2,663
Вес репутации: 296
sergbond - прекрасное будущееsergbond - прекрасное будущееsergbond - прекрасное будущееsergbond - прекрасное будущееsergbond - прекрасное будущееsergbond - прекрасное будущееsergbond - прекрасное будущееsergbond - прекрасное будущееsergbond - прекрасное будущееsergbond - прекрасное будущееsergbond - прекрасное будущее
По умолчанию

Цитата:
Сообщение от Wink Посмотреть сообщение
Скорость сканирования уменьшена не будет и об этом уже было написано - иначе робот не успеет обойти все сайты. Если ошибки возникают именно из-за этого (что далеко не факт еще, кстати) то там же были и полезные рецепты по этому поводу.
А зачем скорость сканирования снижать? Надо просто алгоритм слегка поправить: не все страницы подряд (подозреваю, что сейчас сделано именно так), а в разрядку: страница с прощадки А, Б, В и т.д.
Т.е., сделать нагрузку непиковой по отношению к площадкам.

PS: Решение в лоб: Сканировать страницы, номера которых заканчиваются на 0, потом на 1, потом на 2 и т.д.
__________________
Подыскиваю умных реферралов.
sergbond вне форума   Ответить с цитированием
Старый 05.08.2008, 22:13   #8
Новичок
 
Регистрация: 12.10.2007
Сообщений: 80
Вес репутации: 203
Krokus скоро станет известен
По умолчанию

Цитата:
Сообщение от Wink Посмотреть сообщение
Скорость сканирования уменьшена не будет и об этом уже было написано - иначе робот не успеет обойти все сайты.
Скорость не при чём. Обычный ритм робота на моём сайте примерно 4-6 секунд. Потом вдруг начинает дёргать по 2-3 раза в секунду. Это то зачем? А потом вдруг начинает дрочить сервер ещё быстрее. 50 раз в 11 секунд - какая необходимость в такой скорости?
Цитата:
Если ошибки возникают именно из-за этого (что далеко не факт еще, кстати) то там же были и полезные рецепты по этому поводу. Поиском то пользоваться никто не любит, и старые темы читать тоже, ага.
Очевидно, что факт. Чем скоростней сервер, тем радостней робот его дёргает, тем быстрей попадает в бан. У меня один сайт на 30 центовом хостинге, тормозном донельзя. Вот там никаких Эрроров не наблюдал.
Я пользуюсь поиском и читаю старые темы. Подскажите, где вразумительные решения по этой проблеме?
Krokus вне форума   Ответить с цитированием
Старый 05.08.2008, 22:31   #9
Специалист
 
Регистрация: 23.04.2008
Сообщений: 119
Вес репутации: 199
Lorenz - весьма и весьма положительная личностьLorenz - весьма и весьма положительная личностьLorenz - весьма и весьма положительная личность
По умолчанию

нинаю, я добавлял 3 сайта одновременно с одного хостера, проблем не было, не пинайте ногами, но проблема в хостере, на мой взгляд..(
Lorenz вне форума   Ответить с цитированием
Старый 06.08.2008, 07:55   #10
Мастер
 
Аватар для Hanapi
 
Регистрация: 05.06.2008
Адрес: Somali
Сообщений: 648
Вес репутации: 232
Hanapi - прекрасное будущееHanapi - прекрасное будущееHanapi - прекрасное будущееHanapi - прекрасное будущееHanapi - прекрасное будущееHanapi - прекрасное будущееHanapi - прекрасное будущееHanapi - прекрасное будущееHanapi - прекрасное будущееHanapi - прекрасное будущееHanapi - прекрасное будущее
По умолчанию

Длительно время у себя наблюдал аналогичные эрроры - вылечил перемещением блока сТсылок выше по коду страницы, придя к выводу, что (парадоксально, но факт) бот сапы просто не дожидается пока страница догрузится и бежит дальше, а в момент икс бот нагружает сам сервак так лихо, что тот начинает тормозить и генерить страницы по 50-60 миллисекунд. Кто-то из админов пояснил, что бот ждет не более 30 миллисекунд. Так что пробуйде перекинуть ссылки повыше..
__________________
хостинг с root доступом
помог? отблагодари!
Hanapi вне форума   Ответить с цитированием
Ответ


Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход

Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Sape WM Analyzer - увеличьте Ваши продажи в Sape andrey-k Вопросы по работе системы 11 27.08.2008 13:43
одновременно файл sape.php и SAPE.pm slovo Вопросы по работе системы 23 06.03.2008 15:08
WinHTTP Robot? Indigo Разработка и сопровождение сайтов 6 02.03.2008 18:57


Часовой пояс GMT +3, время: 05:12.