15.02.2008, 00:45 | #31 |
Мастер
Регистрация: 08.11.2007
Сообщений: 598
Вес репутации: 213
|
mman какпча капче рознь... можно выкидывать ява окошко через 5 страниц после посмотра с надписью "У нас закралось подозрение что вы робот нажмите цифру три на клавиатуре если это не так" ну а потом в куки прописать nobot=1 если же бот то в базу его .. емея десяток сайтов в сапе за месяц можно будет вычислить всех саповских ботов ... и потом много есть мелких ухищьрений.. чтоб эту табличку подсовывать "теоретическим ботам" ...
И вот еще я уверен что вы напишите бота которого нельзя отловить по поведению для конкретного сайта ... но когда дело дойдет до среднестатистических параметров .. то любое отклонение от них будет приводить бота в .. мм.. замешательство .. что соответственно приведет к массовому появлению тем в форуме о том что хитроробот от сапы не смог промодерить мой сайт и поэтому у меня приостановленны продажи... кроме того любой отход от среднестатистических показателей позволит на раз вычислить бота... Я надеюсь .. вы понимаете о чем я хотю сказать.. ибо объясняюсь я судя по всему достаточно сумбурно... (коньяк знаетели с пивом ) ) . так что извиняюсь за стиль письма. |
15.02.2008, 01:15 | #33 | ||||||
Эксперт
Регистрация: 04.02.2008
Адрес: Neverland
Сообщений: 1,144
Вес репутации: 244
|
Цитата:
2) по каким конкретно признакам вы будете решать, что это бот? Цитата:
Имхо это самый природный путь - наименьшего сопротивления. Можно не удалять, а отсылать сообщение с вашим адресом модератору, который, скорее всего, не будет долго размышлять о причинах такого странного поведения сайта, опять таки, просто удалит вас из базы. Цитата:
Цитата:
Ошибок в работе алгоритма будет немало, особенно в первое время. И в любом случае вам нужно не просто защититься от бота, вам нужно сделать так, чтоб он индексировал сайт ничего не подозревая, но получал несколько другую информацию. Но с такими методами до этого дело просто не дойдет, по вышеописанным причинам. Цитата:
Цитата:
|
||||||
15.02.2008, 02:00 | #34 | ||||
Мастер
Регистрация: 08.11.2007
Сообщений: 598
Вес репутации: 213
|
У нас задача стоит вычислить бота сапы ..по этому
Цитата:
Если есть боты в базе которые ничего не ввели .. и ссылки выпали в еррор .. то один из ботов - это сапа. учитывая что хитроботов очень мало ходит по сайтам то выбор будет небольшим. Дальше всем мы нашу псевдо капчу пихать не будем .. а рассмотрим поведение ... ну во первых как вы понимаете всех товарищей непонимающих яву и поисковики мы отсекли по юзер агенту например.. у нас есть еще хитроробот Яши .. и он единственный кто будет вносить дисбаланс в нашу статистику по хитроботам . Признаки 1. количество просмотренных страниц.. 2.Время проведенное на каждой странице. 3.Откуда пришли.. Сразу откидываем клиентов которые пришли по поисковым запросам . Сразу откидываем клиентов которые провели на странице более 30 секунд +- как вы понимаете. Дальше.. Исходим из предположения . что хитробот от сапы должен посмотреть все страницы .. и тутже его вычлиняем среди других хитроботов . Если же он такой хитрый что просматривает по одной странице в день провобит на ней времени борльше 30 сек.. то мы теоретически его поймать не можем .. допустим.. но и сапа не может быть уверена .. что мы действительно ее обманываем.. по этому ей придется посылать два одновременных бота один простой другой хитрый.. которые одновременно должны зайти на оду и туже страницу .. по данному признаку мы их вычислим.. Конкретика такая.. на мои сайты основной траф идет с поисковиков... с закладок приходя человек 3-5 .. и среди этих 3-5 мне не составит труда вычислить хитробота... вот такая вот конкретика. чтоже касается вышеописанных причин.. то тут вы совершенно правы.. но. Цитата:
Цитата:
если же сапа.. то мы для того и ловим хитробота , чтобы уна не узнала.. ну а за ерроры еще никово не удаляли Цитата:
и среднестатистическими параметрами... Фу чтото я устал писать ... вроде как это должно быть и так понятно ... короче одним словом.. заточив бота под среднестатистический сайт .. вы загоните его в определенные рамки и тогда любая нестандартная ситуация для данного бота позволит его вычислить.. По это я и пишу о том.. что для конкретного сайта можно написать бота который и капчу вскроет и комент интелектуальный всавит.. даже для группы сайтов на одном движке ... но.. если двигать бота в массы .. то вычислить его можно будет. Короче ) я не знаю какая нуджна конкретика .. но самым эфективным способом борьбы был есть и будет элементарный стук... |
||||
15.02.2008, 16:58 | #36 | ||
Эксперт
Регистрация: 04.02.2008
Адрес: Neverland
Сообщений: 1,144
Вес репутации: 244
|
Цитата:
Ведь это логичнее чем вылавливать и тех и других. А если вылавливать только бота сапы и только ему показывать ссылки, то первая ручная проверка отправит сайт в баню. А все вышенаписанное вами интересно и правильно, но мы как бы обсуждали скорее гипотетическую возможность эмуляции поведения человека на сайте, нежели практически. На практическое исполнение ни у каких поисковиков не хватит ресурсов и нет желания это делать. Скорость индексации для них важнее. А по сему вычислить бота Я или G сейчас довольно просто. Я например вычисляю ботов ПС просто по юзерагнту и не показываю информацию которая им абсолютно не будет полезна, которая нужна только людям (например телефоны, аськи, мейлы, физ. адреса в шапке для магазинов, или, например, блок бестселлеров, который только запутывает бота... или комментарии посетителей, дальше 3й страницы... счетчики...). Но не занимаюсь мошенничеством и не обманываю поисковики подсовывая им ключевики или пряча ссылки. Цитата:
|
||
15.02.2008, 17:42 | #37 |
Мастер
Регистрация: 08.11.2007
Сообщений: 598
Вес репутации: 213
|
А про поисковики.. таквы совершенно правильно написали.. я тоже их палю по юзерагенту.. и всякие левые боты по отсутствию оного ..
Из поисковиков известен только хитроробот яндекса.. который имулирует поведение человека.. так вот и не известно .. существует он или нет А что касается всего того что вы написали.. то это в любом случае приравнивается к клоакингу. ) |
15.02.2008, 20:51 | #38 |
Эксперт
Регистрация: 04.02.2008
Адрес: Neverland
Сообщений: 1,144
Вес репутации: 244
|
Нет, это не приравнивается к клоакингу. Хотябы взять первоначальное значение этого слова. Оно тут совершенно противоположно по смыслу тому, что делаю я.
А я дела. одолжение поисковикам, экономя их время и ресурсы для индексирования своего сайта. И знаете, за 3 года ни один поисковик "не был против", скорее наоборот . Ведь иначе клоакингом можно назвать многие вещи даже на крупных порталах, когда по языку браузера или стране IP определяют какую информацию выводить на страницу. Клоакинг - это в первую очередь обман с корыстными целями, достижение которых без обмана было бы невозможным. А я не скрываю своих действий, не считаю их какимто нарушением и с удовольствием бы пользовался средствами, которые бы делали подобную работу но были прописаны какимто стандартом, как <noindex> у яндекса... хотя он все равно не экономит трафик. |
|
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
А зачем у вновь добавляемых площадок "по умолчанию" стоит "скрывать УРЛ"? | Ковалев | Вопросы по работе системы | 6 | 15.12.2008 12:02 |
Тематика "Обучение", язык Укр. - будет толк? | Sanito | Курилка | 9 | 11.07.2008 10:35 |
Яндекс: "То ли ещё будет" | timeout | Курилка | 8 | 27.05.2008 15:15 |
а когда будет "Находка"?) | sni | Курилка | 5 | 20.05.2008 23:48 |
Как внутри акаунта перевести деньги заработанные "вебмастером" на счёт "оптимизатора" | kapa | Вопросы от новичков | 10 | 11.01.2008 17:45 |
Часовой пояс GMT +3, время: 03:07.