Вернуться   Форум SAPE.RU > Система SAPE.ru > Пожелания пользователей системы

-->
Ответ
 
Опции темы
Старый 15.02.2008, 00:45   #31
Мастер
 
Регистрация: 08.11.2007
Сообщений: 598
Вес репутации: 213
Kent скоро станет известенKent скоро станет известен
По умолчанию

mman какпча капче рознь... можно выкидывать ява окошко через 5 страниц после посмотра с надписью "У нас закралось подозрение что вы робот нажмите цифру три на клавиатуре если это не так" ну а потом в куки прописать nobot=1 если же бот то в базу его .. емея десяток сайтов в сапе за месяц можно будет вычислить всех саповских ботов ... и потом много есть мелких ухищьрений.. чтоб эту табличку подсовывать "теоретическим ботам" ...
И вот еще я уверен что вы напишите бота которого нельзя отловить по поведению для конкретного сайта ... но когда дело дойдет до среднестатистических параметров .. то любое отклонение от них будет приводить бота в .. мм.. замешательство .. что соответственно приведет к массовому появлению тем в форуме о том что хитроробот от сапы не смог промодерить мой сайт и поэтому у меня приостановленны продажи... кроме того любой отход от среднестатистических показателей позволит на раз вычислить бота...
Я надеюсь .. вы понимаете о чем я хотю сказать.. ибо объясняюсь я судя по всему достаточно сумбурно... (коньяк знаетели с пивом ) ) . так что извиняюсь за стиль письма.
Kent вне форума   Ответить с цитированием
Старый 15.02.2008, 00:48   #32
Мастер
 
Регистрация: 08.11.2007
Сообщений: 598
Вес репутации: 213
Kent скоро станет известенKent скоро станет известен
По умолчанию

Цитата:
Kent, я это же писал еще на первой странице
ну
1. Я Барыкину писал.. вам просто отцитировал..
2. Надеюсь выы не думаете положить копирайт на данное утверждение ?
Kent вне форума   Ответить с цитированием
Старый 15.02.2008, 01:15   #33
Эксперт
 
Аватар для mman
 
Регистрация: 04.02.2008
Адрес: Neverland
Сообщений: 1,144
Вес репутации: 244
mman - прекрасное будущееmman - прекрасное будущееmman - прекрасное будущееmman - прекрасное будущееmman - прекрасное будущееmman - прекрасное будущееmman - прекрасное будущееmman - прекрасное будущееmman - прекрасное будущееmman - прекрасное будущееmman - прекрасное будущее
По умолчанию

Цитата:
можно выкидывать ява окошко через 5 страниц после посмотра с надписью "У нас закралось подозрение что вы робот нажмите цифру три на клавиатуре если это не так" ну а потом в куки прописать nobot=1 если же бот то в базу его ..
1) что будет происходить, если человек или робот не станет ничего вводить? Там не предполагается кнопки "Отмена"?
2) по каким конкретно признакам вы будете решать, что это бот?

Цитата:
емея десяток сайтов в сапе за месяц можно будет вычислить всех саповских ботов ...
Мне кажется, поисковикам будет проще определить у вас защиту от ботов. А раз вы от них защищаетесь, то они не станут настаивать и тревожить вас, а просто удалят сайт из базы.
Имхо это самый природный путь - наименьшего сопротивления.
Можно не удалять, а отсылать сообщение с вашим адресом модератору, который, скорее всего, не будет долго размышлять о причинах такого странного поведения сайта, опять таки, просто удалит вас из базы.

Цитата:
и потом много есть мелких ухищьрений.. чтоб эту табличку подсовывать "теоретическим ботам" ...
И все до того момента, пока у системы не закрадется мнение, что вы что-то прячете от ботов и они вас не удалят.

Цитата:
И вот еще я уверен что вы напишите бота которого нельзя отловить по поведению для конкретного сайта ... но когда дело дойдет до среднестатистических параметров .. то любое отклонение от них будет приводить бота в .. мм.. замешательство .. что соответственно приведет к массовому появлению тем в форуме о том что хитроробот от сапы не смог промодерить мой сайт и поэтому у меня приостановленны продажи... кроме того любой отход от среднестатистических показателей позволит на раз вычислить бота...
Вы наверное заметили, что я люблю конкретику? . Меня тут же интересует какие именно "среднестатистические параметры" вы хотите учитывать? Среднестатистикеское кол-во просматриваемых страниц с одного IP?
Ошибок в работе алгоритма будет немало, особенно в первое время. И в любом случае вам нужно не просто защититься от бота, вам нужно сделать так, чтоб он индексировал сайт ничего не подозревая, но получал несколько другую информацию. Но с такими методами до этого дело просто не дойдет, по вышеописанным причинам.

Цитата:
Я надеюсь .. вы понимаете о чем я хотю сказать.. ибо объясняюсь я судя по всему достаточно сумбурно... (коньяк знаетели с пивом ) ) . так что извиняюсь за стиль письма.
Вполне понятно, только не хватает деталей .

Цитата:
2. Надеюсь выы не думаете положить копирайт на данное утверждение ?
Нет конечно же
mman вне форума   Ответить с цитированием
Старый 15.02.2008, 02:00   #34
Мастер
 
Регистрация: 08.11.2007
Сообщений: 598
Вес репутации: 213
Kent скоро станет известенKent скоро станет известен
По умолчанию

У нас задача стоит вычислить бота сапы ..по этому
Цитата:
что будет происходить, если человек или робот не станет ничего вводить? Там не предполагается кнопки "Отмена"?
нет кнопки отмена нет .. если челововек(хитробот) ввел не то число.. то еще сколькото страниц подсовываем ему табличку ... если все время неправильно.. то помечаем как бот ... если яву вообще не понимает то тоже как бот. Если ничего не вводить то и перехода не будет. + записываем в базу.
Если есть боты в базе которые ничего не ввели .. и ссылки выпали в еррор .. то один из ботов - это сапа. учитывая что хитроботов очень мало ходит по сайтам то выбор будет небольшим.
Дальше всем мы нашу псевдо капчу пихать не будем .. а рассмотрим поведение ... ну во первых как вы понимаете всех товарищей непонимающих яву и поисковики мы отсекли по юзер агенту например.. у нас есть еще хитроробот Яши .. и он единственный кто будет вносить дисбаланс в нашу статистику по хитроботам .
Признаки
1. количество просмотренных страниц..
2.Время проведенное на каждой странице.
3.Откуда пришли..
Сразу откидываем клиентов которые пришли по поисковым запросам .
Сразу откидываем клиентов которые провели на странице более 30 секунд +- как вы понимаете.
Дальше.. Исходим из предположения . что хитробот от сапы должен посмотреть все страницы .. и тутже его вычлиняем среди других хитроботов .
Если же он такой хитрый что просматривает по одной странице в день провобит на ней времени борльше 30 сек.. то мы теоретически его поймать не можем .. допустим..
но и сапа не может быть уверена .. что мы действительно ее обманываем.. по этому ей придется посылать два одновременных бота один простой другой хитрый.. которые одновременно должны зайти на оду и туже страницу .. по данному признаку мы их вычислим..

Конкретика такая.. на мои сайты основной траф идет с поисковиков... с закладок приходя человек 3-5 .. и среди этих 3-5 мне не составит труда вычислить хитробота... вот такая вот конкретика.
чтоже касается вышеописанных причин.. то тут вы совершенно правы.. но.
Цитата:
Мне кажется, поисковикам будет проще определить у вас защиту от ботов.
у меня не будет защиты от ботов у меня защита от хотроботов что как вы сами и говорили разные вещи.. по этому в данном конкретном случае у поисковиков ко мне притензий быть не должно..
Цитата:
пока у системы не закрадется мнение, что вы что-то прячете от ботов и они вас
какой системы ? если поисковой то от нее я прячу допустим ссылки .. а как она об этом узнает? только по стуку.
если же сапа.. то мы для того и ловим хитробота , чтобы уна не узнала.. ну а за ерроры еще никово не удаляли
Цитата:
Меня тут же интересует какие именно "среднестатистические параметры" вы хотите учитывать?
не я хочу учитывать ) вы пишите бота по этому вы должны будете учитывать.. там всякие бяки.. типа долгой загрузки с сервера .. нестаандартных ява и бейсик скриптов .. кривой разметки откровенных ошибок и тд и тп.. по этому вам придется вашего хотробота упрощать и загонять в определенные рамки.. что в общемто естественно для любого массового продукта .. к примеру вы пишите скрипт и отдаете знакомому програмеру со словами он делает то то, програмер берет и использует по назначению, далее вы даете скрипт оптимизатору или продвинутому свайтостроителю.. со словами .. если нужно изменить параметры.. измените переменные такието такието .. если все хорошо.. если нет то придется объяснить .. где переменные и тд и тп. если вы отдаете скрипт менеджеру.. то вам придется написать интерфейс.. и объяснить на пальцах .. далее понадобится мануал.. форумная поддержка кросплатформенность интуитивно понятный интерфейс.. защита от дураков и понеслась.. в итоге скрит который писался 10-15 минут разрастается в монстра вот что я имею ввиду под ограничениями
и среднестатистическими параметрами...
Фу чтото я устал писать ... вроде как это должно быть и так понятно ...
короче одним словом.. заточив бота под среднестатистический сайт .. вы загоните его в определенные рамки и тогда любая нестандартная ситуация для данного бота позволит его вычислить..
По это я и пишу о том.. что для конкретного сайта можно написать бота который и капчу вскроет и комент интелектуальный всавит.. даже для группы сайтов на одном движке ... но.. если двигать бота в массы .. то вычислить его можно будет.

Короче ) я не знаю какая нуджна конкретика .. но самым эфективным способом борьбы был есть и будет элементарный стук...
Kent вне форума   Ответить с цитированием
Старый 15.02.2008, 02:01   #35
Мастер
 
Регистрация: 08.11.2007
Сообщений: 598
Вес репутации: 213
Kent скоро станет известенKent скоро станет известен
По умолчанию

Во настрочил )) короче ищите логику ) может она там и есть ..
З.Ы. везде где хотел всавить лыбы не получилось.. на форуме ограничение на имеджики.. )
Kent вне форума   Ответить с цитированием
Старый 15.02.2008, 16:58   #36
Эксперт
 
Аватар для mman
 
Регистрация: 04.02.2008
Адрес: Neverland
Сообщений: 1,144
Вес репутации: 244
mman - прекрасное будущееmman - прекрасное будущееmman - прекрасное будущееmman - прекрасное будущееmman - прекрасное будущееmman - прекрасное будущееmman - прекрасное будущееmman - прекрасное будущееmman - прекрасное будущееmman - прекрасное будущееmman - прекрасное будущее
По умолчанию

Цитата:
У нас задача стоит вычислить бота сапы ..по этому
Да вроде бы мы уже договорились, что проще и лучше вычислять не робота сапы, а ботов поисковиков и не показывать им ссылки.
Ведь это логичнее чем вылавливать и тех и других. А если вылавливать только бота сапы и только ему показывать ссылки, то первая ручная проверка отправит сайт в баню.

А все вышенаписанное вами интересно и правильно, но мы как бы обсуждали скорее гипотетическую возможность эмуляции поведения человека на сайте, нежели практически. На практическое исполнение ни у каких поисковиков не хватит ресурсов и нет желания это делать. Скорость индексации для них важнее.
А по сему вычислить бота Я или G сейчас довольно просто. Я например вычисляю ботов ПС просто по юзерагнту и не показываю информацию которая им абсолютно не будет полезна, которая нужна только людям (например телефоны, аськи, мейлы, физ. адреса в шапке для магазинов, или, например, блок бестселлеров, который только запутывает бота... или комментарии посетителей, дальше 3й страницы... счетчики...). Но не занимаюсь мошенничеством и не обманываю поисковики подсовывая им ключевики или пряча ссылки.

Цитата:
З.Ы. везде где хотел всавить лыбы не получилось.. на форуме ограничение на имеджики.. )
Улыбаться полезно, я это тоже люблю .
mman вне форума   Ответить с цитированием
Старый 15.02.2008, 17:42   #37
Мастер
 
Регистрация: 08.11.2007
Сообщений: 598
Вес репутации: 213
Kent скоро станет известенKent скоро станет известен
По умолчанию

А про поисковики.. таквы совершенно правильно написали.. я тоже их палю по юзерагенту.. и всякие левые боты по отсутствию оного ..
Из поисковиков известен только хитроробот яндекса.. который имулирует поведение человека.. так вот и не известно .. существует он или нет

А что касается всего того что вы написали.. то это в любом случае приравнивается к клоакингу. )
Kent вне форума   Ответить с цитированием
Старый 15.02.2008, 20:51   #38
Эксперт
 
Аватар для mman
 
Регистрация: 04.02.2008
Адрес: Neverland
Сообщений: 1,144
Вес репутации: 244
mman - прекрасное будущееmman - прекрасное будущееmman - прекрасное будущееmman - прекрасное будущееmman - прекрасное будущееmman - прекрасное будущееmman - прекрасное будущееmman - прекрасное будущееmman - прекрасное будущееmman - прекрасное будущееmman - прекрасное будущее
По умолчанию

Нет, это не приравнивается к клоакингу. Хотябы взять первоначальное значение этого слова. Оно тут совершенно противоположно по смыслу тому, что делаю я.
А я дела. одолжение поисковикам, экономя их время и ресурсы для индексирования своего сайта. И знаете, за 3 года ни один поисковик "не был против", скорее наоборот .
Ведь иначе клоакингом можно назвать многие вещи даже на крупных порталах, когда по языку браузера или стране IP определяют какую информацию выводить на страницу.
Клоакинг - это в первую очередь обман с корыстными целями, достижение которых без обмана было бы невозможным. А я не скрываю своих действий, не считаю их какимто нарушением и с удовольствием бы пользовался средствами, которые бы делали подобную работу но были прописаны какимто стандартом, как <noindex> у яндекса... хотя он все равно не экономит трафик.
mman вне форума   Ответить с цитированием
Ответ


Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход

Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
А зачем у вновь добавляемых площадок "по умолчанию" стоит "скрывать УРЛ"? Ковалев Вопросы по работе системы 6 15.12.2008 12:02
Тематика "Обучение", язык Укр. - будет толк? Sanito Курилка 9 11.07.2008 10:35
Яндекс: "То ли ещё будет" timeout Курилка 8 27.05.2008 15:15
а когда будет "Находка"?) sni Курилка 5 20.05.2008 23:48
Как внутри акаунта перевести деньги заработанные "вебмастером" на счёт "оптимизатора" kapa Вопросы от новичков 10 11.01.2008 17:45


Часовой пояс GMT +3, время: 03:07.