06.04.2014, 11:05 | #12 |
Специалист
Регистрация: 30.08.2008
Сообщений: 336
Вес репутации: 210
|
MIO70, ко всем прозвучавшим советам, я порекомендую добавить в своих страницах ссылки на свой же сайт. Если воры не предусмотрели их вырезание, получите бэки.
Если автоматический парсинг страниц сделан "по тупому", можно его "обломать" - нужно немного переработать шаблон и css файл, и рандомно (раз в день) менять или добавлять классы в структуре страниц. Саму структуру рандомно менять не стоит, Яша может "не понять" таких действий. Однако, я бы 10 раз подумал над целесообразностью. Стоит ли ломать копья? Людей, у которых мозгов хватает только на создание доров и копипастинг очень много и контент будут воровать. Подумайте, что для вас важнее (актуальнее или принесет больше выгоды): - забыть про сайт и все силы бросить на борьбу с ворами контента, - плюнуть на воров и развивать сайт. Естественно, если материальных и людских ресурсов у вас в избытке, нужно делать и то и другое. "Вор должен сидеть в тюрьме!" (с) Глеб Жиглов
__________________
|
07.04.2014, 04:54 | #13 |
Мастер
Регистрация: 29.01.2009
Адрес: дефолт-сити
Сообщений: 510
Вес репутации: 216
|
Вставьте в текст статьи скрытый вывод айпи, с которого запрашивается страничка. Так можно будет поймать айпи робота. А уже потом ему можно выдавать всё что угодно, например необновляемый вариант сайта.
__________________
Требования: знание UNIХ-систем, способность восстановить систему после своих действий. Кнопка бабло |
07.04.2014, 17:05 | #15 |
Эксперт
Регистрация: 18.06.2007
Адрес: Картофель
Сообщений: 2,417
Вес репутации: 355
|
|
07.04.2014, 17:19 | #16 |
Специалист
Регистрация: 30.08.2008
Сообщений: 336
Вес репутации: 210
|
Поясните, что вы имели ввиду: проходя сквозь (через) сотни прокси или используя сотни проски (т.е. с разных IP)?
__________________
|
07.04.2014, 17:41 | #17 |
Эксперт
Регистрация: 03.07.2007
Адрес: Chinatown
Сообщений: 7,265
Вес репутации: 609
|
для банального парсинга никто прокси не юзает. ибо дорого.
ступайте лучше говны на вентилятор кидать. у Вас это лучше получается
__________________
тексты по 10 руб/кзнак автоматизируй все, не мучайся! |
07.04.2014, 18:27 | #18 | |
Мастер
Регистрация: 29.01.2009
Адрес: дефолт-сити
Сообщений: 510
Вес репутации: 216
|
Цитата:
По поводу многогигабайтного исошника - если не жалко канала можно просто выключить ограничение по времени исполнения скрипта и бесконечно генерить ему налету бредопоток, авось и подвиснет бот.
__________________
Требования: знание UNIХ-систем, способность восстановить систему после своих действий. Кнопка бабло |
|
07.04.2014, 22:26 | #19 | |
Эксперт
Регистрация: 18.06.2007
Адрес: Картофель
Сообщений: 2,417
Вес репутации: 355
|
Цитата:
там, где большие объемы, там, как правило, юзают прокси, персонально Ваш сайт никто из дорвейщиков парсить не будет |
|
07.04.2014, 22:57 | #20 |
Мастер
Регистрация: 29.01.2009
Адрес: дефолт-сити
Сообщений: 510
Вес репутации: 216
|
я сам дорвейщик со стажем, меня можно в сии таинства не посвящать
__________________
Требования: знание UNIХ-систем, способность восстановить систему после своих действий. Кнопка бабло |
Опции темы | |
|
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Как бороться с лишними ВС? | vavallll | Разработка и сопровождение сайтов | 5 | 23.04.2012 12:53 |
Как бороться с копипастом? | X-bus | Курилка | 16 | 01.03.2010 00:30 |
Как с этим бороться? | lepestok | Курилка | 7 | 26.02.2010 10:25 |
проверка текста на количество текста, % ключевых слов оффлайн | balbeska | Общие вопросы оптимизации | 1 | 15.12.2008 21:28 |
Что это и как с ним бороться? | Вова | Курилка | 10 | 26.09.2007 19:20 |
Часовой пояс GMT +3, время: 03:33.