16.07.2007, 13:47 | #1 |
Эксперт
Регистрация: 11.07.2007
Адрес: Live in music
Сообщений: 1,342
Вес репутации: 274
|
Уникальность контента
У меня вопрос, вы знаете, каким образом Я и G проверяют контент на уникальность?
Допустим, у меня размещается статья - собранный руками и приведенный в читабельный вид материал с нескольких других сайтов. Активной ссылки на первоисточники нет, но есть упоминание их URL в тексте (например, "по материалам abc.ru и def.ru"). Будет ли эта статья считаться уникальной? И вообще каким образом уникальность контента проверяется - используется процент совпадения или что?
__________________
http://forum.sape.ru/showthread.php?t=97674 https://searchengines.guru/showthread.php?t=970948 (за отзыв скидка или бесплатный заказ) |
16.07.2007, 13:56 | #2 | |
Администратор
Регистрация: 22.11.2006
Сообщений: 5,868
Вес репутации: 21475171
|
Цитата:
в целом если статья сделана из нескольких источников и хотябы немного переписана - то шансы есть - иначе - врядли |
|
18.07.2007, 13:56 | #4 | |
Эксперт
Регистрация: 18.06.2007
Адрес: Картофель
Сообщений: 2,417
Вес репутации: 361
|
Цитата:
мне кажется, что алгоритм скорее всего примерно такой: 1) берется контент странички и разбивается на блочки допустим по 32 байта 2) по каждому блочку получают чексумму, например md5("контент блока"); 3) далее полученные данные закидываются в базу время от времени специальная прога обходит всю базу, и проверяет на наличие совпадений по чексуммам + если выходит большой процент совпадений то проверка идет уже на уровне контента + использование шаблонов (на основе морфологии) например: существ-1 + глагол + существ-5+союз+существ-4.... где существ-1 - это к примеру конкретная группа существительных таких как [Москв|Петербург|Киев] и в таком духе... тем самым даже если вы тупо перемешали в страничке абзацы, добавили целые абзацы текста из других страничек, то - это все равно будет определено как "не уникальный" контент обычно такие сайты с неуникальным контентом в индексе появляются, но через месяц начинают резко пропадать странички из индекса, в конечном счете отсается 1-2 странички, либо вообще полный вылет сайта из индекса Последний раз редактировалось seocore; 18.07.2007 в 13:58. |
|
18.07.2007, 14:43 | #5 |
Модератор
Регистрация: 07.06.2007
Сообщений: 3,491
Вес репутации: 320
|
__________________
Секреты успешной работы вебмастеров в Sape - Бестселлер года! Расширяем возможности SAPE: дополнение к Firefox - без него, как без рук. |
18.07.2007, 14:53 | #6 | |
Специалист
Регистрация: 04.05.2007
Сообщений: 142
Вес репутации: 214
|
Цитата:
Максимум что за это может быть - снижение позиций в выдаче. |
|
20.07.2007, 20:19 | #7 | |
Эксперт
Регистрация: 18.06.2007
Адрес: Картофель
Сообщений: 2,417
Вес репутации: 361
|
Цитата:
если твой сайт индексируется то все дело кроется как раз в дизайне, т.е. при копировании контента изменились многие вещи, такие как <H1> заголовки, прочее оформление текста + яндекс не смог корректно определить уникальность... можете убрать в <noindex> все элементы сайта за исключением контента и увидите что через пару АППов от вашего сайта останется только морда + 5-6 страничек неуникальный контент если хорошо разбавить тяжелым дизайном + тяжелым движочком аля DLE, SLAED, то такой сайт будет в индексе довольно долго - как правило до первого стука |
|
20.07.2007, 22:47 | #8 |
Новичок
|
бан за неуникальность... как избежать?
Сделал сайтик, в нем справочная информации, но в свете последних событий Яндекс вроде банит за неуникальный контент, следовательно я собираюсь написать статьи на сайт,
На сайте одна справка- одна страница, их около 900 справок, т.е. 900 страниц.- эти страницы не уникальны, но собранны со всего инета. Сколько нужно уникальных статей написать, чтобы яндекс не забанил... |
20.07.2007, 23:40 | #9 |
Новичок
Регистрация: 20.07.2007
Сообщений: 18
Вес репутации: 0
|
"В свете последних событий" - это Вы про "Ты последний"?
Вообще для увеличения уникальности лучше сами тексты рерайтить - примерно 0,6$-1$ за 1К знаков. Можно просто на страницы немножко текста другого подкинуть - ну нечто вроде заголовков других статей и т.п. А точных цифр (да и даже примерных) о том сколько текста добавить, Вам никто не скажет. |
20.07.2007, 23:49 | #10 |
Новичок
Регистрация: 20.07.2007
Сообщений: 18
Вес репутации: 0
|
2 seocore
Для стука - нужна причина стука. Если сайт разрешает копировать свой контент, то он обычно требует разместить активную ссылку, ведущую на этот сайт. Просто не стоит этим пренебрегать. Описывая то как Вы представляете себе процесс определения ПС-ами уникальности - это, по сути, и есть метод шинглов. |
|
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Подскажите сервис для проверки текста на уникальность!!! | ska4ai | Курилка | 12 | 12.11.2008 13:37 |
Уникальность контента в партнерках | zwolf | Вопросы от новичков | 1 | 01.06.2008 17:27 |
Размножение статьи. Уникальность более 85%. Количество вариантов до 1000. | DmFX | Деловое сотрудничество | 27 | 27.05.2008 14:57 |
Уникальный контент для Яшки, или как его проверить на уникальность...? | DFish | Яндекс | 12 | 20.05.2008 14:24 |
Часовой пояс GMT +3, время: 20:04.