Старый 16.07.2007, 13:47   #1
Эксперт
 
Аватар для AeC
 
Регистрация: 11.07.2007
Адрес: Live in music
Сообщений: 1,342
Вес репутации: 226
AeC - прекрасное будущееAeC - прекрасное будущееAeC - прекрасное будущееAeC - прекрасное будущееAeC - прекрасное будущееAeC - прекрасное будущееAeC - прекрасное будущееAeC - прекрасное будущееAeC - прекрасное будущееAeC - прекрасное будущееAeC - прекрасное будущее
По умолчанию Уникальность контента

У меня вопрос, вы знаете, каким образом Я и G проверяют контент на уникальность?
Допустим, у меня размещается статья - собранный руками и приведенный в читабельный вид материал с нескольких других сайтов. Активной ссылки на первоисточники нет, но есть упоминание их URL в тексте (например, "по материалам abc.ru и def.ru").

Будет ли эта статья считаться уникальной?
И вообще каким образом уникальность контента проверяется - используется процент совпадения или что?
__________________
Услуги корректора 30 руб. за 1000 символов.
http://forum.sape.ru/showthread.php?t=97674
https://searchengines.guru/showthread.php?t=970948 (за отзыв скидка или бесплатный заказ)
AeC вне форума   Ответить с цитированием
Старый 16.07.2007, 13:56   #2
Администратор
 
Регистрация: 22.11.2006
Сообщений: 5,868
Вес репутации: 21475123
Avelon - репутация неоспоримаAvelon - репутация неоспоримаAvelon - репутация неоспоримаAvelon - репутация неоспоримаAvelon - репутация неоспоримаAvelon - репутация неоспоримаAvelon - репутация неоспоримаAvelon - репутация неоспоримаAvelon - репутация неоспоримаAvelon - репутация неоспоримаAvelon - репутация неоспорима
По умолчанию

Цитата:
Сообщение от outtime Посмотреть сообщение
У меня вопрос, вы знаете, каким образом Я и G проверяют контент на уникальность?
Допустим, у меня размещается статья - собранный руками и приведенный в читабельный вид материал с нескольких других сайтов. Активной ссылки на первоисточники нет, но есть упоминание их URL в тексте (например, "по материалам abc.ru и def.ru").

Будет ли эта статья считаться уникальной?
И вообще каким образом уникальность контента проверяется - используется процент совпадения или что?
сложно сказать, раньше яндекс оперировал ШИНГЛАМИ, сейчас он перешел на другой алгоритм. Гдето статья лежала на самом яндексе - поищите.

в целом если статья сделана из нескольких источников и хотябы немного переписана - то шансы есть - иначе - врядли
Avelon вне форума   Ответить с цитированием
Старый 17.07.2007, 12:29   #3
Специалист
 
Регистрация: 04.05.2007
Сообщений: 142
Вес репутации: 167
mymy на пути к лучшему
По умолчанию

Цитата:
Сообщение от Avelon Посмотреть сообщение
в целом если статья сделана из нескольких источников и хотябы немного переписана - то шансы есть - иначе - врядли

Что врядли?
mymy вне форума   Ответить с цитированием
Старый 18.07.2007, 13:56   #4
Эксперт
 
Аватар для seocore
 
Регистрация: 18.06.2007
Адрес: Картофель
Сообщений: 2,417
Вес репутации: 313
seocore - прекрасное будущееseocore - прекрасное будущееseocore - прекрасное будущееseocore - прекрасное будущееseocore - прекрасное будущееseocore - прекрасное будущееseocore - прекрасное будущееseocore - прекрасное будущееseocore - прекрасное будущееseocore - прекрасное будущееseocore - прекрасное будущее
По умолчанию

Цитата:
Сообщение от outtime Посмотреть сообщение
Будет ли эта статья считаться уникальной?
И вообще каким образом уникальность контента проверяется - используется процент совпадения или что?
на мой взгляд используется процент совпадения...

мне кажется, что алгоритм скорее всего примерно такой:
1) берется контент странички и разбивается на блочки допустим по 32 байта
2) по каждому блочку получают чексумму, например md5("контент блока");
3) далее полученные данные закидываются в базу

время от времени специальная прога обходит всю базу, и проверяет на наличие совпадений по чексуммам + если выходит большой процент совпадений то проверка идет уже на уровне контента + использование шаблонов (на основе морфологии) например: существ-1 + глагол + существ-5+союз+существ-4.... где существ-1 - это к примеру конкретная группа существительных таких как [Москв|Петербург|Киев] и в таком духе...

тем самым даже если вы тупо перемешали в страничке абзацы, добавили целые абзацы текста из других страничек, то - это все равно будет определено как "не уникальный" контент

обычно такие сайты с неуникальным контентом в индексе появляются, но через месяц начинают резко пропадать странички из индекса, в конечном счете отсается 1-2 странички, либо вообще полный вылет сайта из индекса
__________________
Инструменты для веб-мастера: кластеризатор СЯ, все запросы конкурента, XML-лимиты для плагина Wink'а

Последний раз редактировалось seocore; 18.07.2007 в 13:58.
seocore вне форума   Ответить с цитированием
Старый 18.07.2007, 14:43   #5
Модератор
 
Аватар для Евген
 
Регистрация: 07.06.2007
Сообщений: 3,491
Вес репутации: 273
Евген - прекрасное будущееЕвген - прекрасное будущееЕвген - прекрасное будущееЕвген - прекрасное будущееЕвген - прекрасное будущееЕвген - прекрасное будущееЕвген - прекрасное будущееЕвген - прекрасное будущееЕвген - прекрасное будущееЕвген - прекрасное будущееЕвген - прекрасное будущее
По умолчанию

Цитата:
Сообщение от mymy Посмотреть сообщение
Что врядли?
врядли будет признана уникальной.
__________________
прежде чем спросить - ФАК, ЧаВо, RTFM (кто не прочитал-бан)
Секреты успешной работы вебмастеров в Sape - Бестселлер года!
Расширяем возможности SAPE: дополнение к Firefox - без него, как без рук.
Евген вне форума   Ответить с цитированием
Старый 18.07.2007, 14:53   #6
Специалист
 
Регистрация: 04.05.2007
Сообщений: 142
Вес репутации: 167
mymy на пути к лучшему
По умолчанию

Цитата:
Сообщение от seocore Посмотреть сообщение
обычно такие сайты с неуникальным контентом в индексе появляются, но через месяц начинают резко пропадать странички из индекса, в конечном счете отсается 1-2 странички, либо вообще полный вылет сайта из индекса
Чушь полная. Есть 10+ сайтов, контент которых полностью передерал. Тока в дизайн в свой вставил. Уже год с лишнем в индексе. Многие странички в топе по СЧ (естественно достигнуто ссылочным).

Максимум что за это может быть - снижение позиций в выдаче.
mymy вне форума   Ответить с цитированием
Старый 20.07.2007, 20:19   #7
Эксперт
 
Аватар для seocore
 
Регистрация: 18.06.2007
Адрес: Картофель
Сообщений: 2,417
Вес репутации: 313
seocore - прекрасное будущееseocore - прекрасное будущееseocore - прекрасное будущееseocore - прекрасное будущееseocore - прекрасное будущееseocore - прекрасное будущееseocore - прекрасное будущееseocore - прекрасное будущееseocore - прекрасное будущееseocore - прекрасное будущееseocore - прекрасное будущее
По умолчанию

Цитата:
Сообщение от mymy Посмотреть сообщение
Чушь полная. Есть 10+ сайтов, контент которых полностью передерал. Тока в дизайн в свой вставил. Уже год с лишнем в индексе. Многие странички в топе по СЧ (естественно достигнуто ссылочным).

Максимум что за это может быть - снижение позиций в выдаче.
не, все горазда хуже - неуникальные (дубли) странички яндекс выкидывает из индекса на автопилоте...

если твой сайт индексируется то все дело кроется как раз в дизайне, т.е. при копировании контента изменились многие вещи, такие как <H1> заголовки, прочее оформление текста + яндекс не смог корректно определить уникальность...

можете убрать в <noindex> все элементы сайта за исключением контента и увидите что через пару АППов от вашего сайта останется только морда + 5-6 страничек

неуникальный контент если хорошо разбавить тяжелым дизайном + тяжелым движочком аля DLE, SLAED, то такой сайт будет в индексе довольно долго - как правило до первого стука
__________________
Инструменты для веб-мастера: кластеризатор СЯ, все запросы конкурента, XML-лимиты для плагина Wink'а
seocore вне форума   Ответить с цитированием
Старый 20.07.2007, 22:47   #8
Новичок
 
Регистрация: 18.03.2007
Сообщений: 34
Вес репутации: 167
x007xx скоро станет известенx007xx скоро станет известен
Отправить сообщение для x007xx с помощью ICQ
По умолчанию бан за неуникальность... как избежать?

Сделал сайтик, в нем справочная информации, но в свете последних событий Яндекс вроде банит за неуникальный контент, следовательно я собираюсь написать статьи на сайт,
На сайте одна справка- одна страница, их около 900 справок, т.е. 900 страниц.- эти страницы не уникальны, но собранны со всего инета.
Сколько нужно уникальных статей написать, чтобы яндекс не забанил...
x007xx вне форума   Ответить с цитированием
Старый 20.07.2007, 23:40   #9
Новичок
 
Регистрация: 20.07.2007
Сообщений: 18
Вес репутации: 0
mashell на пути к лучшему
По умолчанию

"В свете последних событий" - это Вы про "Ты последний"?

Вообще для увеличения уникальности лучше сами тексты рерайтить - примерно 0,6$-1$ за 1К знаков. Можно просто на страницы немножко текста другого подкинуть - ну нечто вроде заголовков других статей и т.п.

А точных цифр (да и даже примерных) о том сколько текста добавить, Вам никто не скажет.
mashell вне форума   Ответить с цитированием
Старый 20.07.2007, 23:49   #10
Новичок
 
Регистрация: 20.07.2007
Сообщений: 18
Вес репутации: 0
mashell на пути к лучшему
По умолчанию

2 seocore

Для стука - нужна причина стука. Если сайт разрешает копировать свой контент, то он обычно требует разместить активную ссылку, ведущую на этот сайт. Просто не стоит этим пренебрегать.

Описывая то как Вы представляете себе процесс определения ПС-ами уникальности - это, по сути, и есть метод шинглов.
mashell вне форума   Ответить с цитированием
Ответ

Опции темы

Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход

Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Подскажите сервис для проверки текста на уникальность!!! ska4ai Курилка 12 12.11.2008 13:37
Уникальность контента в партнерках zwolf Вопросы от новичков 1 01.06.2008 17:27
Размножение статьи. Уникальность более 85%. Количество вариантов до 1000. DmFX Деловое сотрудничество 27 27.05.2008 14:57
Уникальный контент для Яшки, или как его проверить на уникальность...? DFish Яндекс 12 20.05.2008 14:24


Часовой пояс GMT +3, время: 17:15.