Форум SAPE.RU

Форум SAPE.RU (http://forum.sape.ru/index.php)
-   Биржа статей (http://forum.sape.ru/forumdisplay.php?f=50)
-   -   "В Интернет уже есть очень похожая статья" (http://forum.sape.ru/showthread.php?t=45998)

chahlic 27.01.2010 01:27

Цитата:

Сообщение от Дикарка (Сообщение 711965)
Просто все, что уже можно было сказать - сказано. Остальным остается только повторяться...

Вот ходишь, мучаешься... потом набираешься храбрости и признаешься кому-нибудь в любви, а тебе в ответ... Я это где-то уже слышал/а

ага... нот-то всего 7.....

Ramses 29.01.2010 16:04

Написал сам статью, но как-то подозрительно быстро был вынесен приговор "есть похожая в интернете". Допустим Плагиатус сверяется с базами, ищет похожее, а тут бац и все. Нет желания статьи размещать...:(

Сергей 03.02.2010 10:02

Цитата:

Сообщение от Avelon (Сообщение 711801)
она и проверяет. очень хороший % неуника отсекается

м.б. система при отказе за неуникальность будет давать ссылку на оригинальную статью?
чтобы у копирайтера не оставалось сомнений...

agentvini 05.02.2010 18:41

Цитата:

Сообщение от Avelon (Сообщение 711801)
она и проверяет. очень хороший % неуника отсекается

единственно вот такой тогда вопрос у меня к вам возникает - захожу в биржу статей, делаю выборку по интересующей меня тематике тыц и то что можно увидеть в анонсах статей как на мой взгяд большим % уника не может похвастаться. Может я конечно делаю поспешные выводы, самих статей я кроме анонсов то не видел, но генерированные анонсы мне доверия уже не вызвали...

vlad59 06.02.2010 20:19

Уникальность статьи определяют по длине шингла. Какая заложена длина в алгоритме сапы, вряд ли кто скажет. Длина шингла, это последовательно идущие слова и обозначается цифрой. К примеру, если на странице есть слова "здравствуйте дорогой пользователь", а в алгоритме проверки на уник какого- то бота задана длина шингла 3, то такая страница, в глазах этого бота, будет не уникальна, потому как сочетание этих трёх слов можно встретить, чуть ли не на каждом втором сайте.

Добавлено через 29 минут
Хочу немного добавить, а то предыдущая статья может многих завести в ступор. В алгоритм закладывается ещё процент не уника. Высчитывается он примерно так. Предлоги, междометия итд. не учитываются. Есть текст, слова я обозначу цифрами, шингл=3
12345678....
123
234
345
456 итд.
для каждой тройки слов высчитывается хэш сумма, вот по ней и считается количество совпадений. Это касается, только, шинглов. В алглритм заложено ещё много чего, но этого нам знать не положено.

guitar117 06.02.2010 21:31

в принципе алгоритм должен быть открытым, например ммногие криптоалгоримы открыты что не мешает им быть криптостойкими. Закрытые алгоритмы изначально врожденно глючны и дырявы т.к. не прошли горнило публичного обсуждения.


Часовой пояс GMT +3, время: 17:03.

Работает на vBulletin® версия 3.8.7.
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Перевод: zCarot
SAPE.RU — система купли-продажи ссылок с главных и внутренних страниц сайтов.