Цитата:
|
Написал сам статью, но как-то подозрительно быстро был вынесен приговор "есть похожая в интернете". Допустим Плагиатус сверяется с базами, ищет похожее, а тут бац и все. Нет желания статьи размещать...:(
|
Цитата:
чтобы у копирайтера не оставалось сомнений... |
Цитата:
|
Уникальность статьи определяют по длине шингла. Какая заложена длина в алгоритме сапы, вряд ли кто скажет. Длина шингла, это последовательно идущие слова и обозначается цифрой. К примеру, если на странице есть слова "здравствуйте дорогой пользователь", а в алгоритме проверки на уник какого- то бота задана длина шингла 3, то такая страница, в глазах этого бота, будет не уникальна, потому как сочетание этих трёх слов можно встретить, чуть ли не на каждом втором сайте.
Добавлено через 29 минут Хочу немного добавить, а то предыдущая статья может многих завести в ступор. В алгоритм закладывается ещё процент не уника. Высчитывается он примерно так. Предлоги, междометия итд. не учитываются. Есть текст, слова я обозначу цифрами, шингл=3 12345678.... 123 234 345 456 итд. для каждой тройки слов высчитывается хэш сумма, вот по ней и считается количество совпадений. Это касается, только, шинглов. В алглритм заложено ещё много чего, но этого нам знать не положено. |
в принципе алгоритм должен быть открытым, например ммногие криптоалгоримы открыты что не мешает им быть криптостойкими. Закрытые алгоритмы изначально врожденно глючны и дырявы т.к. не прошли горнило публичного обсуждения.
|
Часовой пояс GMT +3, время: 17:03. |
Работает на vBulletin® версия 3.8.7.
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Перевод: zCarot
SAPE.RU — система купли-продажи ссылок с главных и внутренних страниц сайтов.