27.01.2010, 01:27 | #21 |
Пожиратель черепашкоВ
Регистрация: 24.12.2008
Адрес: Телемелетрямдия
Сообщений: 4,739
Вес репутации: 395
|
ага... нот-то всего 7.....
__________________
|
03.02.2010, 10:02 | #23 |
Новичок
Регистрация: 02.02.2007
Сообщений: 24
Вес репутации: 0
|
|
05.02.2010, 18:41 | #24 |
Новичок
Регистрация: 10.02.2009
Сообщений: 5
Вес репутации: 0
|
единственно вот такой тогда вопрос у меня к вам возникает - захожу в биржу статей, делаю выборку по интересующей меня тематике тыц и то что можно увидеть в анонсах статей как на мой взгяд большим % уника не может похвастаться. Может я конечно делаю поспешные выводы, самих статей я кроме анонсов то не видел, но генерированные анонсы мне доверия уже не вызвали...
|
06.02.2010, 20:19 | #25 |
Новичок
Регистрация: 06.11.2009
Сообщений: 3
Вес репутации: 0
|
Уникальность статьи определяют по длине шингла. Какая заложена длина в алгоритме сапы, вряд ли кто скажет. Длина шингла, это последовательно идущие слова и обозначается цифрой. К примеру, если на странице есть слова "здравствуйте дорогой пользователь", а в алгоритме проверки на уник какого- то бота задана длина шингла 3, то такая страница, в глазах этого бота, будет не уникальна, потому как сочетание этих трёх слов можно встретить, чуть ли не на каждом втором сайте.
Добавлено через 29 минут Хочу немного добавить, а то предыдущая статья может многих завести в ступор. В алгоритм закладывается ещё процент не уника. Высчитывается он примерно так. Предлоги, междометия итд. не учитываются. Есть текст, слова я обозначу цифрами, шингл=3 12345678.... 123 234 345 456 итд. для каждой тройки слов высчитывается хэш сумма, вот по ней и считается количество совпадений. Это касается, только, шинглов. В алглритм заложено ещё много чего, но этого нам знать не положено. Последний раз редактировалось vlad59; 06.02.2010 в 20:19. Причина: Добавлено сообщение |
06.02.2010, 21:31 | #26 |
Специалист
Регистрация: 24.04.2009
Сообщений: 183
Вес репутации: 0
|
в принципе алгоритм должен быть открытым, например ммногие криптоалгоримы открыты что не мешает им быть криптостойкими. Закрытые алгоритмы изначально врожденно глючны и дырявы т.к. не прошли горнило публичного обсуждения.
|
|
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Удаление разделительной ".", если в конце ссылки есть "." | mike_2002 | Пожелания пользователей системы | 6 | 16.05.2010 13:53 |
Измените надпись "наш очень интересный форум"! | Константин Белокуров | Вопросы по работе системы | 10 | 17.01.2009 05:17 |
Если есть в подборе площадок опция "Наличие в Yandex" | andy78 | Ошибки при работе с системой | 3 | 30.10.2008 01:13 |
Часовой пояс GMT +3, время: 14:02.