Форум SAPE.RU

Форум SAPE.RU (http://forum.sape.ru/index.php)
-   Софт для оптимизаторов и вебмастеров (http://forum.sape.ru/forumdisplay.php?f=36)
-   -   прога для анализа массы текстов и отбора из них с самым уникальным содержимым. (http://forum.sape.ru/showthread.php?t=32308)

Jimi Dini 03.06.2009 01:48

прога для анализа массы текстов и отбора из них с самым уникальным содержимым.
 
дамы и господа, вопрос

чудо стоит 10 баксов

Цитата:

WSGURerayter предназначен для анализа массы текстов и отбора из них с самым уникальным содержимым.
Для работы с программой необходимо:
• Поместить в каталог с исходными статьями файлы с расширением .html. В каждом файле должна находиться одна статья.
• Указать каталог, куда будут перемещены отобранные статьи
• В поле «Отобрать из общей массы» ввести количество отбираемых статей с самым уникальным содержимым.
• Поле «использовать максимум слов» необходимо заполнить целым положительным числом не менее 10 с учетом стоп слов.
• Качественный, но более медленный анализ – время анализа увеличивается примерно в 2 раза, но используются более точные алгоритмы.
• Файл stopwords.txt содержит стоп слова, которые не учитываются при анализе.

Для ускорения работы алгоритмов, программа работает только с русскими словами. По индивидуальному запросу возможно подключение и английских слов.
вот поциент: __http://www.snips.ru/tovar2021.html


вопрос, стоит оно 10 баков или фуфел?
может кто юзает прогу или аналог?

Shade-first 03.06.2009 02:09

Цитата:

Сообщение от thoth666 (Сообщение 465989)
Поместить в каталог с исходными статьями файлы с расширением .html. В каждом файле должна находиться одна статья.

Это ключевое.
Зачем платить. Не делай хтмл файлы а просто вбивай текст в Advego Plagiatus. В его алгоритме я уверен. В отличие эт этой проги.

Jimi Dini 03.06.2009 02:52

Цитата:

Сообщение от Shade-first (Сообщение 465998)
Это ключевое.
Зачем платить. Не делай хтмл файлы а просто вбивай текст в Advego Plagiatus. В его алгоритме я уверен. В отличие эт этой проги.

ключевое в том что на входе (как я понял) дается размноженный текст, сделанный из одного и того же источника а на выходе мы имеем отобранные уникальные (сильно отличающиеся) статьи.

допустим, я сам написал статью и решил ее уникализовать, чтобы обменяться статьями. в инете моей статьи ессно нет. плагиатус ищет в инете, как и ДЦФиндер.

Плaтон 04.06.2009 02:00

ИМхо стоит, т.к. генераторы типа {||} дают и одинаковые статьи, которые надо отсеивать :)

Jimi Dini 04.06.2009 06:02

Цитата:

Сообщение от Плaтон (Сообщение 467200)
ИМхо стоит, т.к. генераторы типа {||} дают и одинаковые статьи, которые надо отсеивать :)

пожалел 10 баксов, написал сам.
чудо природы


Часовой пояс GMT +3, время: 23:20.

Работает на vBulletin® версия 3.8.7.
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Перевод: zCarot
SAPE.RU — система купли-продажи ссылок с главных и внутренних страниц сайтов.