ortega3000 |
28.11.2008 18:56 |
Цитата:
Сообщение от Leonardo
(Сообщение 321360)
вот у мя есть лицензия на прогу, и есть словарик дефолтный и на 5килослов, правилные иснонимы можно подставлять в самом окне синонимайзера после трансформаци текста.
Так например предложение:
Растению помимо солнечного света нужен свежий воздух слово света
имеет синоним освещение и он его подставляет в этой же форме а не как например нужно освещения
или внастройках что-то не так сделано?
Добавлено через 14 минут
и ещё один вопросик! после синонинизации текста в низу показывается процент замен (исходя от настроек эта цивра меняется)
например процент замен 15%, а после нажатия кнопки похожесть выдаёт процент похожести 8% !!!
почему так?, если я не ошибаюсь (хотя такое возможно) при 15% замен похожесть текста должна быть 85%. Хотя я понимаю, что это разные параметы похожесть и процент замен. но программа не может перефразировать предложение, только заменяет слова на синонимы в соответствии с морфологией и других особенностей (род, падеж, склонение, число).
|
Со словом "светом" в самом деле какая-то проблема. Похоже, в системном словаре неправильно прописаны грамматические данные этого слова. К сожалению, изменить это можно только с помощью компилятора системного словаря.
По поводу замен и похожести. Процент замен является отношением измененных слов к общему их количеству в тексте. Процент похожести текстов вычисляется по методу десятисловных шинглов. При этом чем выше процент замен, тем ниже процент похожести, и наоборот.
Кстати, на процент похожести влияет рассредоточенность замен по тексту. Если заменить первую половину слов в тексте и не трогать вторую половину, то процент похожести будет намного выше, чем если то же количество слов будет заменено равномерно по тексту (в данном случае - надо заменить каждое второе слово). При равномерном распределении замен процент похожести будет стремиться к нулю намного быстрее, чем при скученных заменах. Имейте это в виду.
Кстати, в вашем случае 8% похожести при 15% замен - это отличный результат!!! Такое может быть если замены распределены достаточно равномерно. Например, заменив каждое десятое слово в тексте из 100 слов, мы получим 10% замен и 0% похожести. Но не стоит слишком уж надеяться на результат проверки похожести. Никто точно не знает, какие методы проверок используют ПС. Так что старайтесь делать процент замен все же повыше. Хотя бы процентов 40-50.
Кстати, проверка похожести текстов работает только для текстов с десятью или более словами. Поэтому не удивляйтесь, если не меняя ничего вы получите нулевой процент похожести для текста из трех слов. :)
|