Вернуться   Форум SAPE.RU > Практика оптимизации > Софт для оптимизаторов и вебмастеров

-->
Ответ
 
Опции темы
Старый 28.11.2008, 16:48   #31
Особый статус
 
Регистрация: 23.03.2008
Адрес: localhost
Сообщений: 2,594
Вес репутации: 322
Ufaweb - прекрасное будущееUfaweb - прекрасное будущееUfaweb - прекрасное будущееUfaweb - прекрасное будущееUfaweb - прекрасное будущееUfaweb - прекрасное будущееUfaweb - прекрасное будущееUfaweb - прекрасное будущееUfaweb - прекрасное будущееUfaweb - прекрасное будущееUfaweb - прекрасное будущее
Отправить сообщение для Ufaweb с помощью ICQ
По умолчанию

Цитата:
Сообщение от Leonardo Посмотреть сообщение
при 15% замен похожесть текста должна быть 85%
Например, было мама мыла раму. Стало: мама чистила раму. Замена всего одна, а тексты нисколько не похожи, то есть 0% схожести.
Ufaweb вне форума   Ответить с цитированием
Старый 28.11.2008, 18:56   #32
Специалист
 
Регистрация: 13.06.2007
Адрес: Киев
Сообщений: 101
Вес репутации: 210
ortega3000 - весьма и весьма положительная личностьortega3000 - весьма и весьма положительная личностьortega3000 - весьма и весьма положительная личность
Отправить сообщение для ortega3000 с помощью ICQ
По умолчанию

Цитата:
Сообщение от Leonardo Посмотреть сообщение
вот у мя есть лицензия на прогу, и есть словарик дефолтный и на 5килослов, правилные иснонимы можно подставлять в самом окне синонимайзера после трансформаци текста.
Так например предложение:
Растению помимо солнечного света нужен свежий воздух слово света
имеет синоним освещение и он его подставляет в этой же форме а не как например нужно освещения
или внастройках что-то не так сделано?

Добавлено через 14 минут
и ещё один вопросик! после синонинизации текста в низу показывается процент замен (исходя от настроек эта цивра меняется)
например процент замен 15%, а после нажатия кнопки похожесть выдаёт процент похожести 8% !!!
почему так?, если я не ошибаюсь (хотя такое возможно) при 15% замен похожесть текста должна быть 85%. Хотя я понимаю, что это разные параметы похожесть и процент замен. но программа не может перефразировать предложение, только заменяет слова на синонимы в соответствии с морфологией и других особенностей (род, падеж, склонение, число).
Со словом "светом" в самом деле какая-то проблема. Похоже, в системном словаре неправильно прописаны грамматические данные этого слова. К сожалению, изменить это можно только с помощью компилятора системного словаря.

По поводу замен и похожести. Процент замен является отношением измененных слов к общему их количеству в тексте. Процент похожести текстов вычисляется по методу десятисловных шинглов. При этом чем выше процент замен, тем ниже процент похожести, и наоборот.
Кстати, на процент похожести влияет рассредоточенность замен по тексту. Если заменить первую половину слов в тексте и не трогать вторую половину, то процент похожести будет намного выше, чем если то же количество слов будет заменено равномерно по тексту (в данном случае - надо заменить каждое второе слово). При равномерном распределении замен процент похожести будет стремиться к нулю намного быстрее, чем при скученных заменах. Имейте это в виду.

Кстати, в вашем случае 8% похожести при 15% замен - это отличный результат!!! Такое может быть если замены распределены достаточно равномерно. Например, заменив каждое десятое слово в тексте из 100 слов, мы получим 10% замен и 0% похожести. Но не стоит слишком уж надеяться на результат проверки похожести. Никто точно не знает, какие методы проверок используют ПС. Так что старайтесь делать процент замен все же повыше. Хотя бы процентов 40-50.

Кстати, проверка похожести текстов работает только для текстов с десятью или более словами. Поэтому не удивляйтесь, если не меняя ничего вы получите нулевой процент похожести для текста из трех слов.
ortega3000 вне форума   Ответить с цитированием
Старый 02.12.2008, 12:47   #33
Мастер
 
Аватар для Leonardo
 
Регистрация: 25.07.2008
Адрес: Симферополь, КРЫМ, Чистенькое :)
Сообщений: 676
Вес репутации: 217
Leonardo - за этого человека можно гордитсяLeonardo - за этого человека можно гордитсяLeonardo - за этого человека можно гордитсяLeonardo - за этого человека можно гордитсяLeonardo - за этого человека можно гордитсяLeonardo - за этого человека можно гордитсяLeonardo - за этого человека можно гордитсяLeonardo - за этого человека можно гордитсяLeonardo - за этого человека можно гордится
По умолчанию

ortega3000, спасибо за консультацию, кое-что подправил, резльтаты от раза в раз всё лучше и лучше, вобщем начинаю составлять персональные словари для узкоспециализированных тематик, так намного правельнее при трансформации ,а тексты получаются просто офегенные
__________________
Зарабатываю на самой лушей тизерной сети здесь.
Leonardo вне форума   Ответить с цитированием
Старый 09.12.2008, 19:28   #34
Специалист
 
Регистрация: 04.03.2008
Сообщений: 149
Вес репутации: 205
Kostushko - просто великолепная личностьKostushko - просто великолепная личностьKostushko - просто великолепная личностьKostushko - просто великолепная личностьKostushko - просто великолепная личностьKostushko - просто великолепная личность
По умолчанию

Приобрел программу со скидкой, буду тестить!
Kostushko вне форума   Ответить с цитированием
Старый 17.01.2009, 00:13   #35
Эксперт
 
Аватар для Al Pacino
 
Регистрация: 09.05.2008
Адрес: ПГ
Сообщений: 1,704
Вес репутации: 0
Al Pacino имеет ошибки в прошлом
По умолчанию

Цитата:
Сообщение от awe Посмотреть сообщение
Ufaweb, спасибо! Все наглядно, а значит и понятно. Хотя остается вопрос еще по процентовке: если брать новости, то какой процент схожести текстов можно считать приемлемым? Естественно, с точки зрения Яши и Гоши?
5 подряд идущих слов повторяются - текст неуник.
__________________
есть тема?
Al Pacino вне форума   Ответить с цитированием
Старый 17.01.2009, 09:58   #36
Banned
 
Регистрация: 14.08.2008
Сообщений: 947
Вес репутации: 0
Steh не любят в этих краяхSteh не любят в этих краяхSteh не любят в этих краяхSteh не любят в этих краяхSteh не любят в этих краях
Отправить сообщение для Steh с помощью ICQ
По умолчанию

Цитата:
Сообщение от Al Pacino Посмотреть сообщение
5 подряд идущих слов повторяются - текст неуник.
Аль Пачино, это кто-то сказал или ваше предположение7 Я вообще ориентировался на 3-4 слова вподряд в своих расчетах. Если 5, то это лучше!

Я тут смотрю результаты замен слов. Ну, я бы половину таких слов никогда не упортебил. Они не к слогу, не к теме и вообще устарели. На взгляд можно подобрать такое же слово к сателитам - ахинея) А если банчить ради денег, то синонимайзер подобный в самый раз.
Steh вне форума   Ответить с цитированием
Старый 17.01.2009, 12:54   #37
Новичок
 
Регистрация: 14.09.2008
Сообщений: 40
Вес репутации: 190
vtomas на пути к лучшему
По умолчанию

Откуда такие данные: "пять слов подряд - текст не уникальный"? Если пять подряд находятся в тексте из 3000 знаков. А как же тогда шинглы по десять слов, пассажи и 20-25% отличия от исходного текста, которые Яша прекрасно кушает???
Если есть примеры не уника из пяти слов подряд - В СТУДИЮ!!
vtomas вне форума   Ответить с цитированием
Старый 22.01.2009, 21:37   #38
Новичок
 
Регистрация: 14.09.2008
Сообщений: 40
Вес репутации: 190
vtomas на пути к лучшему
По умолчанию АКЦИЯ АнТи-Кризис!!!

АКЦИЯ АнТи-Кризис!!!

По многочисленным просьбам объявляется анти-кризисная программа:
до конца января вы можете приобрести одну коммерческую лицензию для синонимайзера со скидкой в 40%, или две коммерческие лицензии по цене одной, экономя 50% на каждой из лицензий.
Таким образом одна коммерческая лицензия обойдется вам в 45WMZ, а две в 75WMZ.

Если у вас некоммерческая лицензия, то вы тоже можете воспользоваться этой анти-кризисной программой и перейти на коммерческую лицензию (и получить при этом оба словаря) всего за 30WMZ (вместо 50), сэкономив при этом 40%. Покупка двух обновлений до коммерческой лицензии позволит вам сэкономить еще больше - 50%, так что переход двух компьютеров на коммерческие лицензии обойдется всего в 50WMZ.

Еще раз напомню, что коммерческие лицензии на WordSyn позволят вам приобретать все продукты автора со скидкой в 50%. Владельцы некоммерческих лицензий такой возможности не имеют.

И еще раз: анти-кризисная программа действует только до конца января!
vtomas вне форума   Ответить с цитированием
Старый 31.01.2009, 00:15   #39
Эксперт
 
Аватар для Al Pacino
 
Регистрация: 09.05.2008
Адрес: ПГ
Сообщений: 1,704
Вес репутации: 0
Al Pacino имеет ошибки в прошлом
По умолчанию

Цитата:
Сообщение от vtomas Посмотреть сообщение
Откуда такие данные: "пять слов подряд - текст не уникальный"? Если пять подряд находятся в тексте из 3000 знаков. А как же тогда шинглы по десять слов, пассажи и 20-25% отличия от исходного текста, которые Яша прекрасно кушает???
Если есть примеры не уника из пяти слов подряд - В СТУДИЮ!!
копискейп похоже работает. В ПС тоже не дураки сидят, а не уник подряд - это самое простое что только можно запалить.
__________________
есть тема?
Al Pacino вне форума   Ответить с цитированием
Старый 31.01.2009, 01:08   #40
Специалист
 
Регистрация: 13.06.2007
Адрес: Киев
Сообщений: 101
Вес репутации: 210
ortega3000 - весьма и весьма положительная личностьortega3000 - весьма и весьма положительная личностьortega3000 - весьма и весьма положительная личность
Отправить сообщение для ortega3000 с помощью ICQ
По умолчанию

Цитата:
Сообщение от Al Pacino Посмотреть сообщение
копискейп похоже работает. В ПС тоже не дураки сидят, а не уник подряд - это самое простое что только можно запалить.
Вы забываете, что есть такое понятие. как устойчивые выражения и штампы. Мало кто использует уникальные и неповторяющиеся конструкции, так что выражения "из этого следует, что этот продукт" будут повторяться достаточно часто. Но это ведь не значит, что текст, содержащий такие штампы, будет считаться неуником.
ortega3000 вне форума   Ответить с цитированием
Ответ

Опции темы

Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход

Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
контекст - отключение морфологии tav Пожелания пользователей системы 4 13.10.2009 03:05
поиск площадок с учетом ключевых слов siarzhuk Ошибки при работе с системой 4 12.10.2008 04:42
Синонимайзер русского текста SEODollar Деловое сотрудничество 34 09.06.2008 19:22
Индексация сайта с учетом robots.txt Сергей Ш Пожелания пользователей системы 10 12.05.2008 10:29
Программа №1 для SEO kubanmedia Деловое сотрудничество 64 28.03.2008 03:01


Часовой пояс GMT +3, время: 03:15.