21.11.2008, 13:14 | #11 | |
Новичок
Регистрация: 20.11.2008
Сообщений: 9
Вес репутации: 0
|
Цитата:
а по морфологии скажу одно - программно применять к русскому языку ее нельзя, так как половина слов будет выводится неправильно лучше базу нарастить побольше, тем более у нас алгоритм прекрасно оптимизирован и скорость обработки текста высока. WebFX а вы использовали полную и свежую версию чтобы делать такие выводы? |
|
21.11.2008, 13:24 | #12 |
фОшЫст
|
нет, но ДЕМО версия должна показать возможности программы дабы клиент загорелся.
а вот указанные мной выше программы у меня имеются в полных версиях.
__________________
|
21.11.2008, 13:47 | #13 | |
Специалист
|
Цитата:
1000 существительных в шести падежах - 6000 строк 400 прилагательных во всех трех родах и шести падежах - 7200 строк Итого получается 13200 строк. Плюс еще глаголы (в трех родах и трех временах), плюс наречия. Так что 3к слов не получается никак. Или же у вас представлены не все возможные комбинации грамматических форм слов, что уменьшает привлекательность базы на порядок. Программно морфологию применять можно (и получается очень хорошо). Другое дело, что простой заменой слов на синонимы в нужной форме не всегда можно добиться правильного результата. Хотя бы потому, что надо проверять род существительного, и после этого находить прилагательные, привязанные к этому существительному и менять их род на нужный. Это нужно, чтобы для словосочетания "хорошая машина" на получалось словосочетание "отличная автомобиль". Но тут уже в действие вступает лексическая языковая машина, которая к морфологии не имеет никакого отношения.
__________________
Генератор сайтов MultiPoster |
|
21.11.2008, 13:55 | #14 | |
Мастер
Регистрация: 25.07.2008
Адрес: Симферополь, КРЫМ, Чистенькое :)
Сообщений: 676
Вес репутации: 217
|
Цитата:
__________________
|
|
21.11.2008, 14:16 | #15 | |
Специалист
|
Цитата:
Это был оффтопик, а теперь по делу. 1. Хинты к кнопкам рулят. Однозначно. 2. Морфологию использовать нужно. Есть много разных библиотек, которые для этого можно использовать. Некоторые из них платные, но оно того стоит. 3. Если не использовать морфологию, то все равно нужно делать такую базу, в которой словоформы будут группироваться вокруг базового слова, так что вы с легкостью сможете приводить любое известное программе слово в нужную грамматическую форму. Делать это сложно и геморно, но в дальнейшем это даст свои результаты. И, естественно, текстовый формат базы тут не покатит. Нужен хотя бы SQLite. 4. Писать стоит не количество строк в базе, а реальное количество слов, на которых основаны словоформы в ней. Или писать оба числа. Просто представьте, что почувствует человек, понадеявшийся, что у него в словаре 12к слов, и получивший при этом 10-15% замен. Как минимум разочарование. В целом ваш продукт хорош, но он еще требует доработок. Впрочем, как и мой
__________________
Генератор сайтов MultiPoster |
|
|
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Бесплатный синонимайзер на PHP | D.iK.iJ | Разработка и сопровождение сайтов | 43 | 24.05.2012 18:14 |
синонимайзер РУ текстов | trafbite | Деловое сотрудничество | 199 | 18.11.2009 22:39 |
Посоветуйте синонимайзер. | Se0man | Курилка | 8 | 17.10.2009 10:12 |
Программа синонимайзер Rerait-Pro | weblife | Софт для оптимизаторов и вебмастеров | 64 | 18.01.2009 18:50 |
Часовой пояс GMT +3, время: 04:43.