![]() |
Работа со словоформами
Есть задача, нужно при помощи некоего API перейти от частного варианта отдельного слова к его основной форме.
Пример, слово "труда". Нужно получить основную форму - "труд" . Есть очень хороший сервис http://export.yandex.ru/inflect.xml?name=труд его беда в том что основываясь на "труд" он может показать "труда" , а наоброт - нет, наоборот на выходе полная фигня. Кто-нибудь видел другие API на эту тему ? |
Цитата:
API не встречал. Но куда рыть знаю - база данных из какого-либо орфографического словаря. В каком всем словоформам приводится основная. Идея (не без недостатков) реальзована в Библейском компьютерном справочнике фирмы Аркадия, впоследствии в Яндексе. |
SergejF, В первую очередь задача относится к переводу существительных в именительный падеж и единственное число (кстати, если оно есть) . У глаголов еще сложней, там нужно со временем работать, переводить в настоящее, как базовое и во все остальные.
База данных это хорошо, но пока ищу именно API , т.к. уровень задачи и сроки ее реализации не допускают создание или адаптацию баз. |
API не встречал, но (еще одна мысль) все программы проверки орфографии, всякие там ОРФО, должны использовать подобный частотный словарь. Может поискать в этой стороне?
|
Цитата:
Заодно посмотрите алгоритмы и реализации стемминга. В отличиии от лемматизации, он не требует использования словарей. Может для вашей задачи и обычного стеммера хватит, кто знает. |
Wink, Спасибо, Вы указали правильный путь
|
Часовой пояс GMT +3, время: 01:23. |
Работает на vBulletin® версия 3.8.7.
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Перевод: zCarot
SAPE.RU — система купли-продажи ссылок с главных и внутренних страниц сайтов.