Вернуться   Форум SAPE.RU > Общие вопросы > Разработка и сопровождение сайтов

-->
Ответ
 
Опции темы
Старый 03.09.2014, 20:42   #1
Мастер
 
Аватар для SPQR
 
Регистрация: 05.10.2011
Адрес: Напротив окна
Сообщений: 741
Вес репутации: 184
SPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущее
По умолчанию Работа со словоформами

Есть задача, нужно при помощи некоего API перейти от частного варианта отдельного слова к его основной форме.

Пример, слово "труда". Нужно получить основную форму - "труд" .

Есть очень хороший сервис
http://export.yandex.ru/inflect.xml?name=труд

его беда в том что основываясь на "труд" он может показать "труда" , а наоброт - нет, наоборот на выходе полная фигня.

Кто-нибудь видел другие API на эту тему ?
__________________
Si vis pacem, para bellum
SPQR вне форума   Ответить с цитированием
Старый 03.09.2014, 21:01   #2
Эксперт
 
Аватар для SergejF
 
Регистрация: 17.02.2008
Адрес: Донецк, ДНР
Сообщений: 8,880
Вес репутации: 503
SergejF - прекрасное будущееSergejF - прекрасное будущееSergejF - прекрасное будущееSergejF - прекрасное будущееSergejF - прекрасное будущееSergejF - прекрасное будущееSergejF - прекрасное будущееSergejF - прекрасное будущееSergejF - прекрасное будущееSergejF - прекрасное будущееSergejF - прекрасное будущее
По умолчанию

Цитата:
Сообщение от SPQR Посмотреть сообщение
перейти от частного варианта отдельного слова к его основной форме.
Что подразумевается под основной формой? Корень слова? Существительное в именительном падеже единственном числе? Таким образом надо обрабатывать только существительные или глаголы, прилагательные?

API не встречал. Но куда рыть знаю - база данных из какого-либо орфографического словаря. В каком всем словоформам приводится основная.

Идея (не без недостатков) реальзована в Библейском компьютерном справочнике фирмы Аркадия, впоследствии в Яндексе.
SergejF вне форума   Ответить с цитированием
Старый 04.09.2014, 11:21   #3
Мастер
 
Аватар для SPQR
 
Регистрация: 05.10.2011
Адрес: Напротив окна
Сообщений: 741
Вес репутации: 184
SPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущее
По умолчанию

SergejF, В первую очередь задача относится к переводу существительных в именительный падеж и единственное число (кстати, если оно есть) . У глаголов еще сложней, там нужно со временем работать, переводить в настоящее, как базовое и во все остальные.

База данных это хорошо, но пока ищу именно API , т.к. уровень задачи и сроки ее реализации не допускают создание или адаптацию баз.
__________________
Si vis pacem, para bellum
SPQR вне форума   Ответить с цитированием
Старый 04.09.2014, 12:02   #4
Эксперт
 
Аватар для SergejF
 
Регистрация: 17.02.2008
Адрес: Донецк, ДНР
Сообщений: 8,880
Вес репутации: 503
SergejF - прекрасное будущееSergejF - прекрасное будущееSergejF - прекрасное будущееSergejF - прекрасное будущееSergejF - прекрасное будущееSergejF - прекрасное будущееSergejF - прекрасное будущееSergejF - прекрасное будущееSergejF - прекрасное будущееSergejF - прекрасное будущееSergejF - прекрасное будущее
По умолчанию

API не встречал, но (еще одна мысль) все программы проверки орфографии, всякие там ОРФО, должны использовать подобный частотный словарь. Может поискать в этой стороне?
SergejF вне форума   Ответить с цитированием
Старый 04.09.2014, 12:17   #5
Злой модератор
 
Аватар для Wink
 
Регистрация: 25.03.2007
Адрес: Deep forest
Сообщений: 5,343
Вес репутации: 503
Wink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущееWink - прекрасное будущее
По умолчанию

Цитата:
Сообщение от SPQR Посмотреть сообщение
перейти от частного варианта отдельного слова к его основной форме
Это называется "лемматизация". Начните поиск отсюда например.
Заодно посмотрите алгоритмы и реализации стемминга. В отличиии от лемматизации, он не требует использования словарей. Может для вашей задачи и обычного стеммера хватит, кто знает.

Последний раз редактировалось Wink; 06.09.2014 в 07:47.
Wink вне форума   Ответить с цитированием
Старый 04.09.2014, 15:56   #6
Мастер
 
Аватар для SPQR
 
Регистрация: 05.10.2011
Адрес: Напротив окна
Сообщений: 741
Вес репутации: 184
SPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущее
По умолчанию

Wink, Спасибо, Вы указали правильный путь
__________________
Si vis pacem, para bellum
SPQR вне форума   Ответить с цитированием
Ответ


Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход

Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Непонятка со словоформами sabonett Яндекс 11 07.06.2011 15:28
Совместная работа работа надо проектом arkasha69 Вопросы по работе системы 5 17.05.2011 14:08
Работа с Избраное не пойму почему работа идет со всеми сайтами Abbadona Вопросы по работе системы 14 14.11.2007 21:36
Работа с поддоменами, работа с e-107. jeka Вопросы по работе системы 3 12.07.2007 09:49


Часовой пояс GMT +3, время: 18:57.