01.04.2010, 17:27 | #111 |
Эксперт
Регистрация: 05.03.2008
Сообщений: 1,095
Вес репутации: 249
|
Йода
Скажите, а для чего вы собираетесь использовать распознавание тематик? Я в смысле - стоит ли игра свеч? Мне эта тема тоже была интересна. Самый простой способ - это использовать простой обучающийся оператором алгоритм на основе вычисления вероятностей отнесения слов к той или иной теме. Это легко реализовать, но этот метод не будет работать для связки слов. Например, словосочетание "звездные войны" он скорее отнесет к астрономии или политике, а не к кинофильмам. Разве что другие термины перевесят. С этой задачей может справиться нейронная сеть, но нейронная сеть - это черный ящик, невозможно увидеть картину принятия решения. Еще есть проблема омонимии, но она меня меньше беспокоит - эту проблему частично можно решить простыми методами. А за схему "подлежащее-сказуемое-причастие.." можно взяться для английского языка, а для русского имхо нереально. Я видел в инете корявые решения синтаксического анализа, но они все же предполагают грамотный текст на входе. А кто ж у нас пишет грамотно?... Тупик. |
01.04.2010, 18:39 | #112 | |
Магистр
Регистрация: 04.12.2007
Сообщений: 3,680
Вес репутации: 416
|
Эта штука полезная во многих смыслах. От проверки доноров до ролуавтоматического генерирования текстов.
Цитата:
Нейросеть отнюдь не чорный яшшык, а статистико-собирающий автомат в модной упаковке с красивым названием, не более. Омонимия- да, остается, но ее негативное влияние нивелируется другими значащими штуками, если текст приличной длинны. Про вопрос Маленькой Сосны- я же написал, что я бы за это не взялся. Что касается общего вопроса- у меня в голове есть достаточно дубовый алгоритм, работающий на статистических показателях текстов, который должен обучится на какойто выборке заранее оттематизированных кусков текста - все руки не доходят до него- щас чото работы набрал прилично..
__________________
|
|
02.04.2010, 13:06 | #114 | ||
Магистр
Регистрация: 04.12.2007
Сообщений: 3,680
Вес репутации: 416
|
Цитата:
Добавлено через 14 часов 47 минут Цитата:
__________________
Последний раз редактировалось Йода; 02.04.2010 в 13:06. Причина: Добавлено сообщение |
||
28.02.2011, 18:23 | #115 |
Специалист
|
Случайно наткнулся на эту старую тему. Много интересных идей.
Я свою идею на нейронных сетях довел до ума, в использовании всё очень просто: регистрируемся сначала тут далее код: Код:
<?php Header("Content-Type: text/html; charset=utf8"); include('IXR_Library.php'); $text="Когда я готовил салат, я думал добавить помидоры, а потом еще надо было сходить на охоту"; $login="login"; $password="password"; $client = new IXR_Client('http://extheme.ru/xmlrpc.php'); if (!$client->query('extheme.theme_text', $login, md5($password),$text)) { die('An error occurred - '.$client->getErrorCode().":".$client->getErrorMessage()); } print_r($client->getResponse()); ?>
__________________
|
|
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Закажу прогон по каталогам для 4х сайтов, Ваши предложения? | GreatAlf | Партнерские программы, баннерная реклама | 8 | 23.02.2009 00:53 |
В связи с кризисом, какие темы для сайтов интересны Оптимиатором для покупки ссылок | FireWind | Курилка | 9 | 23.12.2008 21:06 |
На сколько интересны ссылки с доменов третьего уровня...? | DFish | Яндекс | 0 | 29.05.2008 17:46 |
Нужно добавить для площадок определение тематики из ЯК. | 9dVSnVN6 | Пожелания пользователей системы | 1 | 09.10.2007 12:12 |
Предложения от ВМ, а не от О | new | Пожелания пользователей системы | 8 | 12.08.2007 06:03 |
Часовой пояс GMT +3, время: 14:03.