01/11/2007 19:15
Ученые из Санкт-Петербурга разработали технологию, позволяющую компьютеру
автоматически распознавать слова и вести диалог с пользователем практически
на любые заданные темы. С ее помощью можно существенно повысить эффективность
работы информационно-справочных служб, однако этим возможности уникальной
разработки не исчерпываются. Математики и программисты из Санкт-Петербургского
института информатики и автоматизации РАН, который в этом году празднует
свой 30-летний юбилей, вместе с коллегами из Дрезденского технологического
института и российской компании NewVoice разработали российскую технологию
распознавания голоса. В Российской Академии Наук сообщили, что система SIRIUS
(Spiiras Interface for Recognition and Integral Understanding of Speech),
которую авторы представили на V Международной специализированной выставке
«Робототехника» (17-20 октября 2007, Москва) – представляет собой систему
автоматического распознавания и интегрального понимания русской речи. Пока
в словаре системы тысяча слов, которые компьютер уверенно выделяет и распознает
в слитной, что очень важно, речи пользователя. Однако это не предел. В принципе
система позволяет оперативно пополнять словарь новыми словами и оборотами,
что интересно – с учетом фонологических и морфологических особенностей русской
разговорной речи. То есть всякие, например, московские «аканья» или вологодские
«оканья» ее не смутят, говорят разработчики. Кто бы и как бы ни произнес
уже известное системе слово, она уверенно выделит его из словесного потока
и среагирует заданным образом – переадресует звонок тому, кто обладает нужной
информацией, если это SIRIUS-секретарь, или перейдет к следующему, уточняющему
вопросу, если это SIRIUS-справочная. Однако всякого рода справочно-информационные
службы – это не единственное направление деятельности SIRIUS. Есть и другие.
Так, например, по замыслу авторов, он может быть частью системы, позволяющей
управлять ПК в бесконтактном режиме – только движением глаз, лица и голосом.
Соответствующую систему специалисты из СПИИ РАН разрабатывают не первый
год, и значительно продвинулись в этом направлении. Они уже создали одну
из первых российский многомодальных систем, названную ICanDo, которая позволяет
управлять курсором без мышки – только движениями лица или вообще взглядом.
Для этого видеокамера отлеживает перемещения пяти точек на лице человека
(зрачки, кончик носа, центр верхней губы и середина переносицы) и использует
полученную информацию так же, как и сигнал, полученный при перемещении мышки.
Если же информация компьютеру будет поступать синхронно двумя потоками –
звуковым, благодаря использованию системы распознавания речи, и оптическим,
это существенно повысит и эффективность, и точность работы всей системы
в целом. А уж область применения подобных универсальных систем практически
безгранична – от помощи инвалидам, лишенным возможности двигаться, до бесконтактного
управления бытовой техникой и «умными домами».
Оригинал (на 01/11/2007): cybersecurity.ru
В случае обнаружения неточностей или ошибок просим Вас сообщить об этом по адресу
|