03/10/2006 17:01
В компании Яндекс сегодня презентовали новую онлайновую службу "Цитаты
в новостях" - http://opinion.news.yandex.ru/. «Цитаты в новостях» позволяет
искать высказывания людей в сообщениях СМИ. Самые популярные высказывания
и самые цитируемые за последние сутки авторы представлены на главной странице
сервиса. Это новостная картина дня в прямой речи главных действующих лиц.
«Цитаты в новостях» стали следующим после пресс-портретов применением технологии
извлечения фактов (fact extraction), разработанной в Яндексе. "Теперь за
секунды можно узнать, например, что Владимир Путин говорит о преемнике или
об интернете, как Юрий Лужков относится к пчелам и кого Джордж Буш считает
врагом, как изменялось мнение Григория Явлинского об СПС и кто из политиков
высказывался на тему «мигалок»", - говорится с пресс-релизе компании. «Мы
надеемся, что наш новый сервис будет полезен всем, кто привык получать объемную
новостную картину, кому важны и интересны разные комментарии и оценки актуальных
событий. Поиск цитат в новостях поможет отличать слухи от фактов, докапываться
до первоисточника, — говорит Лев Гершензон, ведущий разработчик компании
"Яндекс". — Кроме того, публичные лица часто говорят вещи абсурдные и комичные,
и поиск всевозможных перлов может стать веселой игрой». В основе технологии
выделения цитат лежит синтаксический анализатор и модуль обработки предикативных
конструкций с коммуникативными глаголами и оборотами. Выделяется как прямая
речь в кавычках, так и косвенная речь, выраженная придаточными предложениями
(«Иванов отметил, что ...») и вводными оборотами («по словам Иванова, ...»).
Использование результатов извлечения всех фактов о человеке и полный анализ
всего новостного сообщения позволяют с высокой точностью различать однофамильцев
при определении автора высказывания, даже если в предложении с цитатой никакой
дополнительной информации кроме имени и фамилии указано не было.
Оригинал (на 03/10/2006): cybersecurity.ru
В случае обнаружения неточностей или ошибок просим Вас сообщить об этом по адресу
|