ОНТОЛОГИИ
Линвистические онтологии РуТез
Уникальным конкурентным преимуществом является разработанный комплекс РуТез лингвистических онтологий большого размера для автоматического концептуального индексирования текстов, прежде всего:
- ЛО ОПТ – лингвистическая онтология по общественно-политической тематике для автоматического анализа тематики текстов СМИ, новостных потоков, нормативно-правовых актов и т.п.;
- ЛО ОЕНТ – лингвистическая онтология по естественным наукам и технологиям – для анализа.
РуТез представляет собой лингвистический ресурс концептуального типа, то есть представляет собой иерархическую сеть понятий, к которым приписаны текстовые выражения.
Часть лингвистической онтологии - тезаурус РуТез-lite при поддержке Фонда Дмитрия Зимина "Династия" и финансовой поддержке основателей компании "Яндекс" опубликована на этом сайте (http://www.labinform.ru/pub/ruthes/index.htm) и свободно доступна для некоммерческого применения.
В настоящее время, при поддержке фонда РГНФ (грант 15-04-12017в) опубликована вторая версия тезауруса РуТез-lite 2.0.
RuWordNet - русский WordNet
Версия тезауруса РуТез-lite 2.0 стала основой для автоматизированного порождения тезауруса русского языка типа WordNet - RuWordNet.
РуСентиЛекс - словарь оценочных слов и выражений
Создан словарь оценочных слов и выражений русского языка РуСентиЛекс. Словарь создан автоматизированно, при поддержке фонда РФФИ (грант 14-07-00682а )
Коллекции для задачи извлечения именованных сущностей
Созданы размеченные коллекции для выделения именованных сущностей Named_Entities_5 и Named_Entities_3.
Автоматическая обработка текстов
Решены следующие задачи:
- быстрое автоматизированное формирование лингвистической онтологии для новой предметной области;
- разработаны развитые средства ведения лингвистической онтологии, в том числе поддержка распределенной работы экспертов;
- имеются средства объединения и разделения лингвистических онтологий для разных задач;
- разработаны алгоритмы и методы построения тематического представления содержания текста понятиями лингвистических онтологий;
- разработаны методы автоматического рубрицирования, аннотирования, обзорного реферирования на основе тематического представления;
- лингвистические онтологии широко используются при анализе и уточнении результатов запросов.