ОНТОЛОГИИ

Линвистические онтологии РуТез

Уникальным конкурентным преимуществом является разработанный комплекс РуТез лингвистических онтологий большого размера для автоматического концептуального индексирования текстов, прежде всего:

  • ЛО ОПТ – лингвистическая онтология по общественно-политической тематике для автоматического анализа тематики текстов СМИ, новостных потоков, нормативно-правовых актов и т.п.;
  • ЛО ОЕНТ – лингвистическая онтология по естественным наукам и технологиям – для анализа.

РуТез представляет собой лингвистический ресурс концептуального типа, то есть представляет собой иерархическую сеть понятий, к которым приписаны текстовые выражения.

Часть лингвистической онтологии - тезаурус РуТез-lite при поддержке Фонда Дмитрия Зимина "Династия" и финансовой поддержке основателей компании "Яндекс" опубликована на этом сайте (http://www.labinform.ru/pub/ruthes/index.htm) и свободно доступна для некоммерческого применения.

В настоящее время, при поддержке фонда РГНФ (грант 15-04-12017в) опубликована вторая версия тезауруса РуТез-lite 2.0.

RuWordNet - русский WordNet

Версия тезауруса РуТез-lite 2.0 стала основой для автоматизированного порождения тезауруса русского языка типа WordNet - RuWordNet.

РуСентиЛекс - словарь оценочных слов и выражений

Создан словарь оценочных слов и выражений русского языка РуСентиЛекс. Словарь создан автоматизированно, при поддержке фонда РФФИ (грант 14-07-00682а )

Коллекции для задачи извлечения именованных сущностей

Созданы размеченные коллекции для выделения именованных сущностей Named_Entities_5 и Named_Entities_3.

Автоматическая обработка текстов

Решены следующие задачи:

  • быстрое автоматизированное формирование лингвистической онтологии для новой предметной области;
  • разработаны развитые средства ведения лингвистической онтологии, в том числе поддержка распределенной работы экспертов;
  • имеются средства объединения и разделения лингвистических онтологий для разных задач;
  • разработаны алгоритмы и методы построения тематического представления содержания текста понятиями лингвистических онтологий;
  • разработаны методы автоматического рубрицирования, аннотирования, обзорного реферирования на основе тематического представления;
  • лингвистические онтологии широко используются при анализе и уточнении результатов запросов.