Texterra

Система интеллектуального анализа текстов, построенная на открытых данных

Демо

В основе системы Texterra лежат инструменты для автоматического извлечения баз знаний из открытых частично структурированных ресурсов, таких как Википедия и Викиданные, и интеллектуального анализа текстов, использующие эти знания.

С помощью Texterra можно в автоматическом режиме проводить лингвистический анализ текстов на русском и английском языках и извлекать фактическую информацию, а также анализировать мнения, представленные в текстах.

В системе Texterra используются результаты передовых исследований в областях интеллектуального анализа текстов и машинного обучения, а также собственные уникальные разработки ИСП РАН.

С 2008 года Texterra прошла путь от исследовательского прототипа до инновационного продукта, нашедшего применение у индустриальных партнеров ИСП РАН. В частности, на основе Texterra решаются такие задачи, как

  • мониторинг репутации людей и организаций на основе анализа социальных медиа
  • информационный поиск
  • разработка рекомендательных систем на основе анализа контента

В настоящее время Texterra является быстрым и масштабируемым решением с открытым программным интерфейсом, которое позволяет обрабатывать данные как в облачной инфраструктуре ИСП РАН, так и в инфраструктуре партнеров.