В основе системы Texterra лежат инструменты для автоматического извлечения баз знаний из открытых частично структурированных ресурсов, таких как Википедия и Викиданные, и интеллектуального анализа текстов, использующие эти знания.
С помощью Texterra можно в автоматическом режиме проводить лингвистический анализ текстов на русском и английском языках и извлекать фактическую информацию, а также анализировать мнения, представленные в текстах.
В системе Texterra используются результаты передовых исследований в областях интеллектуального анализа текстов и машинного обучения, а также собственные уникальные разработки ИСП РАН.
С 2008 года Texterra прошла путь от исследовательского прототипа до инновационного продукта, нашедшего применение у индустриальных партнеров ИСП РАН. В частности, на основе Texterra решаются такие задачи, как
- мониторинг репутации людей и организаций на основе анализа социальных медиа
- информационный поиск
- разработка рекомендательных систем на основе анализа контента
В настоящее время Texterra является быстрым и масштабируемым решением с открытым программным интерфейсом, которое позволяет обрабатывать данные как в облачной инфраструктуре ИСП РАН, так и в инфраструктуре партнеров.