Извлечение информации Texterra

Извлечение информации Texterra – это набор инструментов анализа текстов, позволяющий выявлять имена и прозвища сущностей (людей, мест, организаций и др.), искать их в базах знаний (Википедии), а также определять ключевые сущности.


В тот момент Владимиримя человека пытался побороть свою ярость.

После установления советской власти многие улицы Владимирагород Владимир были переименованы.

Вечный городгород Рим расположился на семи холмах более двух тысяч лет назад.

Возможные сценарии применения:
Поиск популярных медиаперсон в социальных сетях за последнее время
Поиск отзывов на продукцию (например, автомобили, фильмы) в Веб
Рекомендация сущностей, ассоциированных с заданной

Особенности:
Поддерживает более 30 типов сущностей
Может быть легко адаптировано для новых классов сущностей, благодаря применению машинного обучения

Следующее приложение демонстрирует возможности извлечения информации Texterra на примерах недавних новостных текстов и сообщений Twitter

Следующая новость
 

Путин и Си Цзиньпин обсудят Украину во время встречи на саммите ШОС в Самарканде. Президент РФ Владимир Путин и председатель КНР Си Цзиньпин на встрече в Самарканде 15 сентября обстоятельно обсудят ситуацию на Украине, сообщил помощник российского лидера по международным делам Юрий Ушаков, подчеркнув, что Китай подходит сбалансированно к украинскому кризису, понимая причины спецоперации.

Найденные сущности
GPE_COUNTRY
  • Китай
  • российского
  • Украине
  • КНР
PERSON
  • Юрий Ушаков
  • Си Цзиньпин
  • Владимир Путин
  • Путин
GPE_CITY
  • Самарканде
ORGANIZATION_POLITICAL
  • ШОС

Кроме того, на основе извлечения информации Texterra мы разработали несколько демо-приложений для конечных пользователей

Анализ блогосферы

Извлечение фактов