Платформа анализа неструктурированной информации

Современный бизнес вынужден работать с разнообразным массивом источников информации, представленной в электронном виде.

Компания  уже длительное время эффективно использует решения, способные выполнять различные бизнес-задачи, связанные с обработкой большого объема  текстовой информации.

Платформа анализа неструктурированной информации (далее-Платформа) является комплексом технологий и методов для анализа сети информационных потоков, которые агрегируют, нормализуют и классифицируют неструктурированную информацию из множества источников хранения.

Результаты внедрения платформы:

 

Корпоративные приложения для:

  • кросс-системного поиска внутренних документов организации;
  • поиска экспертов;
  • автоматической классификации электронной почты;
  • интеллектуальной агрегации новостных потоков;
  • анализа электронных архивов и баз знаний.

 

Расширение возможностей существующих систем электронного документооборота посредством:

  • рекомендаций по маршрутизации входящих документов;
  • текстовой аналитики по обращениям граждан;
  • автоматической классификации документов.

Область применения:

  • обнаружение плагиата (Наука и образование):
  • поиск пробелов и коллизий в законодательстве (Юристы);
  • правовая экспертиза (Юристы);
  • мониторинг СМИ (Маркетинг);
  • мониторинг торговых площадок (Продажи);
  • анализ корпоративной культуры (HR);
  • поддержка инновационной деятельности (R&D);
  • поиск инсайдеров/утечек информации (Безопасность).

Применяемые технологии обработки неструктурированной информации:

  • поисковые роботы, коннекторы к различным системам и текстовым форматам;
  • разбор, очистка, нормализация текстовой информации;
  • выделение сущностей (организации, персоны, времени, адреса, географии, документов и т.п.);
  • расчет значимости лексики;
  • анализ топологии и динамических характеристик сети информационных потоков;
  • измерение семантической похожести между объектами.