Мобильная версия

ABBYY InfoExtractor SDK

ABBYY InfoExtractor SDK – решение, основанное на уникальной технологии ABBYY Compreno, которое с высокой точностью извлекает важную для бизнеса информацию из массивов данных.

Уникальные возможности ABBYY InfoExtractor SDK по выявлению в текстах объектов, фактов и связей между ними позволят разработчикам и интеграторам создавать продвинутые решения для аналитики и интеллектуального ввода данных. Благодаря работе с информацией на уровне смысла, ABBYY InfoExtractor SDK обеспечит высокую точность извлечения информации для автоматизации и поддержки бизнес-процессов организаций, требующих точного и досконального понимания данных.

Преимущества

Для коммерческих компаний и государственных организаций:

Высокая точность и полнота результатов анализа

Качественный анализ данных при минимальном предварительном обучении

Автоматическое тегирование документов

Подробнее ›

Для разработчиков программного обеспечения и интеграторов:

Решение актуальных задач заказчиков

Квалифицированная поддержка на русском языке

Подробнее ›

Возможности

Извлечение сущностей и событий с высокой точностью

ABBYY InfoExtractor SDK позволяет выявлять значимые объекты в тексте, такие как люди, организации, даты, географические объекты и многие другие. Решение также извлекает события, например, заключение коммерческой сделки, высказывания, факты наличия гражданства, трудовой деятельности и многие другие. Основанный на технологии анализа и понимания текстов на естественном языке Compreno, ABBYY InfoExtractor SDK анализирует сущности и события на уровне их смысла, успешно справляясь с многозначностью слов.

Установление связей между сущностями и событиями

Выполняя полный лингвистический анализ текстов, ABBYY InfoExtractor SDK устанавливает связи между объектами и событиями, позволяя обнаруживать факты и анализировать их: например, ABBYY InfoExtractor SDK поможет найти сделку, которая связывает конкретного покупателя и продавца, и её детали: сумму, товар, дату, место. Выявление связей важно не только для задач исследования, но и для точности анализа в целом. Установление связей помогает определить сущности в тексте, которые заменены местоимениями или проследить их упоминания в тексте, соединяя все связанные факты в одну «историю».

Добавление пользовательских объектов

Для случаев, когда в текстах используются объекты, которые могут быть сложны для извлечения (например, редкие азиатские имена или названия организаций), InfoExtractor позволяет создавать онтологический словарь. Простой алгоритм, описанный в документации SDK, помогает добавлять новые понятия в существующие классы, при этом новые объекты автоматически унаследуют правила извлечения и не потребуют дополнительного описания.

Создание отраслевых онтологий

В дополнение к базовым онтологиям, которые включают наиболее распространенные данные, профессиональная лингвистическая служба ABBYY может персонифицировать существующие онтологии по конкретным отраслевым темам или разработать их с нуля.

Использование ведущих технологий распознавания ABBYY

ABBYY InfoExtractor SDK оснащен технологией оптического распознавания символов ABBYY, которая позволяет анализировать сканы документов (в графических форматах tiff, jpeg и др.) и PDF-файлы. Также, если необходимо распознать большие объемы документов, ABBYY InfoExtractor SDK может быть легко интегрирован с ABBYY Recognition Server.