Технология нормализации данных N-Forma представляет собой
формализованный и воспроизводимый подход к обработке структурированных и слабо структурированных массивов данных, предназначенный для очистки, структурирования, атрибутизации, классификации, обогащения, дедубликации и подготовки данных к использованию в информационных системах.
Технология опирается на
формальные модели качества данных и практики управления мастер-данными, включая ISO 8000, ISO/IEC 25 012, ISO/IEC 25 024 и подходы DAMA-DMBOK. Указанные источники используются как основа для проектирования правил качества, определения характеристик данных, настройки процедур контроля и документирования решений по нормализации.
Технология оперирует следующими базовыми сущностями:
- атрибут,
- допустимое значение атрибута,
- классификационная модель,
- шаблон нормализованного описания,
- эталонная запись,
- матрица соответствия,
- правило сопоставления,
- правило дедубликации,
- внешний источник обогащения,
- контур публикации результатов.
N-Forma рассматривает нормализацию как
последовательность управляемых операций, для которых формируются
- явные правила обработки,
- атрибутивные и классификационные модели,
- критерии сопоставления,
- процедуры контроля качества.
Технология ориентирована на работу со справочниками МТР, услуг, контрагентов, договоров, физических лиц, финансовой и управленческой аналитики, внешних и внутренних классификаторов, а также с иными наборами данных, в которых присутствуют неоднородность структуры, вариативность представления значений, смешанные поля и дублирующиеся записи.
Результатом применения технологии является
нормализованный массив данных в согласованной структуре, пригодный для загрузки в ERP-, MDM-, BI-, CRM-, PLM- и иные прикладные системы, а также для дальнейшей машинной обработки, аналитики и интеграции.