Нормализация данных
В результате выполнения работ заказчику передается массив эталонных данных в формате Excel и методика нормализации, включающая описание шагов нормализации и порядка их выполнения, правила разбора и заполнения значений атрибутов данных и описание моделей текстовой аналитики.

В ходе нормализации может быть выполнена обработка и ввод данных первичных документов (см. Обработка документов).

В зависимости от полноты и качества исходных данных их нормализация может выполняться с большей или меньшей степенью автоматизации.

Проектный опыт N-Forma показывает, что доля данных, пригодных для автоматической нормализации, не превышает 20%.
Основные работы и результаты нормализации
Время, необходимое для выполнения работ по нормализации, и их стоимость определяются на основе следующих показателей:

  • Количество справочников;
  • Количество записей в справочниках;
  • Количество полей в справочниках;
  • Процент полей, заполненных вручную;
  • Процент нормализованных данных;
  • Процент данных, не требующих нормализации;
  • Процент автоматически нормализуемых данных;
  • Процент данных, нормализуемых вручную;
  • Количество справочников в исходных данных;
  • Качество исходных данных.