Существующая практика методологии DMBOK делит данные на структурированные и неструктурированные, а в структурированных выделяются следующие категории: справочники и основные данные (мастер-данные), транзакционные, аналитические и отдельно метаданные.
Структурированные данные:- соответствуют определенной модели данных;
- имеют четко определенную структуру;
- могут использоваться человеком или компьютерной программой (машиночитаемы).
Неструктурированные данные представляют собой информацию, которая либо не имеет заранее определенной структуры данных, либо не организована в установленном порядке.
Неструктурированные данные, как правило:
- представлены в форме текста, который может содержать такие данные, как даты, цифры и факты или видео/аудио потоков;
- сопровождаются трудностями анализа, особенно в случае использования традиционных программ, предназначенных для работы со структурированными данными;
- несмотря на меньшую ценность по сравнению со структурированными данными занимают около 80% объема всех данных.