Следует заметить, что здесь в отношении термина «информация» мы ограничиваемся его общепринятыми нестрогими определениями и не обсуждаем научные определения, используемые в теории связи, теории информации и кибернетике и связанные с понятием количества информации. Отметим только, что известны два основных сугубо научных подхода к определению этого термина[42].
Согласно первому, информация – это внешнее описание объекта, содержащееся в передаваемом сообщении. Количество информации определяется как мера неопределенности, снимаемой полученным сообщением. Такое представление в 1948 году ввел Клод Шеннон[43] в своей статье «Математическая теория связи», попутно предложив для обозначения наименьшей единицы информации использовать слово «бит».
Согласно второму подходу, информация не связывается с передаваемым сообщением. Она относится к объекту и есть мера его разнообразия. Автор этого представления – Уильям Эшби[44].
Указанные научные определения в дальнейшем в этой книге не используются, поскольку ценность информации слабо связана с ее количеством. Важность информации субъективна и зависит от цели ее потребителя. Все способы количественного определения ценности основаны на представлении о цели, достижению которой способствует полученная информация. Чем больше информация помогает достижению цели, тем более ценной она считается[45]. Массив информации объемом в сотни гигабайт может иметь колоссальную важность для одной организации и нулевую для другой.
Основываясь на приведенных сведениях, можно продолжить обсуждение вопросов, относящихся к ценности данных.
Как уже говорилось выше, применительно к сфере управления данными термины «данные» и «информация» часто используются как синонимы. Кроме того, как видно из приведенных выше определений, термин «информация» иногда заменяется термином «знания».
Всегда ли допустимо такое обобщение и не приводит ли оно к недоразумениям? В частности, к существенному недопониманию между участниками многочисленных проектов по внедрению различного рода информационных систем, а также между участниками их дальнейшей эксплуатации и пользователями. В том числе и по вопросам определения ценности данных.
Для ответа необходимо более подробно обсудить взаимосвязь понятий «данные» и «информация», а также соотнести их с понятиями «знания» (knowledge) и «мудрость» (wisdom).
2.2. Информационная иерархия
При обсуждении взаимосвязи понятий «данные», «информация», «знания» и «мудрость» обычно используется классическое представление – иерархия Data-Information-Knowledge-Wisdom (DIKW). Часто в литературе применяются названия «иерархия знаний», «пирамида знаний» или же «информационная иерархия», «информационная пирамида».
В большинстве исследований, посвященных происхождению иерархии DIKW (например,[46][47][48]) в качестве одного из наиболее ранних источников, в которых встречается ее описание, обычно упоминается статья Харлана Кливленда[49] «Информация как ресурс». Она была опубликована в 1982 году в американском журнале The Futurist[50].
По мнению Кливленда, данные образуются в результате исследований, а также путем создания или сбора или же совершения открытий, в то время как информация имеет контекст. Данные превращаются в информацию с помощью организации их таким образом, чтобы мы могли легко делать какие-либо заключения. Кроме того, они преобразуются в информацию с помощью представления (презентации), например в визуальной или аудиальной (звуковой) форме.
Хотя известно несколько более ранних публикаций других авторов, затрагивающих эту тему