1.9. Об использовании баз данных и баз знаний для Аналитики
Аналитика тесно связана с использованием глобальных и локальных информационных сетей, баз данных (БД) и баз знаний (БЗ)[36].
Данные – это отдельные факты, характеризующие объекты, процессы и явления предметной области, а также их свойства. При обработке на ЭВМ данные, полученные в результате измерений и наблюдений, трансформируются, приобретая различные формы представления – таблицы, протоколы, справочники, модели (структуры) данных в виде диаграмм, графиков, функций. На машинных носителях информации данные фиксируются с помощью различных языков их описания в виде баз данных. БД организуется в соответствии с определёнными правилами и представляет собой совокупность данных, характеризующей актуальное состояние некоторой предметной области и используемой для удовлетворения информационных потребностей пользователей.
Знания – это закономерности предметной области, представленные через принципы, связи, законы, полученные в результате практической деятельности и профессионального опыта, позволяющие специалистам ставить и решать задачи в этой области. Они основаны на данных, полученных эмпирическим путем, представляют собой результат мыслительной деятельности человека. При обработке на компьютере знания трансформируются аналогично данным. Материальными носителями знаний выступают различного рода научные публикации – монографии, учебники, методические пособия. Существует также такое понятие как поле знаний – условное описание основных объектов предметной области, их атрибутов и закономерностей, их связывающих.
Отличие баз знаний от баз данных состоит в следующем. БД представляет собой жестко структурированную модель записей однородных данных, а БЗ представляет собой открытую модель семантической сети, которая может содержать разнородные и разнотипные данные.
База знаний, – это особого рода база данных, разработанная для управления знаниями (метаданными), то есть сбором, хранением, поиском и выдачей знаний. Раздел искусственного интеллекта, изучающий базы знаний и методы работы со знаниями, называется инженерией знаний. Под БЗ понимается совокупность фактов и правил вывода, допускающих логический вывод и осмысленную обработку информации. Например, в языке Пролог[37] базы знаний описываются в форме конкретных фактов и правил логического вывода на основе баз данных и процедур обработки информации, представляющих сведения и знания о людях, предметах, фактах событиях и процессах в логической форме.
Современные БЗ работают совместно с системами поиска информации, имеют классификационную структуру и формат представления знаний. Полноценные БЗ содержат в себе не только фактическую информацию, но и правила вывода, допускающие автоматические умозаключения о вновь вводимых фактах и, как следствие, осмысленную обработку информации. Область наук об искусственном интеллекте, изучающая БЗ и методы работы со знаниями, называется инженерией знаний.
Вообще создание сетей связано с интенсификацией таких процессов, как контроль функционирования централизованного государства через систему налогообложения, деятельность таможенных органов и т. д. Базы данных нужны везде – в бизнесе, на транспорте, в банковском секторе, в политике, в госстатистике, при решении вопросов гражданства, для борьбы с криминалом. Очевидно, начало этим процессам в современном смысле слова положил сбор данных при учёте народонаселения для обеспечения воинской повинности. В далёкие средние века в итальянских городах-государствах Венеции и Генуе создавались БД для сопровождения бизнеса в банковской сфере. Эти БД были действенны (за ними стояло финансовое могущество банковских структур и государства), но достаточно ограничены по своим масштабам, охватывали незначительное число граждан по различным аспектам их финансового взаимодействия между собой, что отражалось в этих базах.