В настоящее время, когда все больше и больше баз данных разрабатываются на основе конкретных баз данных по одной и той же теме, может возникнуть необходимость в определении новых наборов данных (образцов) для каждой базы данных или запроса к базе данных. Некоторые решения существуют, например, для классификации полей метаданных в базах данных и базах данных для разных коллекций. Но задача состоит в том, чтобы как можно чаще использовать существующие базы данных, а не создавать новые базы данных с разными целями.
Еще одним хорошим примером семантической неоднородности является множество программных платформ и механизмов обработки данных, используемых для веб-сервисов. У каждой платформы и базы данных есть свой способ отображения данных. Важно не использовать разные источники данных для разных веб-приложений, а найти способ согласовать разные источники данных с разными веб-приложениями. Хотя источники данных, управление данными, приложения и системы неоднородны, нам нужна база данных, которая предоставляет все необходимые данные, когда требуются разные приложения или системы. И по мере разработки новых платформ и баз данных можно ожидать, что семантическая неоднородность останется ключевой особенностью систем анализа данных.
Обнаружение данных
Сложность различных баз данных и механизмов данных часто скрыта от конечного пользователя. Во многих случаях, если пользователь данных не знаком с источниками данных, системами управления данными и анализа данных, он, вероятно, не сможет найти нужные ему данные. Инструменты обнаружения данных, которые используются специалистами по данным на предприятии, обеспечивают более целостное представление данных во всех приложениях и источниках данных и используются для обнаружения источников данных и систем управления данными. Поэтому инструменты обнаружения данных, предназначенные для обнаружения источников данных и систем управления данными, должны быть способны интегрироваться со всеми системами, используемыми для создания данных. Кроме того, любой инструмент должен иметь возможность связать инструмент обнаружения данных с другими инструментами анализа данных или системами управления данными.
Каково будущее инструментов обнаружения данных и где мы можем ожидать появления решений для обнаружения данных для конкретных приложений? Часть текущей работы можно рассматривать как инструменты для определения того, какие базы данных и источники данных доступны, как следует комбинировать источники данных и базы данных и какие данные фильтровать.