Глава 2
Реляционная модель данных
2.1. Основные понятия
Реляционная модель данных базируется на теории множеств, в которой применяются специальные математические символы, используемые в тексте учебного пособия и поясняемые далее:
– принадлежность элемента множеству (например,
означает, что элемент d принадлежит множеству D);
– отрицание принадлежности элемента множеству (например,
означает, что элемент d не принадлежит множеству D);
| D | – мощность множества D, равная числу элементов в этом множестве;
– вхождение одного множества в другое множество (например,
означает, что все элементы множества А одновременно являются элементами множества D и | А | ≤ | D |);
– включение одного множества в другое множество (например,
означает, что все элементы множества А одновременно являются элементами множества D и | А | < | D |);
– объединение множеств (например,
означает множество, элементы которого принадлежат множеству X или множеству У);
– пересечение множеств (например,
означает множество, элементы которого принадлежат одновременно множеству X и множеству У);
– пустое множество, т. е. множество, в котором отсутствуют элементы;
{а, b, с}– множество, состоящее из элементов а, b, с;
{е | у} — множество элементов е, удовлетворяющих условию у; при записи условия могут использоваться символы:
обозначающие логические операторы «И» и «ИЛИ» соответственно, например,
обозначает множество элементов х, которые принадлежат множеству R и не принадлежит множеству 5.
Реляционная БД – это совокупность отношений, содержащих всю информацию, которая должна храниться в БД.
Математически термин «отношение» определяется следующим образом.
Пусть даны N множеств D>1, D>2,…, D>N. Отношением R над этими множествами называется множество упорядоченных N-кортежей вида
Множества D>1, D>2, …, D>Nназываются доменами (областями определения) отношения R.
Поясним это определение конкретным примером. Пусть даны четыре домена: D>1 – множество целых чисел, обозначающих номера преподавателей; D>2 – множество символьных строк, представляющих собой фамилии преподавателей; D>3 – множество символьных строк, представляющих собой названия должностей; D>4 – множество целых чисел, обозначающих стаж работы преподавателей. На рис. 2.1 показан пример отношения R, состоящего из пяти кортежей.
Рис. 2.1. Отношение с математической точки зрения.
Каждый кортеж состоит из четырех элементов, которые выбираются каждый из своего домена. Порядок элементов в каждом кортеже строго определен: первый элемент кортежа выбирается из домена D, второй элемент – из домена D>2и т. д. Каждый элемент кортежа представляет собой значение одного из атрибутов, соответствующего одному из доменов.
С программной точки зрения отношение является файлом (рис. 2.2), каждая запись в файле представляет собой кортеж отношения, а поля в записи содержат значения соответствующих атрибутов или доменов.
Рис. 2.2. Отношение с точки зрения обработки данных.
Итак, разными точками зрения допускается следующая терминология:
Количество атрибутов в кортеже, или число столбцов в таблице, называется степенью отношения. Текущее число кортежей, или строк, называется мощностью отношения и обозначается как | R |. Степень отношения не изменяется после создания отношения, но мощность отношения будет изменяться при добавлении новых и удалении старых кортежей. Схемой отношения R называется перечень атрибутов А. данного отношения с указанием домена D>i, к которому они относятся:
По определению все кортежи различаются. Для однозначной идентификации конкретного кортежа используется так называемый первичный ключ отношения.