что такое подсхема в информатике
Уровни представления баз данных. Понятия схемы и подсхемы
Современная технология баз данных основана на концепции многоуровневой архитектуры СУБД. Эти идеи впервые были сформулированы в отчёте рабочей группы по базам данных Комитета по планированию стандартов Американского национального института стандартов (ANSI/X3/SPARC). Этот отчёт был опубликован в 1975 г. В нём была предложена обобщенная трёхуровневая модель архитектуры СУБД, включающая концептуальный, внешний и внутренний уровни (рис. 1.7).
Рис.1.7 Уровни представления данных
Концептуальный уровень архитектуры ANSI/SPARC служит для под-держки единого взгляда на базу данных, общего для всех её приложений и независимого от них и от среды хранения [6]. Концептуальный уровень представляет собой формализованную информационно-логическую модель ПО. Описание этого представления называется концептуальной схемой или схемой БД.
Схема базы данных – это описание базы данных в терминах конкретной модели данных. |
Внутренний уровень архитектуры поддерживает представление данных в среде хранения и пути доступа к ним [6]. На этом архитектурном уровне БД представлена в полностью «материализованном» виде, тогда как на других уровнях идёт работа на уровне отдельных экземпляров или множества экземпляров данных. Описание БД на внутреннем уровне называется внутренней схемой или схемой хранения.
Внешний уровень архитектуры БД предназначен для групп пользователей. Описание представления данных для группы пользователей называется внешней схемой. Наличие внешнего уровня позволяет поддерживать разное представление одних и тех же данных для различных групп пользователей или задач [6].
Подсхема базы данных – это описание структуры данных прикладного программиста.
Каждый из этих уровней может считаться управляемым, если он обладает внешним интерфейсом, который обеспечивает возможности определения данных. В этом случае становится возможными формирование и системная поддержка независимого взгляда на БД для какой-либо группы персонала или пользователей, взаимодействующих с БД через интерфейс данного уровня.
В архитектурной модели ANSI/SPARC предполагается наличие в СУБД механизмов, обеспечивающих междууровневое отображение данных «внешний – концептуальный» и «концептуальный – внутренний». Функциональные возможности этих механизмов определяют степень независимости данных на всех уровнях. На переходе «внешний – концептуальный» обеспечивается логическая независимость данных, на переходе «концептуальный – внутренний» – физическая независимость. Под логической независимостью подразумевается возможность вносить изменения в концептуальный уровень, не меняя представление БД для пользователей, или изменять представление данных для пользователей без изменения концептуальной схемы. Физическая независимость данных подразумевает возможность вносить изменения в схему хранения, не меняя концептуальную схему БД.
Основной характеристикой баз данных является совместное использование данных многими пользователями АИС. Должно существовать какое-то общее понимание информации, представленной данными. Общее понимание должно относиться к чему-либо внешнему по отношению к пользователям, и оно должно быть зафиксировано. Для этого необходима некоторая предварительно определённая грамматика, которую принято называть моделью данных.
Уровни представления данных. Понятия схемы и подсхемы данных
При разработке баз данных в зависимости от степени абстрагирования данных выделяют три уровня представления данных: концептуальный уровень, логический и физический.
Физический уровень – уровень представления данных, учитывающий способ организации данных на машинном носителе в виде бит, байт и их структур. Как видно уровень абстракции данных уменьшается от концептуального уровня представления данных к физическому уровню.
Как видно основные этапы проектирования баз данных (концептуальное, логическое, физическое проектирование) также соответствуют трехуровневой архитектуре представления данных.
Следует отметить, что на западе принята двухуровневая система представления данных, используемая при описании баз данных. Рассматриваются логический и физический уровни представления данных. Это связано с тем, что в настоящее время при разработке баз данных в основном используются реляционные или объектно-реляционные модели данных, и этапы концептуального и логического проектирования реляционных баз данных совмещены. Отсюда все современные CASE-средства проектирования баз данных позволяют строить логические и физические модели баз данных (см. раздел 1.5).
На каждом уровне представления данных имеются различные модели представления данных. Фактически синонимом понятия модели данных является понятие схемы базы данных.
Внешний уровень Представление 1 Представление 2……… Представление n
Концептуальный уровень Концептуальная схема
Внутренний уровень Внутренняя схема
Физическая организация данных База данных
При описании базы данных возможно наличие нескольких внешних схем или подсхем, соответствующих представлениям о данных предметной области различными пользователями. На концептуальном уровне описание базы данных называют концептуальной схемой, на нижнем уровне абстракции – внутренней схемой. Следует различать описание базы данных и саму базу данных. Описанием базы данных является схема базы данных или модель данных. Схема создается в процессе проектирования базы данных. Совокупность информации, хранящаяся в базе данных в определенный момент времени, называется состоянием. Таким образом, одной и той же схеме данных может соответствовать несколько состояний базы данных. Схема базы данных иногда называется содержанием базы данных, а ее состояние детализацией. Схема базы данных показывает логическую организацию всей базы данных в целом, а подсхема – описание части базы данных, описание представления о данных отдельного пользователя или приложения.
Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет
Схемы и подсхемы
Тема : Схемы и подсхемы.
Если бы назначением базы данных (БД) было только хранение данных, то ее структура была бы простой. Причина ее сложности в том, что она должна обеспечивать связи.
Прежде всего следует обсудить способ, с помощью которого пользователи БД представляют эти связи.
Структуру данных необходимо описывать формализованным образом. Описания логической и физической структур БД используется программными средствами управления БД при обработке требований пользователей на получение той информации, которую содержит БД. Описание логической структуры БД называется схемой. Схема представляет собой таблицу типов используемых данных. Она содержит имена объектов и их атрибуты и указывает на существующую между ними связь. Если схема содержит значения элементов данных, как на рис. 7. Ее называют экземпляром схемы.
На рис. 10 приведен пример схемы:
Рекомендуемые файлы
Сплошные линии, соединяющие блоки, отображают связи. Запись Заказ_на_закупку связана с записями Статья_закупки, в которых содержится заказ на закупку. Запись Поставщик связана с записями Расценка, описывающими поставляемые товары и расценки. Связи на схеме могут обеспечивать передачу такой информации, которая не представлена конкретными элементами данных, показанными на схеме.
Штриховые линии отображают перекрестные ссылки. Они не обеспечивают передачу дополнительной информации и если их убрать, то потери информации не произойдет.
Термин схема используется для определения полной таблицы всех типов элементов данных и типов записей, хранимых в БД. Термином подсхема определяют описание данных, которое использует ПП – лист. На основе одной схемы можно составить много различных подсхем. Например, на рис. 11 приведены подсхемы двух ПП – листов. Программисты имеют различные представления о данных, но обе подсхемы получены из схемы, приведенной на рис. 11.
Подсхема программиста А
Подсхема программиста В
Ни схемы, ни подсхемы не отражают способов физического запоминания данных. Существует 4 различных вида описания данных:
1. подсхема – таблица, описывающая ту часть данных, которая ориентирована на нужды одной или нескольких прикладных программ.
2. глобальное описание логической структуры БД или схема – таблица, логически описывающая всю БД. Она отражает представление о данных администратора БД.
3. описание физической организации БД – таблица физического расположения данных на носителях информации. Это представление о данных нужно системному программисту, который занимается вопросами эффективности работы системы, расположения или поиска, а также вопросами использования методов сжатия данных.
4. описание данных, которое система передает пользователю терминала БД как можно более близким к тому описанию данных, которое он использует в своей работе.
Связи этих четырех видов описания данных представлены на рисунке 12.
Следующий момент, который следует обсудить – это связи между элементами данных.
Взаимосвязь между двумя типами данных может быть простая и сложная. Под простой связью понимается такая связь, в которой элементы соединяются один с одним. Например, №_служащего и Имя, так как каждое имя имеет соответствующий №_служащего и наоборот.
Связь между служащим и отделом простая (каждый служащий может работать только в одном отделе), а связь между отделом и служащим сложная, называемая также «многие к одному», (в каждом отделе может работать много служащих).
Четыре типа связи возможны между двумя наборами элементов А и В. связь А с В может быть простой, а обратная связь – сложной и наоборот, а также обе связи могут быть простыми или сложными. На рис. 13 изображены все эти варианты.
А ↔В – один к одному; А В – один ко многим;
А В – многие к одному; А В – многие ко многим
На рис. 14 показаны два способа представления связей между двумя наборами элементов.
4. Понятие и роль схемы и подсхемы.
Описание концептуального и соответствующего ему физического представления (описание структуры БД) хранится автономно, называется схемой БД и создается до того, как начнет наполняться БД.
Описание подмножества концептуального представления, которое соответствует внешнему представлению для некоторого приложения (описание части структуры БД, доступной программе обработки), называется подсхемой.
Используя подсхему и схему, СУБД обеспечивает настройку приложения на работу с физической базой данных. Тем самым достигается универсализм СУБД по отношению соответствия внешнего представления – физическому, а значит, обеспечивается принцип независимости программ обработки от физической структуры БД.
С другой стороны, программа обработки может получить только те данные и выполнять только те процедуры (чтения, а возможно обновления данных), которые указаны в ее подсхеме. Тем самым обеспечивается защита БД от несанкционированного доступа.
Пользователь, проектируя обработку данных для получения требуемого результата, определяет требуемое внешнее представление как подмножество концептуального представления и в принципе может не знать физической организации БД. СУБД, «понимая» соответствие концептуального и физического представления и «зная» внешнее представление, определяет откуда физически надо выбрать требуемую информацию и в каком виде предоставить ее приложению (программе обработки или непосредственно конечному пользователю). Если осуществлена реорганизация (развитие) физической БД, меняется схема, но если из новой структуры БД возможно получить данные в соответствии с некоторой подсхемой, то программу, которой соответствует подсхема изменять не нужно – реализация принципа независимости программ от физической структуры БД.
5. База данных как средство отображения информационной модели предметной области.
Особенность Концепции баз данных заключается в следующем:
1. Информационно описывается множество объектов некоторой предметной области. Это могут быть объекты самой различной природы (личности, предметы производства, научные исследования, некоторые явления и др.). Главное, что объекты в предметной области обладают (могут быть описаны) некоторыми свойствами (параметрами, характеристиками, показателями и т.п.). При этом для разных объектов значение одноименного параметра может быть различным, но выбирается из одного множества возможных значений, называемого словарем (классификатором, доменом).
Естественное понятие однородных (однотипных) объектов с информационной точки зрения может быть формально определено как множество объектов, для которых имеет смысл одно и то же полное множество параметров.
2. При информационном моделировании на ЭВМ предметная область отображается в компьютерные данные следующим образом:
описание множества однотипных объектов с определенной стороны (по некоторой группе параметров) представляется в виде файла, причем одному объекту в файле соответствует одна либо несколько записей. Одному объекту предметной области будет соответствовать несколько записей в файле в том случае, если по упомянутой группе параметров необходимо хранить несколько экземпляров описаний (за разные периоды времени, по технологическим переходам и т.п.);
полная информация об объектах предметной области (всестороннее описание объектов) хранится в системе взаимосвязанных файлов, называемой базой данных. Взаимосвязь файлов отражает взаимосвязь объектов разных типов и различных описаний внутри одного типа.
Необходимость хранения и эффективного использования информационной модели предметной области явилась одной из основных (наряду с обеспечением независимости программ от структуры хранения данных) причин возникновения концепции БД и использования СУБД.
В публикациях, связанных с теорией структуризации данных, нет четкого разделения понятий структуры и модели. Если иерархическую и сетевую структуры иногда представляют и как модели данных (без дополнительного пояснения), то всегда говорят о реляционной модели данных. Попытаемся выделить это различие в соответствующих определениях.
Под структурой данных будем понимать совокупность информационных элементов и связей между ними.
Под моделью данных будем понимать соответствующих тип структуры данных и типовые операции по управлению данными.
Следует также заметить, что когда говорят о структуре данных как о модели данных, то имеют в виду логическую структуру, под которой понимают представление информационных элементов и связей между ними вне зависимости от способа их размещения в памяти компьютера.
В противовес этому, под физической структурой понимают представление информационных элементов и связей между ними в памяти компьютера, вплоть до представления символов, а возможно и указателей связи битовыми кодами.
Что такое схемы базы данных? 5-минутное руководство с примерами
При создании серверной части приложения необходимо учитывать, как интерфейс будет взаимодействовать с серверной частью. Однако более важным является построение и дизайн вашей базы данных. Отношения между вашими формами данных приведут к построению вашей схемы базы данных.
Схема базы данных является абстрактным дизайн, который представляет собой хранение ваших данных в базе данных. Он описывает как организацию данных, так и отношения между таблицами в данной базе данных. Разработчики заранее планируют схему базы данных, чтобы знать, какие компоненты необходимы и как они будут соединяться друг с другом.
В этом руководстве мы узнаем, что такое схема базы данных и почему они используются. Мы рассмотрим несколько распространенных примеров, чтобы вы могли узнать, как настроить схему базы данных самостоятельно.
Что такое схемы базы данных?
Когда дело доходит до выбора базы данных, одна из вещей, о которой вы должны подумать, — это форма ваших данных, модель, которой они будут следовать, и то, как сформированные отношения помогут нам при разработке схемы.
Схема базы данных — это план или архитектура того, как будут выглядеть наши данные. Он не содержит самих данных, а вместо этого описывает форму данных и то, как они могут быть связаны с другими таблицами или моделями. Запись в нашей базе данных будет экземпляром схемы базы данных. Он будет содержать все свойства, описанные в схеме.
Думайте о схеме базы данных как о типе структуры данных. Он представляет собой структуру и структуру содержимого данных организации.
Схема базы данных будет включать:
Размер и сложность схемы вашей базы данных зависит от размера вашего проекта. Визуальный стиль схемы базы данных позволяет программистам правильно структурировать базу данных и ее взаимосвязи, прежде чем переходить к коду. Процесс планирования дизайна базы данных называется моделированием данных.
Схемы важны для проектирования систем управления базами данных (СУБД) или систем управления реляционными базами данных (СУБД). СУБД — это программное обеспечение, которое хранит и извлекает пользовательские данные безопасным способом в соответствии с концепцией ACID.
Во многих компаниях ответственность за проектирование базы данных и СУБД обычно ложится на роль администратора базы данных (DBA). Администраторы баз данных несут ответственность за обеспечение беспрепятственного доступа к информации аналитикам данных и пользователям баз данных. Они работают вместе с командами менеджеров для планирования и безопасного управления базой данных организации.
Примечание. Некоторыми популярными СУБД являются MySQL, Oracle, PostgreSQL, Microsoft Access, MariaBB и dBASE, а также другие.
Типы схемы базы данных
Существует два основных типа схемы базы данных, которые определяют разные части схемы: логическую и физическую.
Логический
Схема логической базы данных представляет, как данные организованы в виде таблиц. Он также объясняет, как атрибуты из таблиц связаны друг с другом. В разных схемах используется разный синтаксис для определения логической архитектуры и ограничений.
Примечание. Ограничения целостности — это набор правил для СУБД, которые поддерживают качество вставки и обновления данных.
Чтобы создать логическую схему базы данных, мы используем инструменты для иллюстрации отношений между компонентами ваших данных. Это называется моделированием сущности-отношения (моделирование ER). Он определяет отношения между типами сущностей.
Схема ниже представляет собой очень простую модель ER, которая показывает логический поток в базовом коммерческом приложении. Он объясняет продукт покупателю, который его покупает.
Идентификаторы в каждом из трех верхних кружков указывают первичный ключ объекта. Это идентификатор, который однозначно определяет запись в документе или таблице. FK на схеме — это внешний ключ. Это то, что связывает отношения от одной таблицы к другой.
Модели сущностей-отношений могут быть созданы всевозможными способами, и существуют онлайн-инструменты, которые помогают в построении диаграмм, таблиц и даже SQL для создания вашей базы данных из существующей модели ER. Это поможет создать физическое представление схемы вашей базы данных.
Физический
Схема физической базы данных представляет, как данные хранятся на диске. Другими словами, это реальный код, который будет использоваться для создания структуры вашей базы данных. Например, в MongoDB с мангустом это примет форму модели мангуста. В MySQL вы будете использовать SQL для создания базы данных с таблицами.
По сравнению с логической схемой она включает имена таблиц базы данных, имена столбцов и типы данных.
Теперь, когда мы знакомы с основами схемы базы данных, давайте рассмотрим несколько примеров. Мы рассмотрим наиболее распространенные примеры, с которыми вы можете столкнуться.
Пример NoSQL
Базы данных NoSQL в первую очередь называются нереляционными или распределенными базами данных. Разработка схемы для NoSQL является предметом некоторых дискуссий, поскольку они имеют динамическую схему. Некоторые утверждают, что привлекательность NoSQL заключается в том, что вам не нужно создавать схему, но другие говорят, что дизайн очень важен для этого типа базы данных, поскольку он не предоставляет одно решение.
Этот фрагмент является примером того, как будет выглядеть физическая схема базы данных при использовании Mongoose (MongoDB) для создания базы данных, представляющей приведенную выше диаграмму отношения сущность. Просматривайте вкладки кода, чтобы увидеть различные части.