что такое атрибутивная семантическая информация
Географическая и атрибутивная информация. Базы данных и классификаторы
ГИС нацелена на совместную обработку информации двух типов:
1 Географическая (пространственная, картографическая) информация;
2 Атрибутивная (непространственная, семантическая, тематическая, описательная, табличная) информация.
Географическая информация в ГИС представлена данными, описывающими пространственное месторасположение объектов (координаты, элементы графического оформления). Данные находятся в цифровой форме на магнитных лентах, магнитных, оптических и “жестких” дисках и служат для визуализации картины в той или иной модели данных.
Атрибутивная информация в ГИС – это данные, описывающие качественные или количественные параметры пространственно соотнесенных объектов.
Так, например, жилая постройка на дисплее может быть представлена в виде полигона (графическая составляющая), а в атрибутивной базе данных будет содержаться информация об ее площади, почтовом адресе, количестве этажей, материале стен, типе фундамента, годе постройки и т.д., (рисунок 1.5.1).
В геоинформационной системе присутствует подсистема управления как географической, таки атрибутивной информации. Пространственный анализ, который включает в себя проверку взаимного расположения объектов, установление закономерностей их распределения, нахождение смежных объектов, измерение расстояния и площади и т.д., проводят с опорой на географическую информацию. Функции семантической (непространственной) обработки предназначены для анализа и управления атрибутивной информацией, (рисунок 1.5.2).
Практически в каждой ГИС имеются средства и инструменты, позволяющие вводить и редактировать информацию, визуально отображать данные – это масштабирование изображений (увеличение или уменьшение), прокрутка, пролистывание или просмотр как слайд-шоу и т.д. В этом процессе не последнее место занимает дружелюбный графический пользовательский интерфейс, предоставляемый современными операционными системами, такими как Windows, Linux, Solaris, – диалоговые окошки, контекстные меню, другие элементы управления (кнопки, переключатели, ползунки и т.д.).
В полнофункциональной ГИС, как и любой информационной системе, имеются развитые средства вывода информации. К таким средствам можно отнести генераторы отчетов, инструменты создания и редактирования тематических карт, различных схем, графиков, легенд, таблиц и диаграмм.
Современные ГИС позволяют создавать высококачественные карты, по информативности и технологичности не уступающие, а зачастую превосходящие существующие традиционные бумажные карты.
У многих ГИС имеются встроенные средства разработки приложений, которые используются для адаптации стандартного программного обеспечения с целью решения конкретных задач пользователя. Для этих целей применяются не только специальные языки программирования, но и общераспространенные (С, С#, С++, Delphi, Visual Basic и др.), (рисунок 3).
Рисунок 1.5.3 – Механизм связи пространственных и атрибутивных данных
В основе всех разрабатываемых с применением ГИС-технологии систем лежит единая интегрированная реляционная (Реляционной называется база данных, в которой все данные, доступные пользователю, организованны в виде таблиц, а все операции над данными сводятся к операциям над этими таблицами) база данных (БД). Структура этой базы данных отвечает информационным потребностям реализуемых в системе задач. Для многих горно-геологических приложений информация, хранимая в БД, может включать в себя не только текстовые и числовые данные (что традиционно для реляционных СУБД), но и первичные, наиболее ответственные пространственные данные – координаты точек маркшейдерской съемки.
Работа начинается с составления структуры базы атрибутивных данных, представляющей собой некоторую инвентаризационную ведомость всех объектов, изображенных на карте. Фактически структура базы данных – это определенным образом формализованная легенда карты. Самая крупная единица структуры – слой; в отдельные слои помещаются во-первых топологически разнородные объекты (т.е. точечные, линейные и площадные), а во-вторых объекты, имеющие разные наборы свойств-описаний (например, стратифицированные и магматические образования). Описание каждого слоя представляет из себя таблицу, в которой полями (колонками) является набор атрибутов, которыми будут описываться объекты слоя, а строчками – набор типов объектов. Соответственно в ячейки таблицы записываются значения атрибутов для каждого типа объектов.
Как правило, атрибутивная информация записана в компактной форме, и для её интерпретации необходимо воспользоваться соответствующим нормативным документом –классификатором.
Классификатор объектов цифровых топографических карт –нормативный документ, представляющий систематизированный свод наименований и кодовых обозначений объектов ЦТК, их признаков и значений признаков, классифицированных и кодированных в соответствии с принятой системой классификации и кодирования объектов ЦТК. Классификация объектов цифровых топографических карт: разделение множества объектов ЦТК на подмножества в соответствии с имеющимися у них признаками.
Таким образом, классификатор – обязательная составляющая цифровой топографической карты, один из компонентов её информационного обеспечения. На сегодняшний день нет единого классификатора для использования в ЦТК, так как при решении практических задач к ЦТК предъявляются слишком разные требования.
Всего существует два основных типа классификаторов:
– Табличный. В нем данные разделены послойно и организованы в виде реляционных таблиц. Каждая запись в таблице описывает один из объектов, отнесённых к данному слою. Перечень характеристик объектов стабилен в пределах одного слоя. Некоторые характеристики объекта могут быть расширенными (составными, списочными) за счёт использования связанных таблиц.
– Иерархический, в котором каждый объект ЦТК входит только в одну классификационную группировку нижнего уровня иерархии. Классификационные группировки могут быть вложенными, т.е. целиком входить одна в другую. Каждая нижняя по иерархии классификационная группировка должна содержать объекты ЦТК с одним и тем же набором основных признаков. Основные признаки объекта ЦТК однозначно определяют классификационную группировку, в которую входит данный объект. Очевидно, что вполне может существовать система классификации с сетевой структурой, в которой классификационные группировки пересекаются.
Несмотря на существующее многообразие классификаторов, свойства объектов описываются с помощью примерно одинакового перечня типов данных. Типы данных можно разделить на две большие группы: количественные и качественные. К количественным типам данных можно отнести не только целые и вещественные цифровые типы, но и строковые, бинарные. Качественные характеристики отражают только наличие или отсутствие у объекта определённого свойства. Обычно для их отображения в базах данных используются логические поля. Однако существует ещё один способ работы с качественными характеристиками, основанный на использовании справочных таблиц или, по другой терминологии, фасетов.
Этот способ применяется при выборе одного свойства из списка допустимых значений. При этом в базе данных хранится ключ (обычно числовой) для связи со справочной таблицей. В некоторых случаях используются так называемые составные характеристики. Каждая такая характеристика может содержать несколько других (уточняющих) характеристик.
Поля характеристик в структуре описания объекта не являются равнозначными. Среди них обычно выделяют так называемый тип объекта, по которому определяется его принадлежность к классификационным группировкам и однозначно задаётся перечень характеристик. ГОСТ «Система классификации и кодирования цифровой картографической информации» предусматривает, что тип объекта может описываться не одним, а несколькими полями характеристик. В этом случае можно говорить о неявном задании типа объекта.
Что такое атрибутивная семантическая информация
Целью настоящей статьи является ознакомление специалистов в области геодезии и картографии с механизмами хранения и обработки данных, которые предоставляют геоинформационные системы
А.В. Серов (ГУ «ТФИ РК», Сыктывкар)
Пространственная информация и ее свойства Рассмотрим содержание традиционной топографической карты, в которой объединены два вида представления информации. С одной стороны, карта — это чертеж с геометрическими объектами различного типа локализации, которые описываются при помощи пространственных координат. С другой стороны, карта представляет пространственное распределение некоторых параметров или описательных данных, характеризующих территорию или отдельные ее части, которые сами по себе описываются без привлечения пространственных координат. Первый тип информации называют метрической, второй — семантической (описательной, атрибутивной, смысловой).
Пространственно-распределенную информацию можно разделить на три группы: семантическая, метрическая и топологическая.
Источником семантической информации является способность человека распознавать (выделять) некоторые части пространства и находящиеся в них предметы, а также связывать с ними различные определения или характеристики. Такую информацию удобно хранить в реляционной базе данных. При этом ключом может служить, в частности, название объекта или его номер. Несколько примеров такого рода было рассмотрено в первой части статьи (см. журнал «Пространственные данные». — 2008. — № 4. — http://gisa.ru/49208.html ).
Источником метрической информации является способность человека отличать разные части пространства и осуществлять измерения расстояний, площадей, объемов. Метрическая информация, таким образом, отражает свойство предметов находиться в определенной части пространства и занимать некоторую его часть.
Топологическая информация отражает свойства пространства, которые не меняются при любых его линейных деформациях, проводимых без разрывов и «склеиваний». К топологической информации относятся: точки пересечения объектов, данные о примыкании объектов друг к другу (или общих границах). Простейшими топологическими свойствами являются характеристики положения объектов относительно друг друга, например: «слева», «справа». Каким бы образом мы мысленно не «растягивали» или не «сжимали» пространство, характеристика относительного положения объектов не изменится.
Ответим на вопрос: можно ли такие сущности, как дом, магазин, улица, считать пространственными объектами? Ответ очевиден: да. Каждый из этих объектов занимает определенное пространственное положение, уникальность которого служит для индивидуализации объектов, их отличия одного от другого.
Ответим на следующий вопрос: а можно ли отношения ДОМ и МАГАЗИНЫ считать пространственной информацией? Эти отношения являются не чем иным, как информационным представлением реальных локализованных в пространстве сущностей, объектов. Ответ — нет. Отношения в том виде, в котором они сформулировали в предыдущей части статьи, не позволят различать объекты, основываясь на их пространственном положении, поскольку в атрибутах объектов нет сведений об этом.
Итак, чтобы информационное представление объектов можно было назвать «пространственным», к нему, как минимум, необходимо добавить атрибут, однозначно описывающий область пространства, в которой объект локализован. Добавление такого атрибута к обычной базе данных превращает ее в геоинформационную систему.
Задать подобные атрибуты можно, указав относительное (относительно другого объекта) или абсолютное (с помощью координат) положение объекта.
В соответствии с этим можно определить две модели хранения пространственной информации: растровую (относительное положение) и векторную (абсолютное положение).
Растровая модель и растровые ГИС
На заре развития геоинформационных систем наиболее популярными были растровые ГИС в силу того, что при малой мощности компьютеров выполнять обработку пространственной информации удобно именно в растровом виде.
В растровых ГИС данные хранятся в виде таблиц — сеток с ячейками, напоминающих по внутренней организации растровые файлы форматов BMP, BIL и других форматов без сжатия.
С точки зрения растровой модели, пространственные объекты можно представить как совокупность атрибутов. Например, совокупность атрибутов «болото» и «лес» порождает объект «лес по болоту», компактная и протяженная область рельефа — «овраг», совокупность атрибутов «номер», «улица», «цвет» порождает объект «дом» и т. д. Хранение атрибутов организуется в виде матрицы, каждая клетка которой сопоставляется с прямоугольной областью пространства. Это похоже на координатную сетку, которая расчленяет картографируемую территорию на одинаковые прямоугольники. В каждой клетке записываются значения атрибута, например: высота деревьев, глубина реки. В простейшем случае в клетке просто указывается признак наличия или отсутствия объекта (рис. 1).
|
Каждый прямоугольник имеет уникальный номер, состоящий из позиций в столбце (I) и строке (J) матрицы, задающий его положение относительно смежных ячеек. Из рис. 2 видно, что, зная координаты первой ячейки и пользуясь I, J, можно легко перейти к координатам любой другой ячейки матрицы:
X(I) = X(0) + I ( N;
Y(J) = Y(0) + J ( M,
где M, N — размер ячейки в принятой системе координат.
|
Если в базе данных нужно хранить более одного атрибута, необходимо создать новую матрицу, в которой пространственное положение ячеек будет таким же, как в исходной матрице.
Можно видеть, что при такой организации информации понятие пространственного объекта остается завуалированным. Данные об отдельном объекте в подобной базе данных нигде не хранятся, соответственно нет и топологической информации. Неделимой «единицей» пространственной информации в данном случае является ячейка матрицы.
На первый взгляд может показаться, что это неудобно, однако не следует спешить с выводами. Существует много задач, эффективно решать которые позволяет именно такой подход. Растровые модели данных применяются в тех случаях, когда необходимо сохранить сведения об атрибутах некоторого протяженного пространственного объекта, не имеющего границ, или когда информация о границах объекта не имеет значения для решения поставленной задачи. К таким объектам относятся, например, атмосферный воздух (атрибут — загрязненность), лес (атрибут — запас древесины), поверхность моря (атрибут — загрязненность). В рамках растровой модели можно легко сравнивать различные части объектов между собой, обособлять части объектов и образовывать на их основе новые объекты. Это делается при помощи специфических операторов, предназначенных для работы с пространственными данными.
|
Векторная модель и векторные ГИС
Векторная модель данных предназначена для хранения информации о пространственных объектах, границы которых описываются с помощью координат. Граница пространственного объекта формируется посредством геодезических или картометрических измерений путем аппроксимации контура объекта и «превращается» в последовательность координат поворотных точек участков границы (рис. 3). В общем случае, объект может иметь как внешнюю, так и внутреннюю границы. Например, водная поверхность озера будет иметь несколько границ, если посреди него расположены острова.
Контур или набор контуров пространственного объекта есть неделимая единица хранения пространственной информации, с которой связаны атрибуты объекта. В векторной модели в качестве единого и неделимого может быть представлен только тот пространственный объект, который характеризуется одинаковым набором атрибутов и их значений.
Предположим, что нужно создать контуры объектов ДОМА. Каждый дом должен быть представлен отдельно, нельзя обрисовать два различных дома одним и тем же контуром, поскольку в этом случае произойдет потеря адресной информации. Одному и тому же объекту невозможно присвоить более одного значения одноименного атрибута (в данному случае — два адреса). Также нельзя выделить часть объекта и присвоить ему другие атрибуты, сохранив при этом «связь» с исходным объектом. Выделенную часть придется оформить как самостоятельный объект.
Рассмотрим еще один пример: в наличии сущность УЛИЦА (НАЗВАНИЕ), ее атрибуты хранятся в реляционной базе данных. Невозможно создать в векторной геоинформационной системе единый объект «Картографический проспект + Геоинформационный проспект», поскольку значения атрибута НАЗВАНИЕ у улиц различны. Поэтому каждую из улиц придется «оформить» как самостоятельный объект (рис. 4).
|
В векторной модели граница является точно таким же атрибутом объекта УЛИЦА, как и ее название; этот особенный, «метрический», атрибут характеризует пространственное положение объекта, и, с точки зрения реляционной модели, ничем не отличается от других атрибутов (рис. 5). Отметим, что точное совпадение границ объектов не означает их полную идентичность, для достижения последнего необходимо, чтобы все метрические и семантические атрибуты объектов были одинаковыми.
|
Модель данных, в которой к обычным атрибутам добавляется пространственная информация, отображаемая в виде особого поля, носит название геореляционной модели данных. Существуют специальные операторы, которые позволяют осуществлять такие действия с пространственной информацией, как объединение, вычитание, построение буфера и др.
Для удобства манипулирования пространственными объектами в геореляционной модели принято разделять их по характеру локализации на площадные, линейные и точечные.
Объекты, столь малые, что в масштабе карты отображаются точкой, будут иметь точечную локализацию; для отображения пространственной информации в этом случае достаточно одной пары координат X, Y. Примерами точечных объектов являются колодцы, трубы, вершины гор и т. п. Линейными объектами являются такие протяженные образования, ширина которых не отображается в масштабе карты, а их длина многократно превышает ширину (дороги, реки и др.). Длина и ширина площадных объектов местности может быть показана на карте с соблюдением масштаба, это, например, озера, крупные реки, контуры населенных пунктов.
Выбор характера локализации для тех или иных объектов в ГИС зависит от решаемых ею задач. При создании ГИС, в которых содержатся разномасштабные картографические материалы, выбор характера локализации часто создает проблему: на мелкомасштабных картах река может представляться линейным объектом, на крупномасштабных для ее отображения потребуется площадной объект.
Особенности хранения топологической информации
Зачем нужна топологическая информация? Дело в том, что любые измерения координат объектов, выполненные геодезическими или картометрическими методами, имеют определенную точность. Знание точности определения координат необходимо для практической работы с цифровыми картами и геоинформационными системами, в противном случае не избежать серьезных ошибок.
Например, имея карту с реками, отображенными линиями, и населенными пунктами, отображенными точками, нужно при помощи ГИС выявить, с какой стороны реки находится населенный пункт. На рис. 6 показана ситуация, когда невысокая точность карты препятствует правильному ответу на этот вопрос.
|
При создании цифровых карт необходимо внимательно следить за соблюдением топологических отношений между объектами: расположение справа-слева, сверху-снизу, внутри-снаружи и т. п.; примыкание одного объекта к другому и др.
Специалисты ESRI, Inc. (США) разработали специальную цепочно-узловую модель данных, которая основана на использовании реляционной модели данных и позволяет избегать ошибок в топологических отношениях между объектами.
В рамках цепочно-узловой модели пространственные данные об объектах представляются двумя примитивами: линейными и точечными. Линейные примитивы используются для отображения границ линейных и площадных объектов, точечные — для отображения точечных объектов и внутренних областей площадных объектов. Также используются специальные примитивы — узлы, которые указывают точки примыканий границ друг к другу. Информация об объектах хранится в двух служебных реляционных таблицах — AAT (Arc Attribute Table — таблица атрибутов дуг) и PAT (Point Attribute Table — таблица атрибутов точек). Сочетание элементов цепочно-узловой модели и структуры таблиц AAT и PAT приведены на рис. 7.
|
Цепочно-узловая модель позволяет контролировать соблюдение топологических отношений, связанных с примыканием объектов и взаимным положением площадных и линейных объектов.
Более подробно реализацию растровой и векторной моделей данных, специальные операторы для работы с пространственными данными, язык запросов SQL и его расширение для работы с данными геоинформационных систем предполагается рассмотреть в следующих публикациях.
Продолжение в следующем номере
См. также:
Каталог Организаций:
— ТФИ РК ГУ
Каталог Авторов:
— Серов А.В.
Форумы GIS-Lab.info
Геоинформационные системы (ГИС) и Дистанционное зондирование Земли
Cемантические характеристики
Cемантические характеристики
Сообщение believer » 23 авг 2009, 17:56
Re: Cемантические характеристики
Сообщение Boris » 23 авг 2009, 21:07
Re: Cемантические характеристики
Сообщение believer » 24 авг 2009, 09:14
В основе идеологии ГИС лежит понятие векторного объекта карты, который обладает метрической и семантической информацией. Метрическая информация включает в себя массив двух- или трехмерных координат, полученных в результате оцифровки (векторизации) данных фотосъемки местности. Семантическая информация объекта представляет собой набор качественных характеристик объекта (высота, глубина, количество жителей, название населенного пункта, цвет рисования и т.п.).
Re: Cемантические характеристики
Сообщение Boris » 24 авг 2009, 11:36
Re: Cемантические характеристики
Сообщение believer » 24 авг 2009, 14:21
Re: Cемантические характеристики
Сообщение geologic » 24 авг 2009, 14:39
Справка
Классы пространственных объектов на самом деле являются просто таблицами со специальными полями, содержащими информацию о геометрии объектов. К таким полям относятся поле Shape для точечных, линейных и полигональных объектов и поле BLOB для классов объектов-аннотаций. Некоторые поля, такие как уникальный идентификационный номер (ObjectID) и Shape, добавляются, заполняются и поддерживаются в ArcGIS автоматически.
ArcGIS позволяет ассоциировать записи одной таблицы с записями в другой через общее поле, известное как ключевое. Создать эти ассоциации можно разными способами, включая временное объединение или связывание таблиц на карте или создание классов отношений в базе геоданных, что позволяет получить постоянные ассоциации. Например, вы можете связать таблицу собственников земельных участков со слоем земельных участков, поскольку у них имеется общее поле parcel ID.
Источники табличной информации
Существует множество источников табличной информации, и ArcGIS предоставляет преимущества работы со многими форматами данных. Табличная информация может содержаться в виде таблиц в папках или базах данных, в виде текстовых файлов, запросов к базам данных и т. д. Также, если у вас есть пространственные данные, скорее всего у вас уже есть табличные атрибуты, описывающие эти географические объекты.
Файловые таблицы хранятся в папках на диске. Вот некоторые примеры файловых источников табличной информации:
Таблицы в базах данных или базах геоданных могут содержать некоторые типы информации, которые не поддерживаются в файловых таблицах. Например, таблицы базы данных или базы геоданных могут хранить поля типа BLOB и растровые поля. Кроме того, базы данных и базы геоданных предоставляют возможности для расширения функционала таблиц — поддержка целостности данных и управление транзакциями и версиями баз данных.
Можно выполнять запросы к таким таблицам баз данных или баз геоданных для создания новых таблиц. Инструмент Создать таблицу запроса (Make Query Table), например, позволяет применять SQL-выражения к одной или нескольким таблицам. Запросы могут использоваться для соединения таблиц или для получения выборки данных из исходного набора данных.
Более подробно см. в разделе О табличных источниках данных, чтобы узнать больше о том, что вы можете делать с различными видами таблиц.
Задачи, выполняемые с таблицами и атрибутивной информацией
Существует множество задач по картированию, анализу и управлению данными, которые вы можете выполнять с использованием табличных данных.
Таблицы позволяют картировать и визуализировать ваши данные. Например, можно классифицировать или категоризировать атрибуты для обозначения слоя. Вы можете использовать данные о населении для отображения крупных городов более крупными символами, чем символы, используемые для меньших городов и поселков. Вы также можете использовать различные цвета для представления каждого типа землепользования в слое земельных участков. Кроме того, можно использовать атрибутивные значения для формирования текста и подписывания каждого объекта участка. На рисунке ниже земельные участки раскрашены в зависимости от типа использования земли и надписаны значениями ID участков.
Атрибутивные данные позволяют выполнять пространственный анализ и пространственные запросы. Например, можно изучить распределение объектов с определенными атрибутами, запрашивая ArcMap выбрать объекты, содержащие атрибуты, которые необходимые изучить. На рисунке ниже объекты со значением LAND_USE равным UNK (unknown, неизвестно) выбраны с использованием атрибутивного запроса.
Когда информация в базе геоданных или базе данных изменяется, нужно обновить атрибуты. Например, потребуется обновить базу данных, когда изменится информация об использовании земельных участков или собственнике, или классифицируются неизвестные значения. Если у вас есть класс пространственных объектов, представляющий какие-то трубопроводы, с атрибутивным полем диаметр, вы легко можете изменить значения атрибута, когда ремонтная бригада заменит восьмидюймовые трубы на шестидюймовые. Табличные значения можно изменять в окне Таблица (Table) или окне Атрибуты (Attributes), в которых отображаются только атрибуты отдельных выбранных объектов.
База геоданных включает в себя функциональность, позволяющую улучшать, поддерживать ваши табличные данные и отслеживать их целостность. Например, выбрав атрибутивные домены, можно задавать правила, которые устанавливают допустимые значения в записях таблицы. Таким образом, когда вы обновляете атрибуты диаметра труб, вы можете использовать атрибутивные домены для гарантии того, что вводимый диаметр допустим для данной секции трубопровода. Интервальные домены, например, гарантируют, что значения, которые вы вводите, лежат в допустимом диапазоне. Рисунок ниже демонстрирует применение доменов кодированных значений при редактировании, что позволяет выбирать значение из предопределенного списка и избежать опечаток.
ArcGIS также позволяет конвертировать данные в таблице в пространственные данные. Например, одним из наиболее общих источников данных являются списки координат, полученные при использовании GPS приемников в поле. Можно легко добавить такие данные x,y в ArcMap и отобразить их.
На рисунке ниже показан текстовый файл, содержащий x,y координаты гидрантов (рисунок сверху), а также точки гидрантов, показанные в ArcMap на карте и в окне таблицы (рисунок ниже).
Если у вас есть список адресов, вы можете использовать геокодирование, чтобы сопоставить их с известными местоположениями на улицах для создания точечных объектов. Также, посредством линейной привязки вы можете показывать события вдоль линейных объектов с помощью только идентификатора и положения.
Таблицы также лежат в основе моделей данных — шаблонов, которые можно использовать при создании базы геоданных для лучшего моделирования явлений реального мира.