XML- документы должны удовлетворять следующим требованиям:
- В заголовке документа помещается объявление XML. В нем указывается язык разметки документа, номер версии и дополнительная информация.
- Открывающий дескриптор имеет закрывающий дескриптор.
- В XML учитывается регистр символов.
- Значения атрибутов заключаются в кавычки.
- Вложенность дескрипторов в XML контролируется.
- Информация, располагающаяся между начальными и конечными дескрипторами, рассматривается в XML как данные и поэтому учитываются все символы форматирования.
Если XML- документ не нарушает приведенные правила, то он называется формально-правильным и все анализаторы, предназначенные для разбора XML- документов, смогут работать с ним корректно. Существуют два способа контроля правильности XML- документа: DTD – определения (Document Type Definition) и схемы данных (Semantic Schema) /8/.
Конструкции языка XML
Содержимое XML- документа представляет собой набор элементов, секций CDATA, директив анализатора, комментариев, спецсимволов, текстовых данных.
|
|
Элементы данных
Элемент - это структурная единица XML- документа. В качестве содержимого элементов могут выступать текст, элементы документа, секции CDATA, инструкции по обработке, комментарии.
Элемент состоит из начального, конечного дескрипторов и данных, заключенных между ними.
В XML документе определяется элемент, называемый корневым и с него программы-анализаторы начинают просмотр документа.
В случае, если элемент не имеет содержимого, т.е. нет данных, которые он должен определять, он называется пустым. Примером пустых элементов в HTML могут служить такие дескрипторы HTML, как <br>, <hr>, <img>;. Начальный и конечные дескрипторы пустого элемента объединяется в один, и ставится косая черта перед закрывающей угловой скобкой (например, <empty/>;).
Комментарии
Комментариями является любая область данных, заключенная между последовательностями символов <!-- и --> Комментарии пропускаются анализатором и поэтому при разборе структуры документа в качестве значащей информации не рассматриваются.