О спецификации HTML 4.0

         

Атрибуты


С элементами могут быть связаны свойства, называемые атрибутами, которые могут иметь значения (стандартные или устанавливаемые авторами или сценариями). Пары атрибут/значение помещаются перед закрывающей скобкой ">" начального тэга элемента. В начальном тэге элемента может быть любое число (допустимых) пар атрибут/значение, разделенных пробелами. Они могут указываться в любом порядке.

В данном примере для элемента установлен атрибут :

<H1 id="section1"> Это определенный заголовок, спасибо атрибуту id </H1>

По умолчанию в SGML необходимо, чтобы все значения атрибутов были разделены с помощью двойных (десятичный код ASCII 34) или одинарных кавычек (десятичный код ASCII 39). Одинарные кавычки могут включаться в значение атрибута, если значение отделяется двойными кавычками, и наоборот. Авторы могут также использовать цифровые ссылки на символы для представления двойных (&#34;) и одинарных кавычек (&#39;). Для двойных кавычек авторы могут также использовать &quot;.

В определенных случаях авторы могут указывать значение атрибута без кавычек. Значение атрибута может включать только буквы (a-z и A-Z), цифры (0-9), знаки переноса (десятичный код ASCII 45) и точки (десятичный код ASCII 46). Рекомендуется всегда использовать кавычки.

Имена атрибутов всегда учитывают регистр

Значения атрибутов обычно учитывают регистр. Определение каждого атрибута в списке атрибутов указывается, учитывает ли значение регистр.

Список всех атрибутов, определенных в этой спецификации, приводится в .



Что такое HTML?


Чтобы представить информацию для глобального использования, нужен универсальный язык, который понимали бы все компьютеры. Языком публикации, используемым в World Wide Web, является HTML (HyperText Markup Language - язык разметки гипертекстов).

HTML дает авторам средства для:

публикации электронных документов с заголовками, текстом, таблицами, списками, фотографиями и т.д.

загрузки электронной информации с помощью щелчка мыши на гипертекстовой ссылке.

разработки форм для выполнения транзакций с удаленными службами, для использования в поиске информации, резервировании, заказе продуктов и т.д.

включения электронных таблиц, видеоклипов, звуковых фрагментов и других приложений непосредственно в документы.



Что такое World Wide Web?




World Wide Web (Web) - это сеть информационных ресурсов. Для того, чтобы сделать эти ресурсы доступными наиболее широкой аудитории, в Web используются три механизма:

Единая схема наименования для поиска ресурсов в Web (например, URI). Протоколы для доступа к именованным ресурсам через Web (например, HTTP). Гипертекст для простого перемещения по ресурсам (например, HTML).

Связи между этими тремя механизмами становятся очевидными по прочтении этой спецификации.



Доступность


Поскольку сообщество Web растет, и возможности и умения его членов различаются, очень важно, чтобы основные технологии соответствовали потребностям. Язык HTML разработан так, чтобы сделать Web-страницы более доступными для пользователей с физическими недостатками. В HTML 4.0 имеются следующие дополнения, продиктованные соображениями доступности:

усилено разделение структуры и представления документа, что побуждает использовать таблицы стилей вместо элементов и атрибутов представления языка HTML.

улучшены формы, включена возможность назначения клавиш доступа, возможность семантической группировки управляющих элементов формы, семантической группировки вариантов в тэге и активные метки.

добавлена возможность разметки текстового описания включенного объекта (с помощью элемента ).

введен новый механизм действия изображений-карт на стороне клиента (элемент ), который позволяет авторам интегрировать изображения и текстовые ссылки.

альтернативный текст для изображений, включаемых с помощью элемента , обязателен.

добавлена поддержка атрибутов и во всех элементах.

добавлена поддержка элементов и .

более широкий диапазон целевых устройств (телетайп, шрифт Бройля и т.д.) для использования в таблицах стилей.

улучшены таблицы, включена поддержка заголовков, групп столбцов и механизмов для упрощения невизуального представления документа.

добавлены длинные описания таблиц, изображений, кадров и т.д.

Авторы, разрабатывающие страницы с учетом доступности, получат не только эту возможность, но также и некоторые другие: хорошо разработанные документы HTML с разделенными структурой и представлением будут легче адаптироваться к новым технологиям.

Примечание.

Подробнее о разработке доступных документов HTML Вы можете прочесть в [WAIGUIDE].



вводятся механизмы таблиц стилей,


В HTML 4. 0 вводятся механизмы таблиц стилей, скриптов, кадров, внедрения объектов, улучшенная поддержка разных направлений письма и направления справа налево, таблицы с большим количеством возможностей и новые свойства форм, обеспечивая лучшие возможности доступа для людей с физическими недостатками.


Идентификаторы фрагментов


Некоторые URI указывают на местоположение внутри ресурса. Этот тип URI заканчивается символом "#", за которым следует указатель (идентификатор фрагмента). Например, следующий URI указывает на фрагмент с именем section_2:

http://somesite.com/html/top.html#section_2



Интернационализация


Эта версия HTML разработана с помощью экспертов в области интернационализации, так что документы можно писать на любом языке и легко передавать их по всему миру. Это достигается за счет использования [RFC2070], относящегося к интернационализации HTML.

Важным шагом стало принятие стандарта ISO/IEC:10646 (см. [ISO10646]) в качестве набора символов для документов HTML. Это наиболее содержательный стандарт в мире, в котором решены вопросы представления национальных символов, направления письма, пунктуации и других языковых вопросов.

HTML теперь предоставляет лучшую поддержку различных языков в одном документе. Это обеспечивает более эффективное индексирование документов для поисковых машин, типографию высшего качества, преобразование текста в речь, более удобные переносы и т.д.



Элементы


SGML объявляет типы элементов, представляющие структуры или желательное поведение. HTML включает типы элементов, представляющие абзацы, гипертекстовые ссылки, списки, таблицы, изображения и т.д.

Каждое объявление типа элемента обычно включает три части: начальный тэг, содержимое и конечный тэг.

Имя элемента отображается в начальном тэге (пишется <имя-элемента>) и в конечном тэге (пишется </имя-элемента>); не забывайте про слеш перед именем элемента в конечном тэге. Например, начальные и конечные тэги элемента определяют список:

<UL> <LI><P>...элемент списка 1...

<LI><P>...элемент списка 2...

</UL>

Некоторые типы элементов HTML позволяют авторам опускать конечные тэги (например, типы элементов and ). Несколько типов элементов также позволяют опускать начальные тэги; например, и . HTML DTD указывает для каждого типа элемента, являются ли начальный и конечный тэги обязательными.

Некоторые типы элементов HTML не имеют содержимого. Например, элемент перехода на следующую строку не имеет содержимого; его роль - прерывание строки текста. Такие пустые элементы никогда не имеют конечных тэгов. Определение типа документа и текст спецификации указывают, является ли тип элемента пустым (не имеет содержимого) или, если он может иметь содержимое, что является допустимым содержимым.

Имена элементов всегда учитывают регистр.

Информацию о правилах, управляющих элементами, (например, что они могут быть вложенными соответствующим образом, конечный тэг закрывает все опущенные начальные тэги вплоть до соответствующего ему начального тэга (раздел 7.5.1) и т.д.) см. в стандарте SGML.

Например, следующий абзац:

<P>Это первый абзац.</P> ...элемент блока...

можно перезаписать без конечного тэга:

<P>Это первый абзац. ...элемент блока...

поскольку начальный тэг <P> закрывается следующим элементом блока. Точно так же, если абзац включен в элемент блока, например:

<DIV> <P>Это абзац. </DIV>

конечный тэг включающего элемента блока (здесь - </DIV>) служит также конечным тэгом открытого начального тэга <P>.

Элементы - это не тэги. Некоторые люди называют элементы тэгами (например, "тэг P "). Помните, что элемент - это одно, а тэг (начала или конца, неважно) - другое. Например, элемент HEAD всегда присутствует, даже если начальный и конечный тэги HEAD отсутствуют.

Все типы элементов, объявленные в этой спецификации, перечислены в .



Как читать HTML DTD


Каждое объявление элемента и атрибута в этой спецификации сопровождается фрагментом его . Мы решили включить фрагменты DTD в спецификацию вместо того, чтобы искать более доступные, но более длинные и менее точные средства описания свойств элементов. При помощи следующего учебника читатели, не знакомые с SGML, смогут научиться читать DTD и понимать технические подробности спецификации HTML.



Комбинации DTD в определениях атрибутов


Определения атрибутов могут также содержать ссылки на комбинации параметров.

В этом примере мы видим, что список определений атрибутов для элемента начинается с комбинации параметров "%attrs;".

<!ELEMENT - O EMPTY -- ссылка, независимая от устройства --> <!ATTLIST LINK -- , , -- #IMPLIED -- кодировка связанного документа -- #IMPLIED -- URI для связанного документа -- #IMPLIED -- код языка -- #IMPLIED -- рекомендуемый тип содержимого -- #IMPLIED -- типы ссылок для перехода вперед -- #IMPLIED -- типы ссылок для перехода назад -- #IMPLIED -- для генерации на этом устройстве -- >

Начальный тег: обязателен, Конечный тег: запрещен

Комбинация параметров "%attrs;" определена следующим образом:

<!ENTITY % attrs " ">

Комбинация "%coreattrs;" в определении "%attrs;" разворачивается следующим образом:

<!ENTITY % coreattrs " #IMPLIED -- уникальный ИД в пределах документа -- #IMPLIED -- список классов, разделенных пробелами -- #IMPLIED -- информация о стиле -- #IMPLIED -- рекомендуемый заголовок/распространение --" >

Комбинация параметров "%attrs;" определена для удобства, поскольку эти атрибуты определены для большинства типов элементов HTML.

Таким же образом DTD определяет комбинацию параметров "%URI;" как расширение строки "CDATA".

<!ENTITY % URI "" -- Универсальный идентификатор ресурсов, см. [URI]

-->

Как показано в этом примере, комбинация параметров "%URI;" предоставляет читателям DTD больше информации, чем для типа данных, ожидаемого для этого атрибута. Похожие entities определены для "%Color;", "%Charset;", "%Length;", "%Pixels;" и т.д.



это тоже комментарий, он занимает


Комментарии в HTML имеют следующий синтаксис:
<!-- это комментарий --> <!-- это тоже комментарий, он занимает несколько строк -->
Проблемы между открывающим разделителем разметки ("<!") и открывающим разделителем комментария ("--") недопустимы, но их можно использовать между закрывающим разделителем комментария ("--") и закрывающим разделителем разметки (">"). Распространенной ошибкой является включение строки символов переноса ("---") в комментарий. Следует избегать использования в комментариях двух или более символов переноса.
Информация в комментариях не имеет специального значения (например, не интерпретируются).

Комментарии DTD


В DTD комментарии могут занимать несколько строк. В DTD комментарии отделяются парой меток "--", например,

<!ELEMENT PARAM - O EMPTY -- значение именованного свойства -->

Здесь комментарий "значение именованного свойства" объясняет использование типа элемента . Комментарии в DTD носят информативный характер.



Конструкции SGML, используемые в HTML


В следующих разделах Вы познакомитесь с конструкциями SGML, используемыми в HTML.

В приложении перечислены некоторые , которые не поддерживаются средствами HTML и агентами пользователей, и использования которых следует избегать.



Краткая история HTML


Язык HTML был разработан Тимом Бернерс-Ли во время его работы в CERN и распространен браузером Mosaic, разработанным в NCSA. В 1990-х годах он добился особенных успехов благодаря быстрому росту Web. В это время HTML был расширен и дополнен. В Web очень важно использование одних и тех же соглашений HTML авторами Web-страниц и производителями. Это явилось причиной совместной работы над спецификациями языка HTML.

HTML 2.0 (ноябрь 1995, см. [RFC1866]) был разработан под эгидой Internet Engineering Task Force (IETF) для упорядочения общепринятых положений в конце 1994 года. HTML+ (1993) и HTML 3.0 (1995, см. [HTML30]) - это более богатые версии языка HTML. Несмотря на то, что в обычных дискуссиях согласие никогда не было достигнуто, эти черновики привели к принятию ряда новых свойств. Усилия Рабочей группы World Wide Web Consortium по HTML в упорядочении общепринятых положений в 1996 привели к версии HTML 3.2 (январь 1997, см. [HTML32]). Изменения по отношению к HTML 3.2 перечислены в

Большинство людей признают, что документы HTML должны работать в различных браузерах и на разных платформах. Достижение совместимости снижает расходы авторов, поскольку они могут разрабатывать только одну версию документа. В противном случае возникает еще больший риск, что Web будет представлять собой смесь личных несовместимых форматов, что в конечном счете приведет к снижению коммерческого потенциала Web для всех участников.

В каждой версии HTML предпринималась попытка отразить все большее число соглашений между работниками и пользователями этой индустрии, чтобы усилия авторов не были потрачены впустую, а их документы не стали бы нечитаемыми в короткий срок.

Язык HTML разрабатывался с той точки зрения, что все типы устройств должны иметь возможность использовать информацию в Web: персональные компьютеры с графическими дисплеями с различным разрешением и числом цветов, сотовые телефоны, переносные устройства, устройства для вывода и ввода речи, компьютеры с высокой и низкой частотой и т.д.



Логические атрибуты


Некоторые атрибуты играют роль логических переменных (например, атрибут для элемента ). Их наличие в начальном тэге элемента подразумевает, что значением атрибута является "истина". Их отсутствие означает "ложь".

Логические атрибуты могут принимать только одно значение: собственно имя атрибута (например, selected="selected").

В этом примере атрибут определяется как булев.

selected (selected) #IMPLIED -- уменьшенный интервал между элементами --

Для атрибута устанавливается значение "истина", поскольку он находится в начальном тэге элемента:

<OPTION selected="selected"> ...contents...

<OPTION>

В HTML логические атрибуты могут быть в минимизированной форме -- в начальном тэге элемента находится только значение атрибута. Таким образом, можно установить, написав:

<OPTION selected>

вместо:

<OPTION selected="selected">

Авторам следует знать, что многие агенты пользователей распознают только минимизированную форму логических атрибутов и не распознают полную.

         



Об SGML и HTML


В этом разделе документа Вы познакомитесь с SGML и узнаете о его отношении к HTML. Полное описание SGML не входит в этот стандарт (см. [ISO8879]).



Объявления атрибутов


Объявление атрибутов, которые может иметь элемент, начинается с ключевого слова <!ATTLIST. За ним следует имя элемента с вопросительным знаком, список определений атрибутов и закрывающий символ >. Каждое определение атрибута - это тройка, определяющая:

Имя атрибута.

Тип значения атрибута или явный набор допустимых значений. Значения, определенные явным образом при помощи DTD, учитывают регистр. Подробнее о типах значений атрибутов см. в разделе .

Является ли значение атрибута по умолчанию неявным (ключевое слово "#IMPLIED"), то есть значение по умолчанию устанавливается агентом пользователя (в некоторых случаях с использованием наследования от родительских элементов); всегдаобязательным (ключевое слово "#REQUIRED"); или фиксированным данным значением (ключевое слово "#FIXED"). Некоторые определения атрибутов явным образом указывают значение атрибута по умолчанию.

В этом примере атрибут определен для элемента . Атрибут на является обязательным для этого элемента.

<!ATTLIST MAP name CDATA #IMPLIED >

Тип значений, допустимых для этого атрибута, дается как CDATA, тип данных SGML. CDATA - это текст, который может содержать .

Подробнее о типах данных "CDATA", "NAME", "ID" и др. см. в разделе .

В следующих примерах показано несколько определений атрибутов:

rowspan NUMBER 1 -- число строк, охватываемых ячейкой -- http-equiv NAME #IMPLIED -- Имя заголовка ответа HTTP -- id ID #IMPLIED -- уникальный ИД в пределах документа -- valign (top|middle|bottom|baseline) #IMPLIED

Для атрибута rowspan необходимы значения типа NUMBER. Значение по умолчанию дается явно - "1". Для необязательного атрибута http-equiv необходимы значения типа NAME. Для необязательного атрибута id необходимы значения типа ID. Необязательный атрибут valign ограничен значениями из набора {top, middle, bottom, baseline}.



Объявления элементов


HTML DTD состоит из объявлений типов элементов и их атрибутов. Объявление начинается с ключевого слова <!ELEMENT и заканчивается символом >. Между ними указываются:

Имя элемента.

Обязателен ли конечный тэг элемента. Два символа переноса после имени элемента означают, что начальный и конечный тэги являются обязательными. Один символ переноса, за которым следует буква "O", указывает, что конечный тэг можно опустить. Две буквы "O" указывают на то, что можно опустить как начальный, так и конечный тэги.

Содержимое элемента, если таковое имеется. Допустимым содержимым элемента называется его модель содержимого. Типы элементов, не имеющие содержимого, называются пустыми элементами. Модель содержимого для таких типов элементов объявляется при помощи ключевого слова "EMPTY".

В этом примере:

<!ELEMENT UL - - (LI)+>

Объявляется тип элемента UL. Два знака переноса указывают, что начальный тэг <UL> и конечный тэг </UL> для этого элемента обязательны. Модель содержимого для этого типа элемента - "по крайней мере один элемент LI". Ниже объясняется, как задать модель содержимого.

В этом примере показано объявление пустого типа элемента:

<!ELEMENT IMG - O EMPTY>

Объявляется тип элемента IMG.

Знак переноса, за которым следует буква "O", указывает, что конечный тэг можно опустить, но если модель содержимого - "EMPTY", это правило усиливается, и конечный тэг должен быть опущен.

Ключевое слово "EMPTY" означает, что экземпляры этого типа не должны иметь содержимого.



Определения комбинаций параметров


начинается с ряда определений комбинаций параметров. Определение комбинации параметров определяет макрос, на который можно ссылаться в любом месте DTD. Эти макросы не отображаются в документах HTML, они отображаются только в DTD. Другие типы макросов, называемые ссылками на символы, могут использоваться в тексте документа в формате HTML или в значениях атрибутов.

Когда на комбинацию параметров ссылаются в DTD по имени, она разворачивается в строку.

Определение комбинации параметров начинается с ключевого слова <!ENTITY %, за которым следует имя entity, строка в кавычках, в которую разворачивается entity и наконец закрывающий >. Экземпляры комбинаций параметров в DTD начинаются со знака "%", затем идет имя комбинации и заканчивается необязательным символом ";".

В следующем примере определяется, в какую строку будет разворачиваться "%fontstyle;".

<!ENTITY % fontstyle "TT | I | B | BIG | SMALL">

Строка, в которую разворачивается комбинация параметров, может содержать другие имена комбинаций параметров. Эти имена разворачиваются рекурсивно. В следующем примере "%inline;" комбинация параметров включает комбинации "%fontstyle;", "%phrase;", "%special;" и "%formctrl;".

<!ENTITY % inline "#PCDATA | %fontstyle; | %phrase; | %special; | %formctrl;">

Вы часто будете встречать в два DTD entities: "%block;" "%inline;". Они используются, если модель содержимого включает соответственно (определенные в разделе ).



Определения модели содержимого


Модель содержимого описывает, что может содержаться в экземпляре типа элемента. Определения модели содержимого могут включать:

Имена допустимых или запрещенных типов элементов (например, элемент содержит экземпляры типа элемента , а тип элемента не может включать другие элементы ).

Комбинации DTD (например, элемент включают экземпляры комбинации параметров "%inline;").

Текст документа (указываемый SGML-конструкцией "#PCDATA"). Текст может включать . Помните, что они начинаются с & и заканчиваются точкой с запятой (например, "Herg&eacute;'s adventures of Tintin" содержит ссылку на комбинацию символов для отображения символа "e со знаком ударения").

Модель содержимого элемента указывается с использованием следующего синтаксиса:

( ... )

Разделяет группы. A | B

Происходит A или B, но не оба. A , B

Происходят A и B в указанном порядке. A & B

Происходят A и B в любом порядке. A?

A происходит ноль или один раз. A*

A происходит ноль или более раз. A+

A происходит один или несколько раз.

Вот некоторые примеры HTML DTD:

<!ELEMENT UL - - (LI)+>

Элемент должен содержать один или несколько элементов .

<!ELEMENT DL - - (DT|DD)+>

Элемент должен содержать один или несколько элементов или в любом порядке.

<!ELEMENT OPTION - O (#PCDATA)>

Элемент может содержать только текст и такие entities как &amp; -- это определяется типом данных SGML #PCDATA.

Некоторые типы элементов HTML используют дополнительную функцию SGML для исключения элементов из модели содержимого. Исключенным элементам предшествует символ переноса. Явные исключения имеют приоритет по отношению к допустимым элементам.

В этом примере -(A) означает, что элемент не может находиться в другом элементе (то есть ссылки не могут быть вложенными).

<!ELEMENT A - - (%inline;)* -(A)>

Помните, что тип элемента является частью DTD комбинации параметров "%inline;", но явно исключается выражением -(A).

Точно так же следующее объявление типа элемента запрещает вложенные формы:

<!ELEMENT FORM - - (%block;|SCRIPT)+ -(FORM)>



Относительные URI


Относительный URI не содержит информации о схеме наименования. Путь в нем указывает на ресурс на машине, на которой находится текущий документ. Относительные URI могут содержать компоненты относительного пути (например, ".." означает один уровень выше в иерархии) и .

Относительные URI с помощью базового URI. В качестве примера приведения относительного URI предположим, что у нас имеется базовый URI "http://www.acme.com/support/intro.html". Относительный URI в следующей ссылке:

<A href="suppliers.html">Suppliers</A>

будет преобразован в полный URI "http://www.acme.com/support/suppliers.html", а относительный URI в следующем фрагменте

<IMG src="../icons/logo.gif" alt="logo">

будет преобразован в полный URI "http://www.acme.com/icons/logo.gif".

В HTML URI используются для:

ссылки на другие документы или ресурсы (см. элементы и ).

ссылки на внешние таблицы стилей или скрипты (см. элементы и ).

включения в страницу изображений, объектов или апплетов (см. элементы , , и ).

создания изображений-карт (см. элементы и ).

отправки форм (см. ).

создания документов с использованием кадров (см. элементы и ).

ссылок на внешние источники (см. элементы , , и ).

ссылок на соглашения о метаданных, описывающих документ (см. элемент ).

Подробнее об URI см. в разделе о типах URI.



Печать


Иногда авторы хотят упростить для пользователей печать текущего документа. Если документ является частью другого документа, отношения между ними можно описать с помощью элемента HTML или языка описания ресурсов (Resource Description Language - RDF) W3C (см. [RDF]).



Помощь агентам пользователей в последовательном создании изображений


При тщательной разработке таблиц и использовании новых возможностей HTML 4.0 авторы могут ускорить отображение документов агентами пользователей. Авторы могут прочесть здесь о том, как создавать таблицы для последовательного представления (см. элемент ). Разработчики могут получить информацию об алгоритмах последовательного представления в в приложении.

         



Разделение структуры и представления


HTML происходит из SGML, который всегда был языком определения структурной разметки. По мере развития HTML все большее количество его элементов и атрибутов для представления заменяется другими механизмами, в частности, таблицами стилей. Опыт показывает, что отделение структуры документа от аспектов его представления снижает стоимость обслуживания широкого диапазона платформ, носителей и т.д. и упрощает изменение документов.



С помощью скриптов авторы могут


С помощью скриптов авторы могут создавать динамичные Web-страницы (например, "интеллектуальные формы", изменяющиеся по мере заполнения их пользователем) и использовать HTML как средство построения сетевых приложений.
Механизмы, обеспечивающие включение скриптов в документы HTML, не зависят от языка скриптов.

Составные документы


В HTML теперь имеется стандартный механизм для внедрения объектов и приложений в документы HTML. Элемент (а также более специфичные элементы, его преемники, и ) обеспечивает механизм включения в документ изображений, видеофайлов, звуковых файлов, математических выражений, специализированных приложений и других объектов. Он также позволяет авторам указывать иерархию или альтернативный способ создания изображения для агентов пользователей, не поддерживающих указанный способ создания изображения.



рекомендуется ознакомиться со следующими


Авторам и разработчикам для работы с HTML 4. 0 рекомендуется ознакомиться со следующими общими принципами.


Ссылки на символы


Ссылки на символы - это числовые или символьные имена символов, которые могут быть включены в документ HTML. Они удобны для обращения к редко используемым символам или к символам, которые трудно или невозможно вводить в средствах разработки документов. Вы увидите ссылки на символы в этом документе; они начинаются со знака "&" и заканчиваются точкой с запятой (;). Вот некоторые примеры:

"&lt;" представляет знак <. "&gt;" представляет знак >. "&quot;" представляет знак ". "&#229;" (десятичное число) представляет букву "a" с кружком сверху. "&#1048;" (десятичное число) представляет кириллическую букву "I". "&#x6C34;" (шестнадцатеричное число) представляет китайский знак воды.

подробно обсуждаются дальше в этом разделе под заголовком набор символов документа HTML. В спецификации также содержится , которые могут использоваться в документах в формате HTML 4.0.



Таблицы


Новая модель таблиц в HTML основана на [RFC1942]. Теперь авторы имеют большую власть над структурой и компоновкой таблицы (например, группы столбцов). Возможность дизайнеров рекомендовать ширину столбцов позволяет агентам пользователей отображать данные таблицы постепенно (по мере получения) и не ждать всю таблицу до создания изображения.

Примечание. Во время написания этого документа некоторые средства разработки документов в формате HTML широко использовали для форматирования страниц таблицы, что вызывало проблемы совместимости.



Таблицы стилей


Таблицы стилей упрощают разметку HTML и существенно снижают участие языка HTML в представлении документа. Они предоставляют как авторам, так и пользователям возможность управлять представлением документов - шрифтами, выравниванием, цветами и т.д.

Информацию о стиле можно указать для отдельных элементов или групп элементов, в документе HTML или во внешних таблицах стилей.

Механизмы связи таблиц стилей с документами не зависят от языка таблиц стилей.

До появления таблиц стилей возможности управления созданием изображения у авторов были ограничены. В HTML 3.2 был включен ряд атрибутов и элементов для управления выравниванием, размером шрифта и цветом текста. Авторы также использовали для компоновки страниц таблицы и изображения. Поскольку на обновление браузеров у пользователей уйдет довольно долгое время, эти средства еще будут использоваться в течение какого-то времени. Однако поскольку таблицы стилей обеспечивают более мощные механизмы представления, World Wide Web Consortium существенно сократит число элементов и атрибутов представления в HTML. В этой спецификации элементы и атрибуты, которые могут быть впоследствии исключены, помечены как "". Они сопровождаются примерами полдостижения того же эффекта с помощью других элементов или таблиц стилей.



Универсальность доступа к Web


Чтобы сделать свой Web-сервер доступным для всех пользователей, особенно для пользователей с физическими недостатками, авторы должны предполагать, как их документы могут отображаться на различных платформах: речевых браузерах, программах чтения азбуки Бройля и т.д. Мы не рекомендуем авторам ограничивать творческий процесс, но рекомендуем предусматривать альтернативные методы подачи информации. HTML предлагает ряд таких механизмов (например, атрибут , атрибут и т.д.)

Авторам также следует иметь в виду, что к их документам могут обращаться пользователи с другой конфигурацией компьютеров. Для корректной интерпретации документов авторам следует включать в свои документы информацию о языке и направлении письма в тексте, о кодировке документа и прочую подобную информацию.



Введение в SGML


SGML - это система определения языков разметки. Авторы размечают свои документы, представляя информацию о структуре, представлении и семантике в одном документе. HTML является одним из примеров языка разметки. Вот пример документа на языке HTML:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0//EN" "http://www.w3.org/TR/REC-html40/strict.dtd"> <HTML> <HEAD> <TITLE>Мой первый документ на языке HTML</TITLE> </HEAD> <BODY> <P>Всем привет! </BODY> </HTML>

Документ HTML состоит из раздела заголовка (здесь - между тэгами <HEAD> и </HEAD>) и тела (здесь - между заголовками <BODY> и </BODY>). Заголовок документа отображается в заголовке (вместе с другой информацией о документе), а содержимое документа находится в теле. В этом примере тело документа состоит только из одного абзаца, помеченного <P>.

Каждый язык разметки, определенный в SGML, называется приложением SGML. Приложение SGML характеризуется:

. SGML Объявление указывает, какие символы и разделители могут отображаться в приложении.

. DTD определяет синтаксис конструкций разметки. DTD может включать дополнительные определения, например, .

Спецификация, описывающая семантику, используемую в разметке. Эта спецификация также налагает синтаксические ограничения, которые невозможно выразить при помощи DTD.

Экземпляры документа содержат данные (содержимое) и разметку. Каждый экземпляр содержит ссылку на DTD, которое должно использоваться для интерпретации.

Спецификация HTML 4.0 включает , три определения типа документов (описание их см. в разделе ) и список .



Введение в URI


Каждый ресурс в Web - документ HTML, изображение, видеоклип, программа и т.д. - имеет адрес, который может быть закодирован с помощью универсального идентификатора ресурсов (Universal Resource Identifier), или URI.

URI обычно состоят из трех частей:

Схема наименования механизма, используемого для доступа к ресурсу. Имя машины, на которой располагается ресурс. Имя собственно ресурса, зачданное в виде пути.

Рассмотрите URI этой спецификации HTML на сервере W3C:

http://www.w3.org/TR/PR-html4/cover.html

Этот URI может читаться следующим образом: этот документ можно получить по протоколу HTTP (см. [RFC2068]), он располагается на машине www.w3.org, путь к этому документу - "/TR/PR-html4/cover.html". Кроме того, в документах в формате HTML Вы можете увидеть схемы "mailto" для электронной почты и "ftp" для протокола FTP.

Вот еще один пример URI. Он относится к почтовому ящику пользователя:

...текст...

Комментарии отправляйте <A href="mailto:joe@someplace.com">Джо Кулу</A>.

Примечание.

Большинство читателей уже знакомо с термином "URL", но не знает термина "URI". URL образуют подмножество более общей схемы наименования URI.