Блок-схема канала HIPPI

Рисунок 4.1.7.4. Блок-схема канала HIPPI

Существуют документы, регламентирующие работу системы передачи информации HIPPI для основных уровней интерфейса, начиная с физического. Предусмотрена работа HIPPI с протоколами TCP/IP. Смотри также "ARP and IP Broadcast over HIPPI-800". J.-M. Pittet. May 2000, RFC-2834, "IP and ARP over HIPPI-6400 (GSN)". J.-M. Pittet. May 2000, RFC-2835.

Disconnected operation (работа в отключенном от сети состоянии)

12 Disconnected operation (работа в отключенном от сети состоянии)

Следует включать, если кэш намерено отключен от остальной сети на определенный период времени.

Формат i-поля пакета HIPPI

Рисунок 4.1.7.3. Формат i-поля пакета HIPPI

Поле L=1 – локально заданный формат; W=1 указывает на 64-битное соединение; D=1 отмечает смену положения адресов отправителя и получателя; PS – биты выбора пути (path selection); С – задержка вызова при занятой линии (camp-on; переключатель не разрывает соединения при занятом получателе, а ждет его освобождения). 12-битовые адреса отправителя и получателя часто делятся на 6-битовые секции, определяющие адрес переключателя и номер порта. HIPPI-IPI (intelligent peripheral interface) представляет собой быстродействующий интерфейс периферийных устройств, выполняющий команды SCSI. Расширение HIPPI-LE (link encapsulation) обеспечивает поддержку IEEE 802.2.

При расстояниях до 25 метров используется кабель, содержащий 50 скрученных пар. Такты часов следуют с периодом 40 нсек. В сетях HIPPI предусмотрен транзит пакетов формата TCP/IP. Блок-схема канала HIPPI показана на Рисунок 4.1.7.4.

Гипертекстный протокол HTTP

4.5.6.1 Гипертекстный протокол HTTP

4.5.6.1.1 Соглашения по нотации и общая грамматика
	1.1. Расширенные BNF
	1.2. Основные правила
4.5.6.1.2. Параметры протокола
	2.1. Версия http
	2.2. Универсальные идентификаторы ресурсов (uri)
	2.2.1. Общий синтаксис
	2.2.2. http url
	2.2.3. Сравнение uri
	2.3. Форматы даты/времени
	2.3.1. Полная дата
	2.3.2. Интервалы времени в секундах
	2.4. Наборы символов
	2.5. Кодировки содержимого
	2.6. Транспортное кодирование
	2.7. Типы среды
	2.7.1. Канонизация и текст по умолчанию
	2.7.2. Составные типы
	2.8. Лексемы (token) продукта
	2.9. Значения качества (quality values)
	2.10. Языковые метки
	2.11. Метки объектов
	2.12. Структурные единицы
4.5.6.1.3. http сообщение
	3.1. Типы сообщений
	3.2. Заголовки сообщений
	3.3. Тело сообщения
	3.4. Длина сообщения
	3.5. Общие поля заголовка
4.5.6.1.4. Запрос
	4.1. Строка запроса
	4.1.1. Метод
	4.1.2. uri запроса
	4.2. Ресурс, идентифицируемый запросом
	4.3. Поля заголовка запроса
4.5.6.1.5. Отклик
	5.1. Статусная строка
	5.1.1. Статусный код и словесный комментарий
	5.2. Поля заголовка отклика
4.5.6.1.6 Объект (entity)
	6.1. Поля заголовка объекта
	6.2. Тело объекта
	6.2.1. Тип
	6.2.2. Длина
4.5.6.1.7. Соединения
	7.1. Устойчивые соединения
	7.1.1. Цель
	7.1.2. Общие процедуры
	7.1.2.1. Согласование
	7.1.2.2. Буферизация
	7.1.3. Прокси-серверы
	7.1.4. Практические соображения
	7.2. Требования к передаче сообщений
4.5.6.1.8. Метод определений
	8.1. Безопасные и idempotent методы
	8.1.1. Безопасные методы
	8.1.2. idempotent методы
	8.2. Опции
	8.3. Метод get
	8.4. Метод head
	8.5. Метод post
	8.6. Метод put
	8.7. Метод delete
	8.8. Метод trace
4.5.6.1.9. Определения статусных кодов
	9.1. Информационный 1xx
	9.2. successful 2xx (Успешная доставка)
	9.3. redirection 3xx (Переадресация)
	9.4. client error 4xx (Ошибка клиента)
	9.5. Сервер ошибок 5xx
4.5.6.1.10. Идентификация доступа
	10.1. Базовая схема идентификации (authentication)
	10.2 Краткое изложение схемы авторизации
4.5.6.1.11. Согласование содержимого
	11.1. Согласование, управляемое сервером
	11.2. Согласование, управляемое агентом (agent-driven negotiation)
	11.3. Открытое согласование (transparent negotiation)
4.5.6.1.12. Кэширование в http
	12.1. Корректность кэша
	12.2. Предупреждения
	12.3. Механизмы управления кэшем
	12.4. Прямые предупреждения агента пользователя
	12.5. Исключения для правил и предупреждений
	12.6. Работа под управлением клиента
	12.7. Модель истечения срока годности
	12.7.1. Определение срока годности под управлением сервера
	12.7.2. Эвристический контроль годности
	12.7.3. Вычисление возраста
	12.7.4. Вычисление времени жизни (expiration)
	12.7.5. Устранение неопределенности значений времени жизни
	12.7.6 disambiguating multiple responses
	12.8. Модель проверки пригодности
	12.8.1. Даты последней модификации
	12.8.2. Валидаторы кэша для меток объектов (entity tag cache validators)
	12.8.3. Слабые и сильные валидаторы
	12.8.4. Правила того, когда использовать метки объекта и даты последней модификации
	12.8.5. Условия пригодности
	12.9. Кэшируемость отклика
	12.10. Формирование откликов кэшей
	12.10.1. Заголовки end-to-end (точка-точка) и hop-by-hop (шаг-за-шагом)
	12.10.2. Не модифицируемые заголовки
	12.10.3. Комбинирование заголовков
	12.10.4. Комбинирование байтовых фрагментов
	12.11. Кэширование согласованных откликов
	12.12. Кэши коллективного и индивидуального использования
	12.13. Ошибки и или поведение кэша при неполном отклике
	12.14. Побочные эффекты get и head
	12.15. Несоответствие после актуализации или стирания
	12.16. Обязательное прописывание (write-through mandatory)
	12.17. Замещения в кэше
	12.18. Списки предыстории
4.5.6.1.13. Определения полей заголовка
	13.1. Поле accept
	13.2. Поле accept-charset
	13.3. Поле accept-encoding
	13.4. Поле accept-language
	13.5. Поле accept-ranges
	13.6. Поле age
	13.7. Поле allow
	13.8. Авторизация
	13.9. Поле cache-control
	13.9.1. Что допускает кэширование
	13.9.2. Что может быть запомнено в кэше
	13.9.3. Модификации базового механизма контроля времени жизни
	13.9.4. Управление перепроверкой пригодности и перезагрузкой
	13.9.5. Директива no-transform
	13.9.6. Расширения управления кэшем
	13.10. Соединение
	13.11. content-base
	13.12. Кодирование содержимого
	13.13. Язык содержимого
	13.14. Длина содержимого
	13.15. Поле content-location
	13.16. content-md5
	13.17. Отрывок содержимого
	13.18. Тип содержимого
	13.19. Дата
	13.20. Поле etag
	13.21. Поле expires
	13.22. Поле from
	13.23. Поле ЭВМ
	13.24. Поле if-modified-since
	13.25. Поле if-match
	13.26. Поле if-none-match
	13.27 Заголовок if-range
	13.28. Поле if-unmodified-since
	13.29. Поле last-modified
	13.30. Поле location
	13.31. Поле max-forwards
	13.32. Поле pragma
	13.33. Поле proxy-authenticate
	13.34. Поле proxy-authorization
	13.35. Поле public
	13.36. Фрагмент
	13.36.1. Фрагменты байт
	13.36.2. Запросы для получения фрагментов
	13.37. Поле referer
	13.38. Поле retry-after
	13.39. Поле server
	13.40. Поле transfer-encoding (Транспортное кодирование)
	13.41. Заголовок upgrade (Актуализация)
	13.42. Поле user-agent (Агент пользователя)
	13.43. Поле vary
	13.44. Поле via
	13.45. Поле warning (Предупреждение)
	13.46. Поле www-authenticate
14.Соображения безопасности
	14.1. Идентификация клиентов
	14.2. Предложение выбора схемы идентификации
	14.3. Злоупотребление служебными (log) записями сервера
	14.4. Передача конфиденциальной информации
	14.5. Атаки, основанные на именах файлов и проходов
	14.6. Персональная информация
	14.7. Аспекты конфиденциальности, связанные с заголовками accept
	14.8. Фальсификация DNS
	14.9. Заголовки location и мистификация
15. Ссылки
16. Приложения
	16.1. Интернетовский тип среды “message/http”
	16.2. Тип среды Интернет “multipart/byteranges”
	16.3. Толерантные приложения
	16.4. Различие между объектами HTTP и mime
	16.4.1. Преобразование к канонической форме
	16.4.2. Преобразование форматов даты
	16.4.3. Введение кодирования содержимого
	16.4.4. no content-transfer-encoding
	16.4.5. Поля заголовка в многофрагментных телах
	16.4.6. Введение транспортного кодирования
	16.4.7. MIME-версия
	16.5. Изменения по отношению HTTP/1.0
	16.5.1. Изменения с целью упрощения распределенных WWW-сервером и экономии IP адресов
	16.6. Дополнительные функции
	16.6.1. Дополнительные методы запросов
	16.6.1.1. Метод patch
	16.6.1.2. Метод link
	16.6.1.3. Метод unlink
	16.6.2. Определения дополнительных полей заголовка
	16.6.2.1. Поле alternates
	16.6.2.2. Поле content-version
	16.6.2.3. Поле derived-from
	16.6.2.4. Поле link
	16.6.2.5. Поле uri
	16.7. Совместимость с предыдущими версиями
	16.7.1 Совместимость с постоянными соединениями HTTP/1.0
	16.7.1.1 Заголовок keep-alive

<
/p> Протокол передачи гипертекста HTTP является протоколом прикладного уровня для распределенных мультимедийных информационных систем. Это объектно-ориентированный протокол, пригодный для решения многих задач, таких как создание серверов имен, распределенных объектно-ориентированных управляющих систем и др.. Структура HTTP позволяет создавать системы, независящие от передаваемой информации.

Протокол HTTP использован при построении глобальной информационной системы World-Wide Web (начиная с 1990).

Первые версии, такие как HTTP/0.9, представляли собой простые протоколы для передачи данных через Интернет. Версия HTTP/1.0, описанная в RFC-1945 [6], улучшила протокол, разрешив использование сообщений в формате MIME, содержащих метаинформацию о передаваемых данных, и модификаторы для запросов/откликов. Дальнейшее развитие сетей WWW-серверов потребовало новых усовершенствований, которые вряд ли являются последними.

Реальные информационные системы требуют больших возможностей, чем простой поиск и доставка данных. Для описания характера, наименования и места расположения информационных ресурсов введены: универсальный идентификатор ресурса URI (Uniform Resource Identifier), универсальный указатель ресурса URL и универсальное имя ресурса URN. Формат сообщений сходен с используемыми в электронной почте и описанный в стандарте MIME (Multipurpose Internet Mail Extensions).

HTTP используется также в качестве базового протокола для коммуникации пользовательских агентов с прокси-серверами и другими системами Интернет, в том числе и использующие протоколы SMTP, NNTP, FTP, Gopher и Wais. Последнее обстоятельство способствует интегрированию различных служб Интернет. Ниже описаны базовые понятия и термины протокола HTTP.

Прокси

Промежуточная программа, которая выполняет функции, как сервера, так и клиента. Такая программа предназначена для обслуживания запросов так, как если бы это делал первичный сервер. Запросы обслуживаются внутри или переадресуются другим серверам.

Туннель

Промежуточная программа, которая работает как ретранслятор между двумя объектами.

Туннель закрывается, когда обе стороны, соединенные им прерывают сессию. Туннель может быть активирован с помощью HTTP-запроса.

Время пригодности объекта (expiration time)

Время, при котором исходный сервер требует, чтобы объект не посылался более кэшем без перепроверки пригодности.

Эвристическое значение времени жизни (heuristic expiration time)

Время пригодности, присваиваемое объекту в кэше, если это время не задано явно.

Возраст

Возраст отклика – время с момента его посылки или проверки его пригодности исходным сервером.

Время жизни (freshness lifetime)

Продолжительность времени с момента генерации отклика до истечения его пригодности.

Свежий

Отклик считается свежим, если его возраст не превысил времени его пригодности.

Устаревший

Отклик считается устаревшим, когда его возраст превысил время жизни.

Семантическая прозрачность

Кэш по отношению к конкретному отклику функционирует в “семантически прозрачном” режиме, когда его использование не имеет последствий ни для исходного сервера, ни для запрашивающего клиента. Когда кэш семантически прозрачен, клиент получает в точности тот же отклик (за исключением транспортных заголовков), какой он бы получил при непосредственном обращении к исходному серверу.

Валидатор

Протокольный элемент (например, метка объекта или время last-modified), который используется для выяснения того, является ли запись в кэше эквивалентной копией объекта.

Метод

Процедура, выполняемая над ресурсом (get, put, head, post, delete, trace и т.д.).

Heuristic expiration (эвристическое завершение периода пригодности)

13 Heuristic expiration (эвристическое завершение периода пригодности)

Должно включаться, если кэш эвристически выбрал время жизни больше 24 часов, а возраст отклика превышает эту величину.

Язык HTML

4.5.6.2 Язык HTML

1.	Синтаксис HTML
2.	Описания атрибутов
	2.1.	Булевы атрибуты
3.	HTML и URL
4.	Элементы, используемые в тексте документа
5.	Идентификаторы элементов. id и атрибуты классов.
	5.1.	Элемент HTML
	5.2.	Группирующие элементы div и span
	5.3.	Элементы заголовков h1, h2, h3, h4, h5, h6
	5.4.	Элементы address
6.	Спецификация языка содержимого документа. Атрибут lang
7.	Наследование языковых кодов
8.	Спецификация направления текста. Атрибут dir
9.	Текст
	9.1.	Структурированный текст
	9.2.	Цитирование. Элементы q и blockquote
	9.3.	Верхние и нижние индексы. Элементы sub и sup
	9.4.	Строки и параграфы
	9.4.1.	Параграфы и элемент p
	9.5.	Элемент br
	9.6.	Предварительно сформатированный текст. Элемент pre
10.	Пометка изменений документа. Элементы ins и del
11.	Формат даты и времени
12.	Неупорядоченные (ul) и упорядоченные (ol) списки
	12.1.	Списки, форматируемые визуальным агентом пользователя
	12.2.	Списки определений. Элементы dl, dt и dd
13.	dir и элементы menu
14.	Таблицы
	14.1.	Структура таблиц
	14.1.1.	Элемент table
	14.2.	Вычисление числа рядов и колонок в таблице
	14.3.	Ориентация таблиц
	14.4.	Надписи и таблицы. Элемент caption
	14.5.	Группы рядов. Элементы thead, tfoot и tbody
	14.6.	Опционные метки групп рядов
	14.7.	Группы колонок. Элементы colgroup и col
	14.8.	Элемент col
	14.9.	Ряды таблицы. Элемент tr
	14.10.	Ячейки таблицы. Элементы th и td
	14.11.	Ячейки, которые занимают несколько рядов или колонок
	14.12.	Горизонтальное и вертикальное выравнивание
	14.13.	Границы и линии
15.	Информация о пути. Элемент base
	15.1.	Связи и якоря
	15.2.	Элементы, определяющие якоря
	15.3.	Элемент А
	15.4.	Связи mailto
	15.5.	Вложенные связи
	15.6.	Якоря с атрибутом id
	15.7.	Элемент link
	15.8.	Типы связей
	15.9.	Связи с поисковыми системами
16.	Элемент object
	16.1.	Инициализация объекта. Элемент param
17.	Изображения. Элемент img
18.	Введение аплетов. Элемент applet
19.	Введение HTML-документа в другой HTML-документ
20.	Введение карты изображения в HTML-документ
	20.1.	Карты изображения клиента
	20.2.	Карты изображения клиента с map и area
21.	Визуальное представление изображений, объектов и аплетов
22.	Как специфицировать альтернативный текст?
23.	Стилевые листы
	23.1.	Стилевая информация заголовка. Элемент style
	23.2.	Типы среды
	23.3.	Внешние стилевые листы
	23.4.	Установка именованного стиля по умолчанию
	23.5.	Форматирование
	23.6.	Плавающие объекты
	23.7.	Элементы управления шрифтами: tt, i, b, big, small, strike, s и u
	23.8.	Элементы модификаторов шрифтов: font и basefont
	23.9.	Элемент hr
24.	Рамки (frames)
	24.1.	Элемент frameset
	24.2.	Элемент frame
	24.3.	Установка для связей адресов по умолчания
	24.4.	Элемент noframes
	24.5.	Элемент iframe
25.	Формы
	25.1.	Элемент form
	25.2.	Элемент input
	25.3.	Элемент isindex
	25.4.	Элемент button
	25.5.	Элемент select
	25.6.	Элемент optgroup
	25.7.	Элемент textarea
	25.8.	Элемент label
	25.9.	Элементы fieldset и legend
26.	Выделение элементов
27.	Скрипты
	27.1.	Элемент script
	27.2.	Локальная декларация языка скрипта
	27.3.	Ссылки на HTML-документы из скрипта
28.	Динамическая модификация документов
	28.1.	Элемент noscript
	28.2.	Комментирование скриптов в javascript
	28.3.	Комментирование скриптов в vbscript
	28.4.	Комментирование скриптов в tcl
29.	Верификация документов
	29.1.	Каталог образцов sgml
	29.2.	sgml декларация HTML 4.0
	29.3.	sgml декларация
	29.4.	Определение типа документа dtd (document type definition)
30.	Определение типа документа frameset
31.	Эталонные символьные объекты в HTML 4.0
	31.1.	Введение
	31.2.	Эталонные символьные объекты для символов ISO 8859-1
32.	Приложение А. (Отличия HTML 3.2 и HTML 4.0)
33.	Приложение b: Рабочие характеристики, приложения и заметки для разработчиков
	33.1.	Замечания по поводу некорректных документов
34.	Специальные символы в значениях атрибута uri
	34.1.	Не-ascii символы в значениях атрибута uri
	34.2.	Символ & в значениях атрибута uri
35.	Замечания об использовании sgml
36.	Спецификация не HTML данных
37.	Особенности sgml с ограниченной поддержкой
38.	Булевы атрибуты
39.	Помеченные секции
40.	Заметки по индексному поиску
	40.1.	Определение языка документа
41.	Поисковые роботы
	41.1.	Роботы и элементы meta
42.	Замечания о таблицах
43.	Динамическое реформатирование
44.	Инкрементное отображение
45.	Структура и презентация
46.	Группы строк и колонок
47.	Доступность
48.	Рекомендуемые алгоритмы верстки
49.	Фиксированные алгоритмы верстки
50.	Алгоритм авто выкладки
51.	Замечания о формах
52.	Будущие проекты
53.	Заметки о скриптах
	53.1.	Зарезервированный синтаксис для будущих скриптов
54.	Замечания о доступности
55.	Замечания о безопасности
	55.1.	Соображения безопасности для форм
56.	Ссылки на литературу и серверы

<
/p> Язык программирования HTML ( Hypertext Markup Language) предназначен для создания гипертекстных документов, формат которых не зависит от ЭВМ или используемой ОС. HTML-документы являются SGML-документами (Standard Generalized Markup Language, [ISO 8879]) с семантикой, пригодной для представления информации от широкого круга доменов. Файлы HTML-документов должны иметь расширение .html или .htm. Данный формат пригоден для представления почтовых сообщений, новостей, меню, опций, гипермедийных документов, результатов запросов к базам данных, графических документов и т.д.

HTML используется во всемирной информационной системе World Wide Web (WWW) с 1990 года (разработчик Tim Berners-Lee).

В настоящее время существует также простой диалект языка SGML - XML (Extensible Markup Language). Смотри http://win.www.citycat.ru/doc/html/xml/wd-xml-lang или www.w3.org/put/www/tr (первоисточник). Предполагается, что этот язык совместим с SGML и HTML (последнее справедливо лишь частично).

Любое приложение SGML состоит из нескольких частей:

SGML-декларация определяет, какие символы и разделители могут быть использованы в приложении.

dtd (document type definition) определяет стандарт на типы документов и задает синтаксис базовых конструкций.

Спецификация семантики, которая может также включать определенные ограничения на синтаксис, не включенные в DTD и т.д. …

SGML – это система описания языков разметки (markup). HTML – пример такого языка. Каждый язык разметки, определенный в SGML, называется приложением SGML. HTML 4.0 является приложением SGML, соответствующим международному стандарту international standard ISO 8879:1986 -- Standard Generalized Markup Language SGML (определено в [ISO8879]).

Приложение SGML характеризуется:

Декларацией SGML. SGML-декларация специфицирует, какие символы и разграничители могут использоваться в приложении.

Описанием типа документа DTD (Document Type Definition). DTD определяет синтаксис конструкций разметки. DTD может включать в себя дополнительные определения, такие как эталонные символьные объекты (entity).

Спецификацией, которая описывает семантику разметки. Эта спецификация также определяет синтаксические ограничения, которые не могут быть выражены в рамках DTD.

Примерами документов, содержащих данные и разметку. Каждый пример содержит ссылку на DTD, которая используется для его интерпретации.

HTML предоставляет разработчику следующие возможности:

Публиковать в реальном масштабе времени документы с заголовками, текстом, таблицами, рисунками, фотографиями и т.д.

Одним нажатием клавиши мышки извлекать документы через гипертекстные связи.

Конструировать формы (бланки) для осуществления удаленных операций, для заказа продуктов, резервирования билетов или поиска информации.

Включать электронные таблицы (напр. Excel), видеоклипы, звуковые клипы и другие приложения непосредственно в документ.

1. Синтаксис HTML

Символьные объекты (entity) представляют собой цифровые или символьные имена символов, которые могут быть включены в документ HTML. Эти объекты нужны в тех случаях, когда прямой их ввод по каким-либо причинам невозможен. Эти объекты начинаются с символа & и завершаются точкой с запятой (;).

Элементы в SGML представляют собой структуры или описывают требуемое поведение. Элементы начинаются со стартовой метки (TAG), за которой следует содержание, и завершаются конечной меткой. Стартовая метка обычно записывается как <имя_элемента>, а конечная метка, как </имя_элемента>. Некоторые элементы могут не иметь содержания или конечной метки. “Пустые” элементы не имеют конечной метки. Имена элементов обычно записываются прописными буквами, но HTML использование прописных или строчных букв в именах элементов не регламентировано.

Атрибуты. Элементы могут иметь определенные свойства, эти свойства характеризуются атрибутами, которым пользователь может присваивать некоторые значения. Пары атрибут/значение должны быть записаны до появления закрывающей угловой скобки (>) стартовой метки. Если используется несколько атрибутов/значений, они разделяются пробелами.

Порядок их записи не играет роли. По умолчанию SGML требует, чтобы значения были помещены в двойные или одинарные кавычки. Для этих же целей могут использоваться символьные объекты " или " для двойной кавычки и ' для одинарной кавычки. Значения могут содержать помимо латинских букв и цифр символы (-) и (.). Имена атрибутов не чувствительны к тому, прописными или строчными буквами они напечатаны (как правило, их имена записываются в HTML строчными буквами).

Агент пользователя HTML – любой прибор, который интерпретирует HTML документы. К агентам пользователей относятся визуальные броузеры (текстовые и графические), не визуальные броузеры (звуковые и Брейля), поисковые роботы и т.д.. Агент пользователя должен игнорировать любые не узнанные атрибуты.

Пользователь – лицо, взаимодействующее с агентом пользователя, для того чтобы тем или иным способом ознакомиться с документом HTML.

URI. Любой ресурс в WWW – HTML документ, изображение, видео-клип, программа и пр. имеют адрес, который может быть представлен в виде универсального идентификатора ресурса (URI).

Комментарии в HTML имеют следующий синтаксис:





dtd-комментарии выделяются двумя черточками (--) в начале и в конце текста.

HTML DTD начинается с серии описаний каких-то объектов (entities). Описание объекта представляет собой макрос, который может быть развернут где-либо в DTD(в HTML не применим). Когда макрос вызывается (по имени), он разворачивается в строку.

Описание объекта (entity) начинается с ключевого слова <!entity %, за которым следует имя объекта и помещенная в кавычки строка, которая разворачивается. Описание завершается символом >. Развертываемая строка может содержать другие имена объектов. Конкретные значения объекта начинаются с символа “%” и завершается опционно символом “;”. Эти объекты будут также развернуты (если требуется рекурсивно). Например:

<!entity %fontstyle “tt | i | b | big | small”>

<!entity %inline “#pcdata | %fontstyle; | %phrase; | %formctrl;”>

Большая часть HTML DTD состоит из описаний элементов и их атрибутов. Ключевое слово <!element> открывает описание элемента, а символ > - завершает. Между ними размещается имя элемента, две черточки после имени указывают на то, что стартовая и конечная метки являются обязательными. Одна черточка после имени элемента и последующая буква О указывают на то, что конечная метка может отсутствовать. Две буквы О означают допустимость отсутствия как стартовой, так и конечной метки. После имени может следовать содержимое элемента, которое называется моделью содержимого. Элементы без содержимого называются пустыми (empty). Пустые элементы описываются ключевым словом “empty”. Например, <!element ccc – o empty>. ccc – имя элемента; - О говорит о допустимости отсутствия конечной метки. В сочетании с моделью empty это означает, что конечная метка должна отсутствовать.

Модель содержимого описывает то, что может содержать элемент. Определения содержимого могут включать:

Имена допустимых и запрещенных элементов.

dtd-объекты.

Текст документа, отмеченный SGML-конструкцией “#pcdata”. Текст может содержать цифровые и именные символьные объекты.

Модель содержимого имеет следующий синтаксис.

(…)	специфицирует группу.
А\|b	Допускается присутствие А и В в любом порядке.
А,В	А должно появиться раньше, чем В.
a&b	a и b должны появиться только один раз, но в любом порядке.
А?	А может появиться не более одного раза.
А*	А может появиться любое число раз, включая 0.
А+	А может появиться один или более раз.

Ниже приведены примеры HTML DTD:

<!element select - - (option+)>

Элемент select должен содержать один или более элементов option.

<!element dl - - (dt|dd)+>

Элемент dl должен содержать один или более dt или dd элементов в любом порядке.

<!element option – o (#pcdata) *>

Элемент option может содержать только текст и символьные объекты.

2. Описания атрибутов

Описание атрибутов начинается с ключевого слова <!attlist>. Описание атрибута включает в себя:

Имя атрибута.

Тип значения атрибута или набор возможных значений.

Значение атрибута может быть определено тремя способами. Когда значение атрибута по умолчанию задано неявно (ключевое слово “#implied”), оно должно быть задано агентом пользователя или наследуется из определения порождающего элемента. Возможны также ключевые слова “#required” (всегда необходимо) и “#fixed” - присвоено фиксированное значение.

Рассмотрим описание элемента map с опционным атрибутом.

<!attlist map name cdata #implied >, здесь тип допустимого значения задан DATA (тип данных SGML). CDATA – представляет собой текст, который может содержать символьный объекты.

Описания атрибутов могут содержать объекты DTD. Например:

<!attlist link %attrs;	-- id, class, style, lang, dir, title –
bref %url @implied	-- url для подключенного ресурса -- >

Объект %attrs разворачивается в:

<!attrlist p	id id #implied -- уникальный идентификатор для данного документа --
	class cdata #implied	-- список значений классов --
	style cdata #implied	-- информация о стиле --
	title cdata #implied	-- рекомендуемые заголовки/расширения --
	lang name #implied	-- [rfc1766] код идентификатор языка --
	dir (ltr\|rtl) #implied	-- direction for weak/neutral text --
	align (left\|center\|right\|justified) #implied >

Аналогично DTD определяет объект %URL как расширение в строку cdata.

<!entity % URL “CDATA” -- термин URL означает атрибут, значение которого равно универсальному указателю ресурса URL (uniform resource locator), см. RFC-1808 и RFC-1738 -->

2.1. Булевы атрибуты

Некоторые атрибуты выполняют роль булевых переменных. Их появление в стартовой метке элемента предполагает, что значение атрибута равно “true” (истинно). Их отсутствие означает, что их значение равно “false” (ложно). В HTML допускается сжатая форма записи булевых атрибутов:

<option selected> вместо

<option selected=”selected”>.

3. HTML и URL

World Wide Web (WWW) представляет собой всемирную сеть информационных ресурсов. WWW базируется на трех механизмах, которые обеспечивают доступ к этим ресурсам:

Однородная схема имен для описания положения ресурсов в сети WWW(например, URI).

Протоколы доступа к именованным ресурсам через WWW-сеть (напр., HTTP).

Гипертекст, который обеспечивает простую технику поиска и перемещения (навигации) в сетях WWW (например, HTML).

Каждый ресурс, доступный в WWW (HTML-документ, видео-клип, программа или статическое изображение) имеет адрес, который кодируется с помощью универсального идентификатора ресурса universal resource identifier, или uri. URI состоит из трех частей:

Схема имен механизмов доступа к ресурсам [см. RFC-2068; далее в тексте данного документа ссылки на публикации и сервера, представленные в конце выделены квадратными скобками [].].

Имя машины, где размещается ресурс.

Имя самого ресурса в виде прохода к нему (path).

Примером URI может служить адрес, где размещено описание языка HTML v4.0:

http://www.w3.org/tr/rec-html4/

Этот URI можно воспринимать следующим образом: имеется документ, доступный через протокол HTTP (см. [RFC-2068]), этот документ находится на ЭВМ www.w3.org, проход к нему имеет вид /tr/rec-html4/.

Замечание. Большинство читателей знакомо с термином URL (Universal Resource Locator; [RFC-1738]) URL представляет собой подмножество более общей системы имен URI.

Следует помнить, что запись URL чувствительна к тому, строчные или прописные буквы используются при его написании (это не относится только к имени ЭВМ).

Спецификация URL определяет положение документа в сети, но не позицию внутри документа. По этой причине введено понятие URL-фрагмента, который может указывать на определенную часть документа. URL-фрагмент завершается символом #, за которым следует идентификатор указателя (anchor). Примером такого URL-фрагмента может служить http://store.in.ru/semenov/intro.htm#intr_1, где int_1 - имя метки в тексте документа intro.htm.

Для локальной адресации HTML- документов используется относительные URL, которые не имеют секций протокола и ЭВМ. Относительный URL может содержать компоненты относительного прохода к ресурсу (“..” означает положение порождающего URL). Документ RFC-1808 определяет алгоритм работы с относительными URL. Относительный URL может быть частью полного URL. Полный URL можно определить следующим образом:

Если базовый URL завершается символом (/), то он получен путем добавления относительного URL. Например, если базовый URL http://nosite.com/dir1/dir2/, а относительный – gee.html, то полный URL будет выглядеть как http://nosite.com/dir1/dir2/gee.html.

Если базовый URL не завершается /, последнюю секцию базового URL следует рассматривать как ресурс.

Для связи через электронную почту иногда используется специальная разновидность URL – mailto, которая имеет формат:

mailto:e-mail_адрес.

В HTML, URI используются для:

Связи с другим документом или ресурсом (см. элементы a и link).

Связи с внешним стилевым списком или скриптом (см. элементы link и script ).

Включения изображений объектов или аплетов в страницу (см. элементы img, object, applet и input).

Создания карты изображения (см. элементы map и area).

Предоставления форм (см. form).

Создания рамочных документов (см. элементы frame и iframe).

Цитирования внешних ссылок (см. элементы q, blockquote, ins и del).

Ссылок на соглашения по метаданным, описывающим документ (см. элемент head).

Поскольку люди на Земле пока используют различные языки, в которых применяются совершенно не схожие наборы символов, необходимо как-то управлять процессом описания набора символов, используемого в данном документе. Для документов HTML используется универсальный набор символов UCS (Universal Character Set) [ISO10646; cм. также RFC-2070]. Этот набор эквивалентен Unicode 2.0 [unicode]. Агент пользователя может получить, послать или воспроизвести документ в любой кодировке. Это может быть набор ISO-8859-1 (“latin-1”), ISO-8859-5 (кирилица), shift_jis (японская кодировка) и так далее.

Пользователь должен позаботиться, чтобы его документ в конечном итоге был приведен в соответствие с Unicode, тогда у него не будет более проблем с национальным шрифтовым набором.

Для того чтобы облегчить представление полученного документа, можно проанализировать первые несколько байт документа и в процессе пересылки соответствующим образом задать параметр charset поля “content-type”. Например:

content-type: text/html; charset= euc-jp

В качестве значения параметра charset может быть выбрано стандартное имя из документа [RFC-2045]. Но, к сожалению, отнюдь не все сервера присылают информацию об используемом символьном наборе даже в случае несовпадения с ISO-8859-1. Другим способом решить проблему является включение в заголовок документа соответствующего meta-элемента. Например:

<meta http-equiv=”content-type” content=”text/html; charset=euc-jp”>

Здесь крайне важно, чтобы агент пользователя был способен правильно интерпретировать элемент meta-декларации. Если других указаний не распознано, считается, что использован набор ISO-8859-1.

Значение типа атрибута “color” служит для описания цвета. Значение этого атрибута может быть шестнадцатеричным числом, перед которым записывается символ #, или одним из 16 имен цветов:

black=”#000000”	white=”#ffffff”
silver=”#c0c0c0	gray=”#808080”
green=”#008000”	lime=”#00ff00”
olive=”#808000”	maroon=”#800000”
yellow=”#ffff00”	aqua=”#00ffff”
red=”#ff0000”	blue=”#0000ff”
purple=”#800080”	teal=”#008080”
fuchsia=”#ff00ff”	navy=”#000080”

Цвета могут заметно улучшить выразительность и читаемость документов, но следует иметь в виду, что использование стилевых листов более эффективно. Нужно также учитывать, что цвета отображаются на разных рабочих станциях по-разному.

HTML-документ состоит из трех частей, строки с информацией о версии, секции заголовка и собственно содержания документа. В первой строке документа должна быть внесена конструкция doctype, описывающая использованную версию HTML. Например:

<!doctype html public “-//w3c//dtd html 4.0 draft//en”>

Последние две буквы этой декларации характеризуют язык HTML dtd, в данном случае английский (“en”). Агент пользователя может игнорировать эту информацию. Слово draft говорит о том, что использована предварительная версия HTML 4.0. В случае работы с окончательной версией html 4.0 это слово должно быть заменено на strict. Часть документа, следующая после описания версии, должна быть оформлена в виде HTML-элемента. Таким образом, HTML-документ имеет следующую структуру:

<!doctype html public -//w3c//dtd html 4.0 draft//en>

<html>

Заголовок, текст документа …

</html>

Рассмотрим возможные варианты HTML-элементов.

<!entity % version “version cdata #fixed ‘%html.version;’”>

<!entity % html.content “head, (fragment|body) “>

<!entity html o o (%html.content)>

<!attlist html %version; %i18n; >

Стартовая и конечная метки являются опционными.

Ниже приведены примеры элементов-заголовков.

<!entity % head.content “title & isindex? & base?”>

<!element head o o (%head.content) +(%head.misc)>

<!attlist head %i18n; profile %url #implied – named directory of meta info -- >

Для элемента title стартовая и конечная метки являются обязательными. Элемент head содержит информацию о документе, он не является частью текста и служит в качестве источника ключевых слов для поисковых систем. HTML-документ должен иметь только один элемент title в секции head.

Не следует путать элемент title с атрибутом title, который предоставляет справочную информацию об элементе, для которого установлен. Атрибут title имеет формат: title=cdata. В отличие от элемента title, который характеризует весь документ в целом и может появиться в пределах документа только раз, атрибуту title позволено аннотировать любое число элементов. Агент пользователя может интерпретировать этот атрибут самым различным способом. Визуальные броузеры могут отобразить его текст в качестве совета, аудио агент может воспроизвести текст, говорящий о ресурсах подключенного сервера.

Специфическую роль играет атрибут title при использовании для элемента link.

В html 4.0 программист может использовать метаданные в своем документе следующим способом:

Можно описать свойства метаданных во внешнем профайле. Профайл может определить свойства вспомогательной системы поиска (help), такой как “автор”, “ключевые слова” и т.д..

Программист может установить значения определенных параметров. Это можно сделать внутри документа с помощью meta-элемента. В этом случае профайл определяет имена свойств, которые могут быть заданы с помощью META-элемента. Установить конкретные значения можно и извне, связав метаданные с элементом link. В этом варианте профайл определяет имена соотношений типов, которые может использовать элемент LINK.

Если профайл определен для элемента Head, тот же профайл будет присутствовать во всех элементах META и LINK в заголовке документа. Ниже приведены примеры записи элементов meta.

<!element meta – o empty	-- Базовая метаинформация -->
<!attlist meta %i18n;	-- lang, dir, для использования со строкой содержимого --
http-equiv name #implied	-- имя заголовка http-отклика --
name name #implied	-- Имя метаинформации --
content cdata #required	-- соответствующая информация --
scheme sdata #implied	-- select form of content -->

Для META-элемента стартовая метка необходима, а конечная не нужна. Атрибуты, их значения и интерпретация зависят от профайла.

name=Cdata	Этот атрибут определяет имя свойства.
content=Cdata	определяет значение свойства.
scheme=Cdata	определяет схему интерпретации значения свойства.
HTTP-equiv=cdata	может использоваться вместо атрибута name. http-серверы используют этот атрибут при сборе информации для заголовков откликов.

Например, <meta name=”interpreter” content=”yuri semenov”>. Атрибут lang может использоваться с элементом meta для определения языка для значения атрибута content. Этот атрибут позволяет синтезаторам речи корректно выбрать правила произношения.

Например:

<meta name=”interpreter” lang=”ru” content=”semenov”>.

Некоторые агенты пользователья используют meta для обновления текущей страницы каждые несколько секунд. При этом страница может обновляться полностью. Например:

<meta name=”refresh” content=”3,http://www.acme.com/intro.html”>

Слово content определяет задержку в секундах, за этим числом следует URL, который должен быть загружен по истечении указанного времени. К сожалению не все агенты пользователя поддерживают такую возможность.

Атрибут HTTP-equiv может использоваться вместо атрибута name. HTTP-серверы могут работать с именами свойств, заданными атрибутом HTTP-equiv, что позволяет им формировать заголовок HTTP-отклика согласно требованиям RFC-822. Декларация <meta http-equiv=”expires” content=”Mon, 17 Aug 1998 16:35:08 GMT”> приведет к формированию следующей строки в HTTP-заголовке: expires: Mon, 17 Aug 1998 16:35:08 GMT. Это позволяет определить время доступности свежей копии документа.

Одним из важных функция элемента meta является описание ключевых слов для поисковых систем. Например:

<meta name=”keywords” content=”information, retrieval, indexing”>

4. Элементы, используемые в тексте документа

<!entity % block “(%blocklevel | %inline)*”>

<!entity % color “cdata” – a color using srgb: #rrggbb as hex values -->

<!entity % bodycolors “bgcolor		%color #implied
	text	%color #implied
	link	%color #implied
	vlink	%color #implied
	alink	%color #implied”>

<!element body o o (%block) –(body) +(ins|del)>

<!attlist body

	%attrs;	-- %coreattrs, %i18n, %events –
	background %url #implied	-- раскладка текстуры для фона документа --
	%bodycolors;	-- bgcolor, text, link, vlink, alink –
	onload %script #implied	-- документ загружен --
	onunload $script #implied	-- документ удален -->

Для этого элемента стартовая и конечная метки являются опционными. Здесь применимы следующие атрибуты.

Background=URL	указывает на место, где лежит изображение мозаичного образа для фона документа.
text=color	устанавливает фоновый цвет для текста.
Link=color	определяет цвет не посещенных гипертекстных объектов.
vlink=color	определяет цвет посещенных гипертекстных объектов.
alink=color	определяет цвет выбранного пользователем объекта.

Помимо перечисленных ряд атрибутов могут задаваться извне:

id, class, (идентификаторы действуют для всего документа) lang (языковая информация), dir (направление текста/отступ), title, style (текущая стилевая информация), bgcolor (цвет фона), onload, onunload, onclick, ondblclick, onmousedown, onmouseup, onmouseover, onmousemove, onmouseout, onkeypress, onkeydown, onkeyup (действительные события).

Презентация документа определяется стилем (использование атрибутов презентации не желательно). Атрибуты презентации могут применяться только для агентов пользователя, не поддерживающих стили. Ниже представлена иллюстрация представления документа, где фон имеет белый цвет, текст черный, гиперсвязи в исходный момент красные, темные при активации и темно бордовые после первого визита.

<html>

<head>

<title> a study of population dynamics </title>

</head>

<body bgcolor=”white” text=”black” link=”red” alink=”fuschia” vlink=”maroon”>

… текст документа …

</body>

</html>

То же самое с использованием стилевого листа.

<html>

<head>

<title> a study of population dynamics </title>

	body { background: white color: black}
	a:link { color: red }
	a:visited { color: fuschia }

</style>

</head>

<body>

…текст документа …

</body>

</html>

Использование связанного стилевого листа добавляет гибкости при реализации презентации.

<html>

<head>

<title> a study of population dynamics </title>

…текст документа…

</body>

</html>

5. Идентификаторы элементов. ID и атрибуты классов.

Определения атрибутов

ID = name

Этот атрибут присваивает имя элементу, которое действительно в пределах данного документа. Значение ID должно быть уникальным для данного документа.

class = cdata-list

Этот атрибут присваивает некоторому элементу значение класса или набора классов. Одно и тоже имя класса может быть присвоено любому числу элементов. Значение класса позволяет определить или уточнить функцию данного элемента или группы элементов.

Эти атрибуты могут использоваться в следующих случаях:

Атрибут id может использоваться в качестве адреса места назначения гипертекстной связи.

Атрибут id может использоваться скриптами для ссылки на какой-то конкретный элемент.

Стилевые листы могут использовать атрибут ID для того, чтобы определить элемент, на который распространяется действие данного стиля.

Атрибут ID может использоваться для идентификации деклараций object.

Стилевые листы могут использовать атрибут class для идентификации списка элементов, на которые распространяется действие данного стиля.

Атрибуты id и class могут использоваться для целей обработки, например, для идентификации полей при извлечении информации с HTML-страниц в базу данных, при трансляции HTML-документов в другие форматы.

Предположим, что пишется документ о языке программирования. Документ включает в себя некоторое число отформатированных примеров. В этом случае для форматирования используется элемент pre. Пусть также задан цвет фона = green для всех случаев, когда элемент pre принадлежит классу “example”.

<head>

<style pre.example { background : green } </style>

</head>

<body>

<pre class = “example” id = “example-1”>

… текст программы примера …

</pre>

</body>

5.1. Элемент html

<!entity % html.content "head, body">

<!element html o o (%html.content;)	-- корневой элемент документа -->
<!attlist html %i18n;	-- lang, dir -- >

<

/p> Определение атрибута

version = cdata [cn]

Применять не рекомендуется. Значение атрибута специфицирует то, какая версия HTML DTD используется в данном документе. Этот атрибут не рекомендован из-за того, что в качестве стандарта принято определение версии в декларации типа документа.

После декларации типа документа оставшаяся часть документа содержит элемент HTML. Таким образом, HTML-документ имеет структуру:

<!doctype html public "-//w3c//dtd html 4.0//en"

"http://www.w3.org/tr/rec-html40/strict.dtd">

<html>

...Заголовок, тело, и т.д. следует здесь...

</html>

5.2. Группирующие элементы div и span

<!element div - - %block>

<!attlist div %attrs;	-- %coreattrs, %i18n, %events --
	%align;	-- align, выравнивание текста -- >
<!element span - - (%inline) *		-- базовый языковый/стилевой контейнер -- >
<!element span %attrs;		-- %coreattrs, %i18n, %events -- >

<!attlist (%heading) %attrs;	-- %coreattrs, %i18n, %events --
	%align;	-- align, выравнивание текста -- >

Элементы заголовка кратко описывают тему раздела, который они открывают. Содержимое заголовка может использоваться агентом пользователя, например, для автоматического формирования оглавления документа.

Визуальные броузеры отображают заголовки более высокого уровня буквами более крупного кегля.

Ниже приведен пример использования div- элемента для установления связи заголовка со следующей за ним секцией документа. Это позволяет определить стиль раздела с помощью стилевых листов.

<div class=”section” id=”forest-elephants” >

<h1>forest elephants </h1>

В этом разделе обсуждаются менее известные лесные слоны.

… далее следует продолжение текста …

<div class=”subsection” id=”forest-habitant” >

<h2> habitant </h2>

Лесные слоны живут не на деревьях (:-))

… далее следует рассказ о том, где и как живут лесные слоны …

</div>

</div>

Структура может быть улучшена с помощью стилевой информации, например:

<head>

<style>

div.section { text-align: justify; font-size: 12pt }

div.subsection { text-ident: 2em }

h1 {font-style: italic; color: green }

h2 { color: green }

</style>

</head>

5.4. Элементы address

<!element address - - ((%inline;) | p) *>

<!attlist address %attrs;

-- %coreattrs, %i18n, %events -- >

Элемент address служит для введения контактного адреса с автором документа, например:

<address>

newsletter editor<br>

j. r. brown<br>

8723 buena vista, smallville, ct 01234<br>

tel: +1 (123) 456 7890

</address>

6. Спецификация языка содержимого документа. Атрибут lang

lang = language-code

Специфицирует базовый язык, на котором написан документ. Значением этого атрибута является код языка (см. RFC-1766). В пределах кода языка пробелы использоваться не должны. Значение этого кода по умолчанию “unknown”. Код языка состоит из базового кода и субкода.

language-code = primary-code *( “-“ subcode )

Атрибуты, определенные где-либо еще.

id, class (идентификаторы, действующие в пределах документа)

lang (языковая информация), dir (направление текста/отступ)

onclick, ondblclick, onmousedown, onmouseup, onmouseover, onmousemove, onmouseout, onkeypress, onkeydown, onkeyup (события)

Ниже приведено несколько примеров кодов языка.

“en”:english

“en-us”:the u.s version of english

“en-cockney”:the cockney version of english	(версия английского – кокни)
“i-cherokee”: the cherokee language spoken by some native americans	(Чероки – язык, на котором говорят некоторые коренные американцы)

Две первые буквы базового кода зарезервированы ISO-639.

fr	французский
de	немецкий
it	итальянский
nl	голландский
el	греческий
es	испанский
pt	португальский
ar	арабский
he	еврейский
ru	русский
zh	китайский
ja	японский
hi	хинди
ur	урду

Любые две буквы субкода воспринимаются как код страны ISO3166.

7. Наследование языковых кодов

Элемент наследует информацию языкового кода согласно следующим приоритетам (сверху вниз):

Атрибут lang устанавливает значение элемента.

Глобальный элемент, имеющий атрибут lang.

http заголовок “content-language”, устанавливающий значения языка, например,

content-language: en-us.

Задание языкового атрибута извне.

В ниже приведенном примере базовый язык документа является французским. Один параграф декларирован как испанский, после чего базовый язык восстанавливается. Следующий параграф включает встроенную фразу на японском, после чего следует снова текст на французском.

<html lang=”fr”>

<body>

… текст интерпретируется как французский …

<p lang=”es”>… текст интерпретируется как испанский …

<p>… текст интерпретируется снова как французский …

<p> … французский текст интерпретируется с помощью <em lang=”ja”> немного японского </em> далее следует снова текст на французском …

</body>

</html>

8. Спецификация направления текста. Атрибут dir

Описание атрибута

dir = ltr | rtl

Специфицирует направление размещения текста, возможные значения:

ltr: слева направо

rtl: справа налево.

Последнее значение атрибута может быть нужно для случая арабского или еврейского текстов. Агент пользователя не может использовать атрибут lang для определения направления текста.

9. Текст

Пробел

Спецификация SGML делает различие между начальным символом (перевод строки) и концом записи (возврат каретки). Но существует большое разнообразие использования этих символов в различных системах и агент пользователя должен быть способен корректно обрабатывать все варианты. Аналогично меняется от скрипта к скрипту представление о том, что такое разделитель слов. В латинских текстах это пробел (десятичный код 32), в японском и китайском пробел игнорируется, а в тайском используется нуль-сепаратор. Что же касается самого HTML, здесь функции сепаратора выполняет код пробела. Набор символов документа включает в себя широкое разнообразие символов пробела. Многие из них являются типографскими элементами, которые служат для формирования зазоров между словами или буквами. В HTML, определены только следующие символы пробела:

ascii пробел ( )

ascii tab (	)

ascii form feed ()

пробел нулевой ширины ()

Разрыв строки также является пробелом. Заметьте, что   и   определенные в [ISO10646] для разделения строк и параграфов, соответственно, не являются разрывами строк в HTML.

Пример текста:

<p>

this example shows a paragraph and a list

</p>

<ul>

<li>

the <em>первый</em> item

</li>

<li>

this is the <em>второй</em> item

</li>

</ul>

текст может быть переписан с пропуском конечных меток и размещен иначе с использованием меньшего числа пробелов.

<p>this example shows a paragraph and a list

<ul>

	<li> this is <em>первый</em> item
	<li> this is <em>второй</em> item

<!attlist (%font|%phrase)

-- %coreattrs, %i18n, %events -- >

Элементы фраз добавляют структурную информацию к текстовым фрагментам. Элементы фраз имеют следующие значения:

em:	Подчеркивают значение.
strong:	Указывает на еще большую важность (придает выразительность)
dfn:	Указывает, что это место определения вложенного термина.
code:	Отмечает фрагмент текста программы.
samp:	Выделяет пример из текста программы или скрипта.
kbd:	Отмечает текст, который должен быть введен пользователем.
var:	Отмечает переменную или аргумент программы
cite:	Ссылается на фрагмент текста или другой источник.
acronym:	Отмечает акроним (напр. HTML, URI, WWW и т.д.).

EM и strong весьма привлекательны для подчеркивания важности фрагмента текста. Приведенный ниже пример позволяет проиллюстрировать использование некоторых элементов фраз.

“More information can be found in <cite>[ISO-0000]</cite>

“Please refer to the following reference number in future correspondence:

<strong>1-234-55</strong>”

Элемент acronym позволяет упростить работу программ проверки правописания и звуковых синтезаторов речи. Текст элемента acronym позволяет описать сам акроним:

<acronym title=”world wide web”>www</acronym>

<acronym lang=”fr” title =”société nationale de chemins de fer”> sncf

</acronym>

Представление элементов фраз зависит от агента пользователя. Визуальные броузеры отмечают фрагменты текста EM курсивом, а фрагменты strong - полужирным шрифтом. HTML не выделяет аббревиатур и акронимов, по этой причине в текстах, ориентированных на звуковое воспроизведение, следует позаботиться о создании специальных словарей, подключенных к тексту с помощью элементов link в заголовке документа.

9.2. Цитирование. Элементы q и blockquote

<!element blockquote - - %block>

<!attlist blockquote %attrs;	-- %coreattrs, %i18n, %events --
	cite %url #implied	-- url исходного документа или сообщения -- >

<

/p> <!element q - - (%inline) *>

<!attlist q %attrs;	-- %coreattrs, %i18n, %events --
	cite %url #implied	-- url исходного документа или сообщения -- >

Определения атрибутов

cite=url

Значение этого атрибута равно url, который указывает на первоисточник или сообщение. Аргумент указывает на источник цитаты, заключенной в кавычки. Элемент q служит для использования с короткими цитатами в пределах абзаца, а blockquote предназначен для более длинных. Например:

<blockquote cite=http://www.mycom.com/tolkien/twotpwers.html>

they went in single file, running like hounds on a strong scent, and an eager light was in their eyes.

</blockquote>

9.3. Верхние и нижние индексы. Элементы sub и sup

<!element (sub|sup) - - (%inline) *>

<!attlist (sub|sup) %attrs;

-- %coreattrs, %i18n, %events -->

Например, французское “mlle dupont” можно представить в HTML как:

m<sup>lle</sup> dupont

9.4. Строки и параграфы

Любой текст обычно представляется в виде последовательности параграфов. Для определения границ параграфа в HTML используется элемент p. Текст параграфа будет использоваться как единое целое при ряде процедур.

9.4.1. Параграфы и элемент p

<! element p – o (%inline) *>

<!attlist p %attrs;	-- %coreattrs, %i18n, %events
	%align;	-- выравнивание текста -- >

P-элемент отмечает границы параграфа и не может содержать элементов блочного уровня, включая другие Р-элементы. Конечная метка может быть опущена, при этом любой элемент блочного уровня будет являться начальной меткой и конечной меткой Р-элемента. Например:

<p>Это первый параграф.</p>

<p>Это второй </p>

… блочный элемент …

Этот же текст можно переписать эквивалентным образом:

<p>Это первый параграф.

<p>Это второй.

…блочный элемент …

Аналогично параграф может быть сформирован с помощью блочных элементов:

<div>

<p> Это параграф

</div>

Пустой параграф является дурным стилем и должен игнорироваться агентом пользователя.

Агент пользователя определяет способ отображения параграфа. Параграфы могут иметь абзацы, а могут отделяться друг от друга пустой строкой. Обычно в процессе отображения строки разрываются по пробелам между словами, но можно ввести принудительные разрывы строк с помощью элемента BR.

9.5. Элемент br

<!element br – o empty	-- вызывает разрыв строки -- >
<!attlist br %coreattrs;	-- id, class, style, title --
	clear (left\|all\|right\|none) none	-- управление отображением текста -- >

Для визуального агента пользователя атрибут clear может использоваться для позиционирования плавающих объектов (напр. обтекание текстом изображений). Этот атрибут используется в случае отсутствия стилей.

Помимо принудительного разрыва строки существует элемент, запрещающий разрыв строки между двумя словами. Например   entity ( ,  ) действует как пробел, где агент пользователя не должен разрывать строку.

В HTML существует два вида дефисов: мягкий и твердый. Твердый рассматривается как обычный символ, а мягкий воспринимается агентом пользователя как место, где можно разорвать строку. Твердый дефис обозначается символом “-“ (-,-), а мягкий – именованным символом  (,).

9.6. Предварительно сформатированный текст. Элемент pre.

<!entity % pre.exclusion “img|big|small|sub|sup|font”>

<!element pre - - (%inline) * - (%pre.exclusion)>

<!attlist pre %attrs;	-- %coreattrs, %i18n, %events --
	width number #implied >

Определения атрибутов

width = integer

Этот атрибут дает информацию агенту пользователя о желательной ширине форматируемого блока. Агент пользователя может использовать эту информацию для выбора шрифта или отступа. Желательная ширина выражается в числе символов.

Элемент pre сообщает визуальному агенту пользователя, что данный фрагмент текста уже сформатирован. Агент пользователя при этом должен сохранить все пробелы, использовать шрифт с фиксированной шириной букв, блокировать автоматический перенос и разрыв строк.

Перед и после такого фрагмента обычно вводятся пустые строки (требование SGML). В DTD-фрагменте, приведенном выше, в первой строке содержится список элементов, которые не должны присутствовать в PRE-декларации. Рассмотрим фрагмент из поэмы Шелли “to a skylark”.

<pre>

	higher still and higher
		from the earth thou springest
	like a cloud of fire;
		the blue deep thou wingest,

and singing still dost soar, and soaring ever singest.

</pre>

Этот стих будет представлен агентом пользователя без изменений формата.

Не рекомендуется использовать горизонтальную табуляцию в предварительно отформатированных текстах, агент пользователя не сможет воспроизвести формат фрагмента без искажений.

10. Пометка изменений документа. Элементы ins и del.

<!element (ins\|del) - - (%inline) *	-- (введенный/удаленный текст) -- >
<!attlist (ins\|del) %attrs;	-- %coreattrs, %i18n, %events --
	cite %url #implied	-- информация о причине изменения --
	datetime cdata #implied	-- дата изменения в формате ISO -- >

Определение атрибутов

cite = URL

Значение этого атрибута равно URL, которое указывает на документ-первоисточник. Атрибут служит для пояснения причины изменения документа.

datetime = cdata

Значение этого атрибута определяет дату и время внесения изменения в документ. Формат этого значения должен соответствовать требованиям документа ISO-8601.

Элементы ins и del используются для выделения фрагментов документа, которые были добавлены или удалены из предшествующей версии документа.

11. Формат даты и времени

ISO-8601 допускает много опций и вариаций в представлении дат и времени. Но основным форматом HTML следует считать следующий:

yyyy-mm-ddthh:mm:sstzd

Где	yyyy	= четыре цифры года
	mm	= две цифры месяца (01 – январь)
	dd	= две цифры дня месяца (01-31)
	hh	= две цифры часа (00-23; am/pm запрещены)
	mm	= две цифры минут (00-59)
	ss	= две цифры секунд (00-59)
	tzd	= идентификатор временной зоны

<

/p> В качестве tzd ( код временной зоны) можно использовать следующие:

z	обозначает utc (coordinated universal time)
+hh:mm	указывает местное время в часах и минутах опережающее utc.
-hh:mm	указывает местное время в часах и минутах отстающее от utc.

Символ t указывает на начало строки символов времени.

12. Неупорядоченные (ul) и упорядоченные (ol) списки

<!entity % ulstyle “disc|square|circle”>

<!element ul - - (li) +>

<!attlist ul	-- неупорядоченный список --
	%attrs;	-- %coreattrs, %i18n, %events --
	type (%ulstyle) #implied	-- список, где элементы отмечены жирной точкой в начале строки --
	compact (compact) #implied	-- уменьшенное расстояние между элементами списка -- >
<!entity % olstyle “cdata”	-- определяет стиль нумерации: [1\|a\|a\|i\|i] -- >
<!element ol - - (li) +>
<!attlist ol	-- упорядоченный список --
	%attrs;	-- %coreattrs, %i18n, %events --
	type (%olstyle) #implied	-- нумерованный список --
	compact (compact) #implied	-- уменьшенное расстояние между элементами списка --
	start number #implied	-- начальный номер элемента списка -- >
<!entity % listyle “cdata”	-- ограничение: “(%ulstyle\|%olstyle)” -- >
<!element li - o %block	-- элемент списка -- >
<!attlist li %attrs;	-- %coreattrs, %i18n, %events --
	type %listyle) #implied	-- стиль элемента списка --
	value number #implied	-- сброс счетчика элементов списка -- >

Определение атрибутов

type = style-information

Этот атрибут определяет стиль элемента списка.

start = integer

Работает только для ol. Устанавливает начальное значение счетчика элементов упорядоченного списка, значение по умолчанию равно единице.

value = integer

Работает только для LI. Устанавливает текущее значение номера элемента списка.

compact

Не рекомендуется использовать. При использовании требует от агента пользователя отображать список в возможно более компактном виде.

Упорядоченные и не упорядоченные списки во многом схожи.

Оба типа представляют собой последовательность элементов, описанных элементом LI (конечная метка этого элемента обычно опускается). Ниже приведены примеры списков.

<ul>

	<li> … первый элемент списка …
	<li> … второй элемент списка …
	………….

</ul>

Списки могут быть вложенными.

<ul>

<li> …Уровень 1, номер 1 …
<ol>
	<li> … Уровень 2, номер 1 …
	<li> … Уровень 2, номер 2 …
	<ol start=”10”>
		<li> … Уровень 3, номер 1 …
	</ol>
	<li> … Уровень 2, номер 3 …
</ol>
<li> …Уровень 1, номер 2 …

</ul>

В упорядоченных списках невозможно продолжать нумерацию с предыдущего списка или убрать нумерацию, но можно установить счетчик принудительно с помощью атрибута value. Например:

<ol>

<li value=”30”> присваивает этому элементу списка номер 30.

<li value=”40”> присваивает этому элементу списка номер 40.

<li> этот элемент списка будет иметь номер 41.

</ol>

12.1. Списки, форматируемые визуальным агентом пользователя

Для OL и UL атрибут type определяет опцию отображения визуальным агентом пользователя. Для элемента UL возможны значения атрибута type: disc, square и circle. Значение по умолчанию зависит от уровня вложения текущего списка. Агент пользователя попытается представить “disc” в виде небольшого заполненного кружочка, “circle” – в виде незаполненного кружочка, а “square” – в виде квадратика.

Для элемента ol возможные значения атрибута type представлены в таблице.

Тип	Стиль нумерации
1	Арабские цифры	1,2,3,…
a	Строчные буквы латинского алфавита	a,b,c,…
a	Прописные буквы латинского алфавита	a,b,c, …
i	Малые римские цифры	i, ii, iii, …
i	Большие римские цифры	i, ii, iii, …

12.2. Списки определений. Элементы dl, dt и dd

<!element dl - - (dt|dd)+>

<!attlist dl %attrs	-- %coreattrs, %i18n, %events --
	compact (compact) #implied	-- уменьшенное расстояние между элементами -- >

<

/p> <!element dt – o (%inline) *>

<!element dd – o %block>

<!attlist (dt|dd) %attrs

-- %coreattrs, %i18n, %events -- >

Список определений отличается слабо от других списков, он состоит из двух частей: начальная этикетка (label) и описание. Этикетка инициируется элементом DT и может содержать только помеченный текст. Описание начинается с элемента DD и может содержать данные блочного уровня. Например:

<dl>

	<dt> <em> daniel</em>
	<dd> born in france, daniel’s favorite food is foie gras.
		<p> in this paragraph we’ll discuss daniel’s girlfriends: audrey, laurie and alice.

	<dt> <em> tim</em>
	<dd> born in new york, tim’s favorite food is ice cream.

</dl>

Представление списка определений зависит от агента пользователя. Агент пользователя может отобразить представленный список в виде:

daniel

born in france, daniel’s favorite food is foie gras.

in this paragraph we’ll discuss daniel’s girlfriends: audrey, laurie and alice.

tim

born in new york, tim’s favorite food is ice cream.

13. dir и элементы menu

<!element (dir|menu) - - (li)+ - (%blocklevel)>

<!attlist dir %attrs;	-- %coreattrs, %i18n, %events --
	compact (compact) #implied >
<!attlist menu %attrs;	-- %coreattrs, %i18n, %events --
	compact (compact) #implied >

Элемент DIR предназначен для формирования многоколоночного текста каталога. Элемент Menu предназначен для работы с одноколонными текстами каталогов. Оба элемента имеют структуру, аналогичную UL. Рекомендуется использовать UL вместо DIR и Menu.

14. Таблицы

Модель таблиц в HTML позволяет пользователям создавать достаточно сложные структуры таблиц. В этой модели ряды и колонки можно объединять в группы. При печати больших таблиц заголовки и нижние комментарии могут дублироваться для каждой части.

14.1. Структура таблиц

В HTML таблицы имеют следующую структуру

Допускается одна или более групп строк. Каждая группа состоит из опционной секции заголовка таблицы и опционной нижней секции.

Допускается одна или более групп колонок.

Каждая строка состоит из одной или более ячеек.

Каждая ячейка может содержать заголовок или информацию и занимать более одной строки и более одной колонки.

14.1.1. Элемент table

<!element table - - (caption?, (col*|colgroup*), thead?, tfoot?, tbody+)>

<!attlist table -- элемент таблицы –

	%attrs;	-- %coreattrs, %i18n, %events --
	align %talign; #implied	-- положение таблицы относительно окна --
	bgcolor %color #implied	-- фоновый цвет ячейки --
	width cdata #implied	-- ширина таблицы относительно окна --
	cols number #implied	-- используется для режима немедленного отображения --
	borrder cdata #implied	-- управляет шириной рамки вокруг таблицы --
	frame %tframe; #implied	-- какую часть таблицы заключить в рамку --
	rules %trules #implied	-- линии между рядами и колонками --
	cellspacing cdata #implied	-- зазоры между ячейками --
	cellpadding cdata #iplied	-- отступы внутри ячеек -- >

Определение атрибутов

align = left | center | right

Этот атрибут определяет положение таблицы в документе. Возможные значения:

left:

Определения полей заголовка

4.5.6.1.13. Определения полей заголовка

Этот раздел определяет синтаксис и семантику всех стандартных полей заголовков HTTP/1.1. Для полей заголовков объекта, как отправитель, так и получатель могут рассматриваться клиентом или сервером в зависимости от того, кто получает объект.

13.1. Поле Accept

Поле заголовка запроса Accept может использоваться для спецификации определенных типов среды, которые приемлемы для данного ресурса. Заголовки Accept могут использоваться для индикации того, что запрос ограничен в рамках определенного набора типов, как в случае запросов отображения в текущей строке.

Accept	= "Accept" ":"
	#( media-range [ accept-params ] )
media-range	= ( "/"
	\| ( type "/" "*")
	\| ( type "/" subtype )
	) *( ";" parameter )

accept-params = ";" "q" "=" qvalue *( accept-extension )

accept-extension = ";" token [ "=" ( token | quoted-string ) ]

Символ звездочка "*" используется для того, чтобы группировать типы среды в группы с "*/*", указывающим на все типы, и "type/*", указывающим на все субтипы данного типа. Группа сред может включать в себя параметры типа среды, которые применимы. За каждой группой сред может следовать один или более параметров приема (accept-params), начинающихся с "q" параметра для указания фактора относительного качества. Первый "q" параметр (если таковой имеется) отделяет параметры группы сред от параметров приема. Факторы качества позволяют пользователю или агенту пользователя указать относительную степень предпочтения для данной группы сред, используя шкалу значений q от 0 до 1 (раздел 2.9). Значение по умолчанию соответствует q=1.

Замечание. Использование имени параметра "q" для разделения параметров типа среды от параметров расширения Accept связано с исторической практикой. Это мешает присвоения параметру типа среды имени "q".
Пример Accept: audio/*; q=0.2, audio/basic.

Должно интерпретироваться, как "Я предпочитаю audio/basic, но шлите мне любые типы аудио, если это лучшее, что имеется после 80% понижения качества". Если поле заголовка Accept отсутствует, тогда предполагается, что клиент воспринимает все типы среды. Если поле заголовка Accept присутствует и, если сервер не может послать отклик, который является приемлемым, согласно комбинированному значению поля Accept, тогда сервер должен послать отклик 406 (not acceptable). Более сложный пример.

Accept: text/plain; q=0.5, text/html,

text/x-dvi; q=0.8, text/x-c

Это будет интерпретироваться следующим образом: "text/html и text/x-c являются предпочтительными типами сред, но, если их нет, тогда следует слать объект text/x-dvi, если он отсутствует, следует присылать объект типа text/plain".

Группы сред могут быть заменены другими группами или некоторыми специальными типами среды. Если используется более одного типа среды для данного типа, предпочтение отдается наиболее специфичному типу. Например,

Accept: text/*, text/html, text/html;level=1, */*

имеет следующие предпочтения:

1) text/html;level=1

2) text/html

3) text/*

4) */*

Фактор качества типа среды, ассоциированный с данным типом определен путем нахождения группы сред с наивысшим предпочтением, который подходит для данного типа. Например,

Accept: text/*;q=0.3, text/html;q=0.7, text/html;level=1,

text/html;level=2;q=0.4, */*;q=0.5

в результате будут установлены следующие величины:

text/html;level=1	= 1
text/html	= 0.7
text/plain	= 0.3
image/jpeg	= 0.5
text/html;level=2	= 0.4
text/html;level=3 ;	= 0.7

Замечание. Агент пользователя может быть создан с набором значений качества по умолчанию для определенных групп среды. Однако, если только агент пользователя не является закрытой системой, которая не может взаимодействовать с другими агентами, этот набор по умолчанию должен быть конфигурируем пользователем.

13.2. Поле Accept-Charset

Поле заголовка запроса Accept- Charset может быть использовано для указания того, какой символьный набор приемлем для отклика. Это поле позволяет клиентам, способным распознавать более обширные или специальные наборы символов, сигнализировать об этой возможности серверу, который способен представлять документы в рамках этих символьных наборов. Набор символов ISO-8859-1 может считаться приемлемым для всех агентов пользователя.

Accept-Charset = "Accept-Charset" ":"

1#( charset [ ";" "q" "=" qvalue ] )

Значения символьных наборов описаны в разделе 2.4. Каждому символьному набору может быть поставлено в соответствие значение качества, которое характеризует степень предпочтения пользователя для данного набора. Значение по умолчанию q=1. Например Accept-Charset: ISO-8859-5, unicode-1-1;q=0.8. Если заголовок Accept-Charset отсутствует, по умолчанию это означает, что приемлем любой символьный набор. Если заголовок Accept-Charset присутствует, и, если сервер не может послать отклик, который приемлем с точки зрения заголовка Accept-Charset, тогда он должен послать сообщение об ошибке со статусным кодом 406 (not acceptable), хотя допускается посылка и отклика "unacceptable".

13.3. Поле Accept-Encoding

Поле заголовка запроса Accept-Encoding сходно с полем Accept, но регламентирует кодировку содержимого (раздел 13.12), которая приемлема в отклике.

Accept-Encoding = "Accept-Encoding" ":"

#( content-coding )

Ниже приведен пример его использования Accept-Encoding: compress, gzip

Если заголовок Accept-Encoding в запросе отсутствует, сервер может предполагать, что клиент воспримет любую кодировку информации. Если заголовок Accept-Encoding присутствует и, если сервер не может послать отклик, приемлемый согласно этому заголовку, тогда серверу следует послать сообщение об ошибке со статусным кодом 406 (Not Acceptable). Пустое поле Accept-Encoding указывает на то, что не приемлемо никакое кодирование.

13.4. Поле Accept-Language

Поле заголовка запроса Accept-Language сходно с полем Accept, но регламентирует набор естественных языков, которые предпочтительны в отклике на запрос.

Accept-Language	= "Accept-Language" ":"
	1#( language-range [ ";" "q" "=" qvalue ] )
language-range	= ( ( 18ALPHA ( "-" 18ALPHA ) ) \| "" )

Каждому набору языков может быть поставлено в соответствие значение качества, которое представляет собой оценку предпочтений пользователя для языков, специфицированных в диапазоне. По умолчанию значение качества "q=1". Например,

Accept-Language: da, en-gb;q=0.8, en;q=0.7

будет означать: "Я предпочитаю датский, но восприму британский английский и другие типы английского". Список языков согласуется с языковой меткой, если он в точности равен метке или, если он в точности равен префиксу метки, такому как первый символ метки, за которым следует символ "-". Специальный список "*", если он присутствует в поле Accept-Language, согласуется с любой меткой.

Замечание. Это использование префикса не предполагает, что языковые метки присвоены языкам таким образом, что, если пользователь понимает язык с определенной меткой, то он поймет все языки, имеющие метки с одним и тем же префиксом. Правило префикса просто позволяет использовать префиксные метки для случаев, когда это справедливо.

Фактор качества, присваиваемый языковой метке с помощью поля Accept-Language, равен значению качества самого длинного списка языков в поле. Если в поле отсутствует список языков, фактору качества присваивается значение нуль. Если в запросе отсутствует заголовок Accept-Language, серверу следует предполагать, что все языки приемлемы в равной мере. Если заголовок Accept-Language имеется, тогда все языки, которым присвоен фактор качества больше нуля, приемлемы.

Посылка заголовка Accept-Language с полным списком языковых предпочтений пользователя в каждом запросе может восприниматься как нарушение принципов конфиденциальности.

Обсуждение этой проблемы смотри в разделе 14.7.

Замечание. Так как степень интеллигентности в высшей степени индивидуальна, рекомендуется, чтобы приложения клиента делали выбор языковых предпочтений доступным для пользователя. Если выбор не сделан доступным, тогда поле заголовка Accept-Language не должно присутствовать в запросе.

13.5. Поле Accept-Ranges

Поле заголовка отклика Accept-Ranges позволяет серверу указать доступность широкодиапазонных запросов к ресурсу:

Accept-Ranges = "Accept-Ranges" ":" acceptable-ranges

acceptable-ranges = 1#range-unit | "none"

Исходные серверы, которые воспринимают байт-диапазонные запросы, могут послать

Accept-Ranges: bytes

но делать это необязательно. Клиенты могут выдавать байт-диапазонные запросы, не получив этот заголовок отклика для запрашиваемого ресурса. Серверы, которые не могут работать с какими-либо диапазонными запросами, могут послать

Accept-Ranges: none,

чтобы посоветовать клиенту, не пытаться посылать такие запросы.

13.6. Поле Age

Поле заголовка отклика Age передает оценку отправителем времени с момента формирования отклика исходным сервером (или перепроверки его пригодности). Кэшированный отклик является свежим, если его возраст не превышает его времени жизни. Значения Age вычисляются согласно рекомендациям представленным разделе 12.2.3.

Age	= "Age" ":" age-value
age-value	= delta-seconds

Cache-Control	= "Cache-Control" ":" 1#cache-directive
cache-directive	= cache-request-directive
	\| cache-response-directive
cache-request-directive	= "no-cash" ["=" 1#field-name]
	\| "no-store"
	\| "max-age" "=" delta-seconds
	\| "max-stale" [ "=" delta-seconds ]
	\| "min-fresh" "=" delta-seconds
	\| "only-if-cached"
	\| cache-extension
cache-response-directive	= "public"
	\| "private" [ "=" 1#field-name ]
	\| "no-cache" [ "=" 1#field-name ]
	\| "no-store"
	\| "no-transform"
	\| "must-revalidate"
	\| "max-age" "=" delta-seconds
	\| cache-extension;
cache-extension	= token [ "=" ( token \| quoted-string ) ]

Content	MD5 = "Content-MD5" ":" md5-digest
md5digest	=

Поле заголовка Content-MD5 может генерироваться исходным сервером с целью проверки целостности тел объектов. Только исходные серверы могут генерировать поле заголовка Content-MD5. Прокси и внешние шлюзы его генерировать не должны, так как это сделает невозможными проверку целостности end-to-end. Любой получатель тела объекта, включая внешние шлюзы и прокси, могут проверять то, что значение дайджеста в этом поле заголовка согласуется с полученным телом объекта.

Дайджест MD5 вычисляется на основе содержимого тела сообщения, с учетом любых кодировок содержимого, но исключая любые транспортные кодировки (Transfer-Encoding), которые могли быть использованы. Если сообщение получено в закодированном виде с использованием Transfer-Encoding, это кодирование должно быть удалено перед проверкой значения Content-MD5 для полученного объекта.

Это означает, что дайджест вычисляется для октетов тела объекта в том порядке, в каком они будут пересланы, если не используется транспортное кодирование.

HTTP расширяет RFC 1864 с тем, чтобы разрешить вычисление дайджеста для MIME-комбинации типов среды (например, multipart/* и message/rfc822), но это никак не влияет на способ вычисления дайджеста, описанного выше.

Замечание. Существует несколько следствий этого. Тело объекта для комбинированных типов может содержать много составных частей, каждая со своими собственными MIME и HTTP заголовками (включая заголовки Content-MD5, Content-Transfer-Encoding и Content-Encoding). Если часть тела имеет заголовок Content-Transfer-Encoding или Content-Encoding, предполагается, что содержимое этой части закодировано и она включается в дайджест Content-MD5 как есть. Поле заголовка Transfer-Encoding не применимо для частей тела объекта.

Замечание. Так как определение Content-MD5 является в точности тем же для HTTP и MIME (RFC 1864), существует несколько вариантов, в которых применение Content-MD5 к телам объектов HTTP отличается от случая MIME. Один вариант связан с тем, что HTTP, в отличие от MIME, не использует Content-Transfer-Encoding, а использует Transfer-Encoding и Content-Encoding. Другой - вызван тем, что HTTP чаще, чем MIME, использует двоичный тип содержимого. И, наконец, HTTP позволяет передачу текстовой информации с любым типом разрыва строк, а не только с каноническим CRLF. Преобразование всех разрывов строк к виду CRLF не должно делаться до вычисления или проверки дайджеста: тип оформления разрыва строк при расчете дайджеста должен быть сохранен.

13.17. Отрывок содержимого

Заголовок объекта Content-Range посылается с частью тела объекта и служит для определения того, где в теле объекта должен размещаться данный фрагмент. Он также указывает полный размер тела объекта. Когда сервер присылает клиенту частичный отклик, он должен описать как длину фрагмента, так и полный размер тела объекта.

Content-Range	= "Content-Range" ":" content-range-spec
Content-range-spec	= byte-content-range-spec
byte-content-range-spec	= bytes-unit SP first-byte-pos "-"

<

/p> last-byte-pos "/" entity-length

entity-length

= 1*DIGIT

Pragma	= "Pragma" ":" 1#pragma-directive
pragma-directive	= "no-cache" \| extension-pragma
extension-pragma	= token [ "=" ( token \| quoted-string ) ]

Public

= "Public" ":" 1#method

Пример использования:

Public: OPTIONS, MGET, MHEAD, GET, HEAD

Это поле заголовка применяется для серверов, непосредственно соединенных с клиентом, (т.е., ближайших соседей в цепи соединения). Если отклик проходит через прокси, последний должен либо удалить поле заголовка Public или заменить его полем, характеризующим его собственные возможности.

13.36. Фрагмент

13.36.1. Фрагменты байт

Так как все объекты HTTP в процессе передачи представляют собой последовательности байт, концепция фрагментов является существенной для любого объекта HTTP. Однако не все клиенты и серверы нуждаются в поддержке операций с фрагментами.

Спецификации байтовых фрагментов в HTTP относятся к последовательностям байт в теле объекта не обязательно то же самое что и тело сообщения.

Операция с байтовыми фрагментами может относиться к одному набору байт или к нескольким таким наборам в пределах одного объекта.

ranges-specifier	= byte-ranges-specifier
byte-ranges-specifier	= byte-sunit "=" byte-range-set
byte-range-set	= 1#( byte-range-spec \| suffix-byte-range-spec )
byte-range-spec	= first-byte-pos "-" [last-byte-pos]
first-byte-pos	= 1*DIGIT
last-byte-pos	= 1*DIGIT

Значение first-byte-pos в спецификации byte-range-spec указывает на относительное положение первого байта фрагмента. Значение last-byte-pos определяет относительное положение последнего байта фрагмента. Относительное положение начального байта равно нулю.

Если присутствует значение last-byte-pos, оно должно быть больше или равно значению first-byte-pos в спецификации byte-range-spec, в противном случае спецификация byte-range-spec не корректна. Получатель некорректной спецификации byte-range-spec должен ее игнорировать.

Если значение last-byte-pos отсутствует, или если значение больше или равно текущей длине тела объекта, значение last-byte-pos берется на единицу меньше текущего значения длины тела объекта в байтах.

При выборе last-byte-pos, клиент может ограничить число копируемых байт, если не известна длина объекта.

suffix-byte-range-spec = "-" suffix-length

suffix-length = 1*DIGIT

Спецификация suffix-byte-range-spec используется для задания суффикса тела объекта с длиной, заданной значением suffix-length. (То есть, эта форма специфицирует последние N байтов тела объекта.) Если объект короче заданной длины суффикса, то в качестве суффикса используется все тело объекта.

Примеры значений byte-ranges-specifier (предполагается, что длина тела объекта равна 10000):

Первые 500 байтов (относительные позиции 0-499, включительно): bytes=0-499

Вторые 500 байтов (относительные позиции 500-999, включительно): bytes=500-999

Последние 500 байтов (относительные позиции 9500-9999, включительно): bytes=-500

или

bytes=9500-

Первые и последние байты (байты 0 и 9999): bytes=0-0,-1

Несколько легальных, но неканонических спецификаций вторых 500 байт (относительные позиции 500-999, включительно): bytes=500-600,601-999; bytes=500-700,601-999

13.36.2. Запросы получения фрагментов

Информационные запросы HTTP, использующие условные или безусловные методы GET могут заказывать один или более субфрагментов объекта, а не целый объект, используя заголовок запроса Range:

Range

= "Range" ":" ranges-specifier

Сервер может игнорировать заголовок Range. Однако исходные серверы HTTP/1.1 и промежуточные кэши должны поддерживать по возможности работу с фрагментами, так как Range поддерживает эффективное восстановление в случае частично неудачных пересылок больших объектов.

Если сервер поддерживает заголовки Range и специфицированный фрагмент или фрагменты подходят для данного объекта, то:

Присутствие заголовка Range в безусловном GET допускает модификацию того, что прислано. Другими словами отклик может содержать статусный код 206 (Partial Content) вместо 200 (OK).

Присутствие заголовка Range в условном GET (запрос использует If-Modified-Since, If-None-Match, If-Unmodified-Since и/или If-Match) модифицирует то, что прислано GET в случае успешного завершения при выполнении условия (TRUE). Это не влияет на отклик 304 (Not Modified), если условие не выполнено (FALSE).

В некоторых случаях более удобно использовать заголовок If-Range (см. раздел 13.27).

Если прокси, который поддерживает фрагменты, получает запрос Range, переадресует запрос внешнему серверу и получает в ответ весь объект, ему следует прислать запрашиваемый фрагмент клиенту.

Он должен запомнить весь полученный отклик в своем кэше, если отклик совместим с политикой записи в его кэш.

13.37. Поле Referer

Поле заголовка запроса Referer позволяет клиенту специфицировать (для пользы сервера) адрес (URI) ресурса, из которого был получен Request-URI. Заголовок запроса Referer позволяет серверу генерировать список обратных связей с ресурсами для интереса, ведения дневника, оптимизации кэширования и т.д.. Он позволяет также заставить работать устаревшие или дефектные связи. Поле Referer не должно посылаться, если Request-URI был получен от источника, который не имеет своего собственного URI, такого, например, как ввод с пользовательского терминала.

Referer

= "Referer" ":" ( absoluteURI | relativeURI )

Пример:

Referer: http://www.w3.org/hypertext/DataSources/Overview.html

Если значением поля является частичный URI, его следует интерпретировать относительно Request-URI. URI не должен включать фрагментов.

Замечание. Так как первоисточник связи может быть конфиденциальной информацией или может раскрывать другой источник частной информации, настоятельно рекомендуется, чтобы пользователь имел возможность решать, посылать поле Referer или нет. Например, клиент-броузер может иметь кнопку-переключатель для открытого или анонимного просмотра, которая управляет активацией/дезактивацией посылки информации Referer и From.

13.38. Поле Retry-After

Поле заголовка отклика Retry-After может использоваться с кодом статуса 503 (Service Unavailable) с тем, чтобы указать, как еще долго данная услуга предполагается быть недоступной для запрашивающего клиента. Значением этого поля может быть либо дата HTTP либо целое число секунд (в десятичном исчислении) после отправки отклика.

Retry-After

= "Retry-After" ":" ( HTTP-date | delta-seconds )

Два примера использования поля

Retry-After: Fri, 31 Dec 1999 23:59:59 GMT

Retry-After: 120

В последнем примере задержка равна двум минутам.

13.39. Поле Server

Поле заголовка отклика Server содержит информацию о программном обеспечении, используемым исходным сервером для обработки запросов.

Поле может содержать коды многих продуктов (раздел 2.8), комментарии, идентифицирующие сервер, и некоторые важные субпродукты. Коды программных продуктов перечисляются в порядке важности приложений.

Server

= "Server" ":" 1*( product | comment )

Например:

Server: CERN/3.0 libwww/2.17

Если отклик переадресуется через прокси, приложение прокси не должно модифицировать заголовок отклика сервера. Вместо этого ему следует включить в отклик поле Via (как это описано в разделе 13.44).

Замечание. Раскрытие конкретной версии программного обеспечения сервера может облегчить атаки против программных продуктов, для которых известны уязвимые места. Разработчикам серверов рекомендуется сделать это поле конфигурируемой опцией.

13.40. Поле Transfer-Encoding (Транспортное кодирование)

Поле общего заголовка Transfer-Encoding указывает, какой тип преобразования (если таковое использовано) применен к телу сообщения, для того чтобы безопасно осуществить передачу между отправителем и получателем. Это поле отличается от Content-Encoding тем, что транспортное кодирование является параметром сообщения, а не объекта.

Transfer-Encoding = "Transfer-Encoding" ":" 1#transfer-coding

Транспортное кодирование определено в разделе 2.6. Например:

Transfer-Encoding: chunked

Многие старые приложения HTTP/1.0 не воспринимают заголовок Transfer-Encoding.

13.41. Заголовок Upgrade (Актуализация)

Общий заголовок Upgrade позволяет клиенту специфицировать то, какие дополнительные коммуникационные протоколы он поддерживает и хотел бы использовать, если сервер найдет их подходящими. Сервер должен использовать поле заголовка Upgrade в отклике 101 (Switching Protocols) для указания того, какие протоколы активны.

Upgrade

= "Upgrade" ":" 1#product

Например:,

Upgrade: HTTP/2.0, SHTTP/1.3, IRC/6.9, RTA/x11

Поле заголовка Upgrade предназначено для обеспечения простого механизма перехода от протокола HTTP/1.1 к некоторым другим. Это достигается путем разрешения клиенту объявлять о намерении использовать другой протокол, например, более позднюю версию HTTP с большим старшим кодом версии, даже если текущий запрос выполнен с использованием HTTP/1.1.

Это облегчает переходы между несовместимыми протоколами за счет разрешения клиенту инициировать запрос в более широко поддерживаемом протоколе, в то же время, указывая серверу, что он предпочел бы использовать протокол "получше", если таковой доступен (где слово "получше" определяется сервером, возможно согласно природы метода и/или запрашиваемого ресурса).

Поле заголовка Upgrade воздействует только на переключающий протокол прикладного уровня транспортного слоя существующег соединения. Upgrade не может быть использовано для требования изменения протокола, его восприятие и использование сервером является опционным. Совместимость и природа прикладного уровня коммуникаций после смены протокола зависит исключительно от нового выбранного протокола, хотя первым действием после такой замены должен быть отклик на исходный запрос HTTP, содержащий поле заголовка Upgrade.

Поле Upgrade применимо только к текущему соединению. Следовательно, ключевое слово upgrade должно содержаться в поле заголовка Connection (раздел 13.10) всякий раз, когда поле Upgrade присутствует в сообщении HTTP/1.1.

Поле заголовка Upgrade не может использоваться для указания смены протокола в другом соединении. Для этой цели более приемлемы отклики переадресации с кодами 301, 302, 303 или 305.

Эта спецификация определяет протокол с именем "HTTP" при работе с семейством протоколов для передачи гипертекста (Hypertext Transfer Protocols), как это определено в правилах работы с версиями HTTP раздела 2.1 и для будущих усовершенствований этой спецификации. В качестве имени протокола может использоваться любая лексема, однако она будет работать, только если клиент и сервер ассоциируют это имя с одним и тем же протоколом.

13.42. Поле User-Agent (Агент пользователя)

Поле заголовка отклика User-Agent содержит информацию об агенте пользователя, инициировавшем запрос. Это нужно для целей сбора статистических данных, отслеживания нарушений протокола и автоматического распознавания агентов пользователя.

Агентам пользователя рекомендуется включать это поле в запросы. Поле может содержать несколько кодов продуктов (раздел 2.8), комментарии, идентифицирующие агента и любые субпродукты, которые образуют существенную часть агента пользователя. Согласно договоренности коды программных продуктов перечисляются в порядке их важности для идентифицируемого приложения.

User-Agent

= "User-Agent" ":" 1*( product | comment )

Например:

User-Agent: CERN-LineMode/2.15 libwww/2.17b3

13.43. Поле Vary

Поле заголовка отклика Vary используется сервером для того, чтобы сигнализировать о том, что отклик выбран из числа имеющихся представлений с помощью механизма согласования под управлением сервера (раздел 11). Имена полей, перечисленные в заголовках Vary, являются такими заголовками запроса. Значение поля Vary указывает на то, что данный набор полей заголовка ограничивает пределы, в которых могут варьироваться представления, или что пределы вариации не специфицированы ("*") и, таким образом, могут модифицироваться в широких пределах для будущих запросов.

Vary	= "Vary" ":" ( "*" \| 1#field-name )

Via	= "Via" ":" 1#( received-protocol received-by [ comment ] )
received-protocol	= [ protocol-name "/" ] protocol-version
protocol-name	= token
protocol-version	= token
received-by	= ( host [ ":" port ] ) \| pseudonym
pseudonym	= token

Запись "received-protocol" указывает версию протокола в сообщении, полученном сервером или клиентом вдоль цепочки запрос/отклик. Версия received-protocol добавляется к значению поля Via, когда сообщение переадресуется, так что информация о возможностях протоколов предыдущих приложений остается прозрачной для всех получателей.

Запись "protocol-name" является опционной, тогда и только тогда, когда это "HTTP". Поле "received-by" обычно соответствует ЭВМ и номеру порта сервера получателя или клиента, который переадресует сообщение. Однако, если настоящее имя ЭВМ считается конфиденциальной информацией, оно может быть заменено псевдонимом. Если номер порта не задан, можно предполагать, что используется значение по умолчанию для данного протокола (received-protocol).

Значения поля Via представляет каждый прокси или шлюз, который переадресовывал сообщение. Каждый получатель должен присоединить свою информацию так, что конечный результат оказывается упорядоченным согласно последовательности переадресующих приложений.

Комментарии могут быть использованы в поле заголовка Via для идентификации программ получателя прокси или шлюза аналогично полям User-Agent и Server header. Однако, все комментарии в поле Via являются опционными и могут быть удалены любым получателем перед тем, как переадресовать сообщение.

Например, сообщение-запрос может быть послано от агента пользователя HTTP/1.0 программе внутреннего прокси с именем "fred", которая использует HTTP/1.1 для того, чтобы переадресовать запрос общедоступному прокси с именем nowhere.com, который завершает процесс переадресации запроса исходному серверу www.ics.uci.edu.

Запрос, полученный www.ics.uci. edu будет тогда иметь следующее поле заголовка Via:

Via: 1.0 fred, 1.1 nowhere.com (Apache/1.1)

Прокси и шлюзы, используемые как средства сетевой защиты (firewall) не должны по умолчанию переадресовывать имена ЭВМ и портов в пределах области firewall. Эта информация может передаваться, если это непосредственно позволено. Если это не разрешено, запись "received-by" для ЭВМ в зоне действия firewall должна быть заменена соответствующим псевдонимом.

Для организаций, которые имеют жесткие требования к защите конфиденциальности и сокрытию внутренней структуры, прокси может комбинировать субпоследовательность поля заголовка Via с идентичными значениями "received-protocol" в единую запись. Например,

Via: 1.0 vanya, 1.1 manya, 1.1 dunya, 1.0 sonya

Приложениям не следует комбинировать несколько записей, если они только не находятся под единым административным контролем и имена ЭВМ уже заменены на псевдонимы. Приложения не должны комбинировать записи, которые имеют различные значения "received-protocol".

13.45. Поле Warning (Предупреждение)

Поле заголовка отклика Warning используется для переноса дополнительной информации о состоянии отклика, которая может отражать статусный код. Эта информация обычно служит для предупреждения о возможной потере семантической прозрачности из-за операций кэширования. Заголовки Warning посылаются с откликами, используя:

Warning	= "Warning" ":" 1#warning-value
warning-value	= warn-code SP warn-agent SP warn-text
warn-code	= 2DIGIT
warn-agent	= ( host [ ":" port ] ) \| pseudonym

; имя или псевдоним сервера, добавившего заголовок Warning, предназначенный для целей отладки

warn-text

= quoted-string

Отклик может нести в себе более одного заголовка Warning.

Запись warn-text производится на естественном языке и с применением символьного набора, приемлемого для принимающего отклик лица. Это решение может базироваться на какой-то имеющейся информации, такой как положение кэша или пользователя, поле запроса Accept-Language, поле отклика Content-Language и т.д.

Языком по умолчанию является английский, а символьным набором - ISO-8859-1.

Если используется символьный набор отличный от ISO-8859-1, он должен быть закодирован в warn-text с использованием метода, описанного в RFC-1522 [14].

Любой сервер или кэш может добавить заголовки Warning к отклику. Новые заголовки Warning должны добавляться после любых существующих заголовков Warning. Кэш не должен уничтожать какие-либо заголовки, которые он получил в отклике. Однако, если кэш успешно перепроверил запись, ему следует удалить все заголовки Warning, присоединенные ранее, за исключением специальных кодов Warning. Он должен добавить к записи новые заголовки Warning, полученные с откликом перепроверки. Другими словами заголовками Warning являются те, которые были бы получены в отклике на запрос в данный момент.

Когда к отклику подключено несколько заголовков Warning, агенту пользователя следует отображать их столько, сколько возможно, для того чтобы они появились в отклике. Если невозможно отобразить все предупреждения, агент пользователя должен следовать следующим эвристическим правилам:

Предупреждения, которые появляются в отклике раньше, имеют приоритет перед теми, что появляются позже.

Предупреждения, с предпочитаемым пользователем символьным набором имеют приоритет перед предупреждениями с другими наборами, но с идентичными warn-codes и warn-agents.

Системы, которые генерируют несколько заголовков Warning, должны упорядочить их с учетом ожидаемого поведения агента пользователя.

Далее представлен список определенных в настоящее время кодов предупреждений, каждый из которых сопровождается рекомендуемым текстом на английском языке и описанием его значения.

Параллельный сетевой интерфейс HIPPI

4.1.7 Параллельный сетевой интерфейс HIPPI

Все рассматриваемые до сих пор системы передачи информации использовали исключительно последовательный код. На разных этапах эволюции телекоммуникаций предпочтение отдавалось и параллельному и последовательному методам обмена данными. В данный момент параллельный интерфейс сохранился только для подключения принтеров. Главным преимуществом последовательных схем передачи информации является экономия на кабелях. Ниже описан еще один стандарт, где применен параллельный интерфейс (начало разработки относится к 1987 году). HIPPI (high performance parallel interface, смотри ftp.network.com;

http://www.cern.ch/hsi/hippi/spec/introduc.htm; RFC-2067, IP over HIPPI, J.Renwick; RFC-1374, IP and ARP on HIPPI, J.Renwick, ANSI x3t9.3/90-043, 1990 и X3t9.3/91-005) представляет собой быстродействующий параллельный интерфейс, рассчитанный на пропускную способность 800 Мбит/с (но возможны версии со 100, 200 400 и 1600 Мбит/с). Разработка интерфейса выполнена в Лос-Аламосе. Позднее на базе этого интерфейса была подготовлена идеология сети.

Длина кода, передаваемого за один такт в HIPPI, составляет 32 разряда (версия HIPPI, рассчитанная на скорость 1600 Мбит/с, имеет длину кода 64 бита). Все пересылки являются симплексными. Существует стандарт Superhippi (HIPPI-6400, 6,4 Гбайт/с), который описывает систему передачи данных в 8 раз более быстродействующую, чем HIPPI. Разработана версия последовательного HIPPI на скорость обмена 1,2 Гбод для коаксиального и оптоволоконного кабеля (до 10км; версия HIPPI-FC – fiber channel). Максимальное расстояние между станцией и переключателем составляет 25 м. Максимальное дистанция между станциями (станция-переключатель-станция) равно 50 м. Предельное число станций зависит от типа используемых переключателей. Переключатели могут взаимодействовать друг с другом (HIPPI-SC), обеспечивая информационный обмен между станциями. Пример топологии сети hippi представлен на Рисунок 4.1.7.1.

Пример реализации алгоритма Хафмана

Рисунок 2.6.5.1 Пример реализации алгоритма Хафмана

На следующем шаге наименее вероятными сообщениями окажутся m(1) и m(2). Кодовые слова на полученном дереве считываются справа налево. Алгоритм выдает оптимальный код (минимальная избыточность).

При использовании кодирования по схеме Хафмана надо вместе с закодированным текстом передать соответствующий алфавит. При передаче больших фрагментов избыточность, сопряженная с этим не может быть значительной.

Возможно применение стандартных алфавитов (кодовых таблиц) для пересылки английского, русского, французского и т.д. текстов, программных текстов на С++, Паскале и т.д. Кодирование при этом не будет оптимальным, но исключается статистическая обработка пересылаемых фрагментов и отпадает необходимость пересылки кодовых таблиц.

Пример топологии сети hippi (П – переключатели, С – станции)

Рисунок 4.1.7.1. Пример топологии сети hippi (П – переключатели, С – станции)

HIPPI предполагает передачу данных по медному кабелю (или оптическому волокну) только в одном направлении по схеме связи точка-точка, но два канала HIPPI могут обеспечить и двунаправленный обмен данными. Передающий кабель может содержать 50/100 скрученных пар или соответствующее число оптических волокон. Длина пакета данных может варьироваться. Протокол HIPPI рассчитан на работу в реальном масштабе времени при суммарных длинах кабелей до десятков километров. Стандартный блок данных содержит 256 слов (1024 или 2048 байт). Для контроля корректности передачи предусмотрен контроль по четности для каждого байта на шине, кроме того, для каждого блока данных вычисляется “продольная” контрольная сумма (LLRC - length/longitudinal redundancy checkword). На Рисунок 4.1.7.2 показана схема передачи данных в рамках протокола HIPPI. На каждое соединение может быть передано любое число пакетов, пакет в свою очередь может содержать любое число блоков. Время между пакетами не регламентировано и может меняться, оно зависит от потока данных и протокола верхнего уровня.

Разные предупреждения

99 Разные предупреждения

Текст предупреждения включает в себя любую информацию, которая может быть представлена человеку-оператору или может быть занесена в дневник операций. Система, получающая это предупреждение, не должна предпринимать каких-либо действий автоматически.

13.46. Поле WWW-Authenticate

Поле заголовка отклика WWW-Authenticate должно включаться в сообщения откликов со статусным кодом 401 (Unauthorized). Значение поля содержит, по крайней мере, одно требование, которое указывает на схему идентификации и параметры, применимые для Request-URI.

WWW-Authenticate = "WWW-Authenticate" ":" 1#challenge

Процесс авторизации доступа HTTP описан в разделе 10. Агенты пользователя должны проявлять особую тщательность при разборе значения поля WWW-Authenticate, если оно содержит более одного требования, или если прислан более чем одно поле заголовка WWW-Authenticate, так как содержимое требования может само содержать список параметров идентификации, элементы которого разделены запятыми.

14. Соображения безопасности

Этот раздел предназначен для того, чтобы проинформировать разработчиков приложений, поставщиков информации и пользователей об ограничениях безопасности в HTTP/1.1, как это описано в данном документе. Обсуждение не включает определенные решения данных проблем, но рассматриваются некоторые предложения, которые могут уменьшить риск.

14.1. Аутентификация клиентов

Базовая схема идентификации не предоставляет безопасного метода идентификации пользователя, не обеспечивает она и какох-либо средств защиты объектов, которые передаются открытым текстом по используемым физическим сетям. HTTP не мешает внедрению дополнительных схем идентификации и механизмов шифрования или других мер, улучшающих безопасность системы (например, SSL или одноразовых паролей).

Наиболее серьезным дефектом базового механизма идентификации является то, что пароль пользователя передается по сети в незашифрованном виде.

Так как базовая идентификация предусматривает пересылку паролей открытым текстом, она никогда не должна использоваться (без улучшения) для работы с конфиденциальной информацией.

[1]	Alvestrand, H., "Tags for the identification of languages", RFC 1766, UNINETT, March 1995.
[2]	Anklesaria, F., McCahill, M., Lindner, P., Johnson, D., Torrey, D., and B. Alberti. "The Internet Gopher Protocol: (a distributed document search and retrieval protocol)", RFC 1436, University of Minnesota, March 1993
[3]	Berners-Lee, T., "Universal Resource Identifiers in WWW", A Unifying Syntax for the Expression of Names and Addresses of Objects on the Network as used in the World-Wide Web", RFC 1630, CERN, June 1994
[4]	Berners-Lee, T., Masinter, L., and M. McCahill, "Uniform Resource Locators (URL)", RFC 1738, CERN, Xerox PARC, University of Minnesota, December 1994
[5]	Berners-Lee, T., and D. Connolly, "HyperText Markup Language Specification - 2.0", RFC 1866, MIT/LCS, November 1995
[6]	Berners-Lee, T., Fielding, R., and H. Frystyk, "Hypertext Transfer Protocol -- HTTP/1.0.", RFC 1945 MIT/LCS, UC Irvine, May 1996
[7]	Freed, N., and N. Borenstein, "Multipurpose Internet Mail Extensions (MIME) Part One: Format of Internet Message Bodies", RFC 2045, Innosoft, First Virtual, November 1996.
[8]	Braden, R., "Requirements for Internet hosts - application and support", STD3, RFC 1123, IETF, October 1989
[9]	Crocker, D., "Standard for the Format of ARPA Internet Text Messages", STD 11, RFC 822, UDEL, August 1982
[10]	Davis, F., Kahle, B., Morris, H., Salem, J., Shen, T., Wang, R., Sui, J., and M. Grinbaum. "WAIS Interface Protocol Prototype Functional Specification", (v1.5), Thinking Machines Corporation, April 1990
[11]	Fielding, R., "Relative Uniform Resource Locators", RFC 1808, UC Irvine, June 1995
[12]	Horton, M., and R. Adams. "Standard for interchange of USENET messages", RFC 1036, AT&T Bell Laboratories, Center for Seismic Studies, December 1987
[13]	Kantor, B., and P. Lapsley. "Network News Transfer Protocol." A Proposed Standard for the Stream-Based Transmission of News", RFC 977, UC San Diego, UC Berkeley, February 1986
[14]	Moore, K., "MIME (Multipurpose Internet Mail Extensions) Part Three: Message Header Extensions for Non-ASCII Text", RFC 2047, University of Tennessee, November 1996
[15]	Nebel, E., and L. Masinter. "Form-based File Upload in HTML", RFC 1867, Xerox Corporation, November 1995.
[16]	Postel, J., "Simple Mail Transfer Protocol", STD 10, RFC 821, USC/ISI, August 1982
[17]	Postel, J., "Media Type Registration Procedure", RFC 2048, USC/ISI, November 1996
[18]	Postel, J., and J. Reynolds, "File Transfer Protocol (FTP)", STD 9, RFC 959, USC/ISI, October 1985
[19]	Reynolds, J., and J. Postel, "Assigned Numbers", STD 2, RFC1700, USC/ISI, October 1994
[20]	Sollins, K., and L. Masinter, "Functional Requirements for Uniform Resource Names", RFC 1737, MIT/LCS, Xerox Corporation, December 1994
[21]	US-ASCII. Coded Character Set - 7-Bit American Standard Code for Information Interchange. Standard ANSI X3.4-1986, ANSI, 1986
[22]	ISO-8859. International Standard -- Information Processing -- 8-bit Single-Byte Coded Graphic Character Sets
	Part 1: Latin alphabet No. 1, ISO 8859-1:1987
	Part 2: Latin alphabet No. 2, ISO 8859-2, 1987
	Part 3: Latin alphabet No. 3, ISO 8859-3, 1988
	Part 4: Latin alphabet No. 4, ISO 8859-4, 1988
	Part 5: Latin/Cyrillic alphabet, ISO 8859-5, 1988
	Part 6: Latin/Arabic alphabet, ISO 8859-6, 1987
	Part 7: Latin/Greek alphabet, ISO 8859-7, 1987
	Part 8: Latin/Hebrew alphabet, ISO 8859-8, 1988
	Part 9: Latin alphabet No. 5, ISO 8859-9, 1990
[23]	Meyers, J., and M. Rose "The Content-MD5 Header Field", RFC1864, Carnegie Mellon, Dover Beach Consulting, October, 1995
[24]	Carpenter, B., and Y. Rekhter, "Renumbering Needs Work", RFC 1900, IAB, February 1996.
[25]	Deutsch, P., "GZIP file format specification version 4.3." RFC1952, Aladdin Enterprises, May 1996
[26]	Venkata N. Padmanabhan and Jeffrey C. Mogul. Improving HTTP Latency. Computer Networks and ISDN Systems, v. 28, pp. 25-35, Dec. 1995. Slightly revised version of paper in Proc. 2nd International WWW Conf. '94: Mosaic and the Web, Oct. 1994, which is available at http://www.ncsa.uiuc.edu/SDG/IT94/Proceedings/DDay/ mogul/HTTPLatency.html.
[27]	Joe Touch, John Heidemann, and Katia Obraczka, "Analysis of HTTP Performance", , USC/Information Sciences Institute, June 1996
[28]	Mills, D., "Network Time Protocol, Version 3, Specification, Implementation and Analysis", RFC 1305, University of Delaware, March 1992
[29]	Deutsch, P., "DEFLATE Compressed Data Format Specification version 1.3." RFC 1951, Aladdin Enterprises, May 1996
[30]	Spero, S., "Analysis of HTTP Performance Problems" .
[31]	Deutsch, P., and J-L. Gailly, "ZLIB Compressed Data Format Specification version 3.3", RFC 1950, Aladdin Enterprises, Info-ZIP, May 1996
[32]	Franks, J., Hallam-Baker, P., Hostetler, J., Leach, P., Luotonen, A., Sink, E., and L. Stewart, "An Extension to HTTP : Digest Access Authentication", RFC 2069, January 1997

<

/p> 16. Приложения

16.1. Интерентовский тип среды "message/http"

В дополнение к определению протокола HTTP/1.1, данный документ является спецификацией для типов среды Интернет "message/http". Ниже приведенный список является официальным для IANA.

Media Type name:	message
Media subtype name:	http
Required parameters:	none
Optional parameters:	version, msgtype

version: Номер версии HTTP вложенного сообщения (напр., "1.1"). Если отсутствует, номер версии может быть определен по первой строке тела сообщения.

msgtype: Тип сообщения -- "запроса" или "отклика". Если отсутствует, тип может быть определен по первой строке тела сообщения.

Соображения кодирования: разрешено только "7bit", "8bit" или "binary" (двоичное).

16.2. Тип среды Интернет "multipart/byteranges"

Когда сообщение HTTP содержит несколько фрагментов (ranges) (например, отклик на запрос нескольких не перекрывающихся фрагментов), они пересылаются как многофрагментное сообщение MIME. Тип среды multipart для этих целей носит название "multipart/byteranges".

Тип среды multipart/byteranges содержит в себе две или более части, каждая из которых со своими полями Content-Type и Content-Range. Отдельные части разделяются с использованием пограничного параметра MIME.

Media Type name:	multipart
Media subtype name:	byteranges
Required parameters:	boundary
Optional parameters:	none

Link	= "Link" ":"#("" *(";" link-param)
link-param	= (("rel" "=" relationship )
	\| ("rev" "=" relationship)
	\| ( "title" "=" quoted-string )
	\| ( "anchor" "=" URI )
	\| (link-extension ))
link-extension	= token ["=" (token \| quoted-string )]
relationship	= sgml-name
	\| ( sgml-name *( SP sgml-name) )
sgml-name	= ALPHA *( ALPHA \| DIGIT \| "." \| "-")

Запись значений отношения не зависит от использования строчных или прописных букв и может быть расширена в рамках синтаксиса имен sgml. Параметр заголовка может быть использован для пометки места назначения связи, такой как используется при идентификации в рамках меню для пользователя. Параметр типа якорь может использоваться для индикации источника якоря, отличного от всего текущего ресурса, такого как фрагмент данного ресурса. Примеры использования:

Link: ; rel="Previous"

Link: ; rev="Made"; title="Tim Berners-Lee"

Первый пример указывает, что глава 2 предшествует данному ресурсу с точки зрения логического прохода. Второй указывает, что лицо, ответственное за данный ресурс, имеет приведенный адрес электронной почты.

16.6.2.5. Поле URI

Поле заголовка URI использовалось в прошлых версиях данной спецификации как комбинация существующих полей заголовка Location, Content-Location и Vary. Его первоначальной целью являлось включение списка дополнительных URI для ресурса, включая имена и положение зеркал. Однако, стало ясно, что комбинация многих различных функций в пределах одного поля мешает эффективной их реализации. Более того, мы полагаем, что идентификация имени положения зеркал лучше осуществлять через поле заголовка Link. Поле заголовка URI было признано менее удобным, чем эти поля.

URI-header = "URI" ":" 1#( "" )

16.7. Совместимость с предыдущими версиями

HTTP/1.1 был специально спроектирован так, чтобы обеспечить совместимость с предыдущими версиями. Следует заметить, что на фазе разработки этой спецификации мы предполагали, что коммерческие HTTP/1.1 серверы будут следовать следующим правилам:

распознают формат Request-Line для запросов HTTP/0.9, 1.0 и 1.1;

воспринимают любой корректный запрос в формате HTTP/0.9, 1.0 или 1.1;

корректно откликаются сообщениями с той же версией, что использовал клиент.

Мы также ожидаем, что клиенты HTTP/1.1:

распознают формат откликов Status-Line для HTTP/1.0 и 1.1;

воспринимают любой корректный отклик в формате HTTP/0.9, 1.0 или 1.1.

Для большинства реализаций HTTP/1.0, каждое соединение устанавливается клиентом до посылки запроса и закрывается сервером после посылки отклика. Некоторые реализации используют версию Keep-Alive постоянного соединения, описанную в разделе 16.7.1.1.

16.7.1. Совместимость с постоянными соединениями HTTP/1.0

Некоторые клиенты и серверы могут пожелать быть совместимыми с некоторыми предшествующими реализациями HTTP/1.0 постоянных соединений клиента и сервера. Постоянные соединения в HTTP/1.0 должны согласовываться в явном виде, так как это не является вариантом по умолчанию. Экспериментальные реализации постоянных соединений в HTTP/1.0 не лишены ошибок. Проблема была в том, что некоторые существующие клиенты 1.0 могут посылать Keep-Alive прокси-серверу, которые не понимает Connection, и ошибочно переадресует его ближайшему серверу. Последний установит соединение Keep-Alive, что приведет к повисанию системы, так как прокси будет ждать close для отклика. В результате клиентам HTTP/1.0 должно быть запрещено использование Keep-Alive, когда они работают с прокси. Однако, взаимодействие с прокси является наиболее важным использованием постоянных соединений, по этой причине подобный запрет является не приемлемым. Следовательно, нам нужен какой-то другой механизм для индикации намерения установить постоянное соединение. Этот механизм должен быть безопасным даже при взаимодействии со старыми прокси, которые игнорируют Connection. Постоянные соединения для сообщений HTTP/1.1 работают по умолчанию; мы вводим новое ключевое слово (Connection: close) для декларации непостоянства соединения. Ниже описана оригинальная форма постоянных соединений для HTTP/1.0. Когда HTTP клиент соединяется с исходным сервером, он может послать лексему соединения Keep-Alive в дополнение к лексеме соединения Persist:

Connection: Keep-Alive.

Сервер HTTP/1.0 откликнется лексемой соединения Keep-Alive и клиент сможет установить постоянное (или Keep-Alive) соединение с HTTP/1.0. Сервер HTTP/1.1 может также установить постоянное соединение с клиентом HTTP/1.0 по получении лексемы соединения Keep-Alive. Однако, постоянное соединение с клиентом HTTP/1.0 не может быть использовано для по-фрагментного кодирования и, следовательно, должно использовать Content-Length для пометки конца каждого сообщения. Клиент не должен посылать лексему соединения Keep-Alive прокси-серверу, так как прокси-сервера HTTP/1.0 не следуют правилам HTTP/1.1 при разборе поля заголовка Connection.

16.7.1.1. Заголовок Keep-Alive

Когда лексема соединения Keep-Alive передана в рамках запроса или отклика, поле заголовка Keep-Alive может также присутствовать. Поле заголовка Keep-Alive имеет следующую форму:

Keep-Alive-header = "Keep-Alive" ":" 0# keepalive-param

keepalive-param = param-name "=" value.

Заголовок Keep-Alive является опционным и используется, если передается параметр. HTTP/1.1 не определяет каких-либо параметров. Если посылается заголовок Keep-Alive, должна быть передана соответствующая лексема соединения. Заголовок Keep-Alive без лексемы соединения должен игнорироваться.

Response is stale (отклик устарел)

10 Response is stale (отклик устарел)

Должно включаться всякий раз, когда присылаемый отклик является устаревшим. Кэш может добавить это предупреждение к любому отклику, но не может удалить его до тех пор, пока не будет установлено, что отклик является свежим.

Revalidation failed (перепроверка пригодности неудачна)

11 Revalidation failed (перепроверка пригодности неудачна)

Должно включаться, если кэш присылает устаревший отклик, потому что попытка перепроверить его пригодность не удалась, из-за невозможности достичь сервера. Кэш может добавить это предупреждение к любому отклику, но никогда не может удалить его до тех пор, пока не будет успешно проведена перепроверка пригодности отклика.

Символьный набор HTML

10.19 Символьный набор HTML

Символьный набор документов HTML, заданный "SGML Declaration for HTML". Этот набор базируется на документе [ISO-8859-1].

Кодовое представление	Символ	Описание
-		Не используется
		Символ горизонтальной табуляции
&#10		Перевод строки
		Возврат каретки
-		Не используется
		Пробел
!	!	Восклицательный знак
"	"	Кавычки
#		Знак числа ()
$	$	Знак доллара
%	%	Знак процента
&	&	Ampersand
'	'	Апостроф
(	(	Левая скобка
)	)	Правая скобка
*	*	Звездочка
+	+	Знак плюс
,	,	запятая
-	-	Дефис
.	.	Точка (полная остановка)
/	/	Косая черта (slash)
0 - 9	0-9	Цифры 0-9
:	:	Двоеточие
;	;	Точка с запятой
<	<	Знак меньше чем
=	=	Знак равенства
>	>	Знак больше чем
?	?	Знак вопроса
@	@	Символ @
A - Z	A-Z	Буквы A-Z
[	[	Левая квадратная скобка
\	\	Обратная косая черта (backslash)
&#93	]	Правая квадратная скобка
^	^	Знак вставки (^ caret)
_	_	Горизонтальная черта (underscore)
`		Ударение
a - z	a-z	Буквы a-z
{	{	Левая фигурная скобка
\|	\|	Вертикальная черта
}	}	Правая фигурная скобка
~	~	Тильда (~)
-		Не используется
		Неразрывный пробел
¡	?	Инвертированный восклицательный знак
¢	?	Знак центов
£	?	Знак фунтов стерлингов
¤	¤	Обобщенный знак валюты
¥	?	Знак иены
¦	¦	Разорванный знак вертикальной черты
§	§	Знак раздела (Section sign)
¨	?	Умляут (горизонтальное двоеточие над буквой)
©	©	Знак авторского права (Copyright)
ª	?	Feminine ordinal
«	«	Левая угловая кавычка (guillemotleft)
¬	¬	Знак отрицания (Not sign)
		Мягкий дефис (Soft hyphen)
®	®	Зарегистрированная торговая марка
¯	?	Macron accent
°	°	Знак градуса (Degree sign)
±	±	Знак плюс или минус (± )
²	?	Верхний индекс 2 (Superscript two)
³	?	Верхний индекс 3 (Superscript three)
´	?	Знак ударения (Acute accent)
µ	µ	Знак долготы над гласным (горизонтальная черта - Micro sign)
¶	¶	Знак параграфа
·	·	Центральная точка
¸	?	Орфографический знак седиль (Cedilla)
¹	?	Верхний индекс 1 (Superscript one)
º	?	Masculine ordinal
»	»	Правая угловая кавычка (guillemotright)
¼	?	Дробь ј
½	?	Дробь 1/2
¾	?	Дробь ѕ
¿	?	Инвертированный знак вопроса
À	A	Прописное A, grave accent
Á	A	Прописное A, acute accent
Â	A	Прописное A, circumflex accent
Ã	A	Прописное A, tilde
Ä	A	Прописное A, dieresis or umlaut mark
Å	A	Прописное A, ring
Æ	?	Прописное AE dipthong (ligature)
Ç	C	Прописное C, cedilla
È	E	Прописное E, grave accent
É	E	Прописное E, acute accent
Ê	E	Прописное E, circumflex accent
Ë	E	Прописное E, dieresis or umlaut mark
Ì	I	Прописное I, grave accent
Í	I	Прописное I, acute accent
Î	I	Прописное I, circumflex accent
Ï	I	Прописное I, dieresis or umlaut mark
Ð	?	Прописное Eth, исландское
Ñ	N	Прописное N, tilde
Ò	O	Прописное O, grave accent
Ó	O	Прописное O, acute accent
Ô	O	Прописное O, circumflex accent
Õ	O	Прописное O, tilde
Ö	O	Прописное O, dieresis or umlaut mark
×	?	Знак умножения
Ø	O	Прописное O, slash
Ù	U	Прописное U, grave accent
Ú	U	Прописное U, acute accent
Û	U	Прописное U, circumflex accent
Ü	U	Прописное U, dieresis or umlaut mark
Ý	Y	Прописное Y, acute accent
Þ	?	Прописное THORN, Icelandic
ß	?	Строчное sharp s, German (sz ligature)
à	a	Строчное a, grave accent
á	a	Строчное a, acute accent
â	a	Строчное a, circumflex accent
ã	a	Строчное a, tilde
ä	a	Строчное a, dieresis or umlaut mark
å	a	Строчное a, ring
æ	?	Строчный дифтонг ae (ligature)
ç	c	Строчное c, cedilla
è	e	Строчное e, grave accent
é	e	Строчное e, acute accent
ê	e	Строчное e, circumflex accent
ë	e	Строчное e, dieresis or umlaut mark
ì	i	Строчное i, grave accent
í	i	Строчное i, acute accent
î	i	Строчное i, circumflex accent
ï	i	Строчное i, dieresis or umlaut mark
ð	?	Строчное eth, Icelandic
ñ	n	Строчное n, tilde
ò	o	Строчное o, grave accent
ó	o	Строчное o, acute accent
ô	o	Строчное o, circumflex accent
õ	o	Строчное o, tilde
ö	o	Строчное o, dieresis or umlaut mark
÷	?	Строчное ion sign
ø	o	Строчное o, slash
ù	u	Строчное u, grave accent
ú	u	Строчное u, acute accent
û	u	Строчное u, circumflex accent
ü	u	Строчное u, dieresis or umlaut mark
ý	y	Строчное y, acute accent
þ	?	Строчное thorn, исландское
ÿ	y	Строчное y с умляутом (dieresis or umlaut mark)

<
/p>

Описание	Название символа	Уникод	Название набора
<!ENTITY nbsp CDATA " " >	Неразрывный пробел	U+00A0	ISOnum
<!ENTITY iexcl CDATA "¡" >	Инвертированный !	U+00A1	ISOnum
<!ENTITY cent CDATA "¢" >	Знак цента	U+00A2	ISOnum
<!ENTITY pound CDATA "£" >	Знак фунта	U+00A3	ISOnum
<!ENTITY curren CDATA "¤" >	Знак валюты	U+00A4	ISOnum
<!ENTITY yen CDATA "¥" >	Знак иены	U+00A5	ISOnum
<!ENTITY brvbar CDATA "¦" >	Разорванная вертикальная черта	U+00A6	ISOnum
<!ENTITY sect CDATA "§" >	Знак секции	U+00A7	ISOnum
<!ENTITY uml CDATA "¨" >	Диэреза = двоеточие над гласной	U+00A8	ISOdia
<!ENTITY copy CDATA "©" >	Знак авторского права	U+00A9	ISOnum
<!ENTITY ordf CDATA "ª" >	Указатель женского начала	U+00AA	ISOnum
<!ENTITY laquo CDATA "«" >	Левая двойная угловая кавычка	U+00AB	ISOnum
<!ENTITY not CDATA “¬” >	Знак отрицания	U+00AC	ISOnum
<!ENTITY shy CDATA “” >	Мягкий дефис	U+00AD	ISOnum
<!ENTITY reg CDATA “®”>	Знак зарегистрированной торговой марки	U+00AE	ISOnum
<!ENTITY macr CDATA “¯” >	Знак долготы над гласным = черта над	U+00AF	ISOdia
<!ENTITY deg CDATA “°” >	Знак градуса	U+00B0	ISOnum
<!ENTITY plusmn CDATA “±” >	Знак плюс-минус	U+00B1	ISOnum
<!ENTITY sup2 CDATA “²” >	2 в верхнем индексе = знак квадрата	U+00B2	ISOnum
<!ENTITY sup3 CDATA “³” >	3 в верхнем индексе = знак куба	U+00B3	ISOnum
<!ENTITY acute CDATA “´” >	Резкое ударение	U+00B4	ISOdia
<!ENTITY micro CDATA “µ” >	Знак микро	U+00B5	ISOnum
<!ENTITY a CDATA “¶” >	Знак параграфа	U+00B6	ISOnum
<!ENTITY middot CDATA “·” >	Центральная точка	U+00B7	ISOnum
<!ENTITY cedil CDATA “¸” >	Седиль	U+00B8	ISOdia
<!ENTITY sup1 CDATA “¹” >	1 в верхнем индексе	U+00B9	ISOnum
<!ENTITY ordm CDATA “º” >	Индикатор мужского начала	U+00BA	ISOnum
<!ENTITY raquo CDATA “»” >	Правая двойная угловая кавычка	U+00BB	ISOnum
<!ENTITY frac14 CDATA “¼” >	Символ 1/4	U+00BC	ISOnum
<!ENTITY frac12 CDATA “½” >	Символ 1/2	U+00BD	ISOnum
<!ENTITY frac34 CDATA “¾” >	Символ 3/4	U+00BE	ISOnum
<!ENTITY iquest CDATA “¿”” >	Перевернутый знак вопроса	U+00BF	ISOnum
<!ENTITY Agrave CDATA “À” >	Латинская прописная буква A с глухим ударением	U+00C0	ISOlat1
<!ENTITY Aacute CDATA “Á” >	Латинская прописная буква A с ударением	U+00C1	ISOlat1
<!ENTITY Acirc CDATA “Â” >	Латинская прописная буква A центральным ударением	U+00C2	ISOlat1
<!ENTITY Atilde CDATA “Ã” >	Латинская прописная буква A с тильдой	U+00C3	ISOlat1
<!ENTITY Auml CDATA “Ä” >	Латинская прописная буква A с умляутом, (диэрезой)	U+00C4	ISOlat1
<!ENTITY Aring CDATA “Å” >	Латинская прописная буква A с кружочком сверху	U+00C5	ISOlat1
<!ENTITY Aelig CDATA “Æ” >	Латинская прописная буква AE	U+00C6	ISOlat1
<!ENTITY Ccedil CDATA “Ç” >	Латинская прописная буква C с седилью	U+00C7	ISOlat1
<!ENTITY Egrave CDATA “È” >	Латинская прописная буква E с глухим ударением	U+00C8	ISOlat1
<!ENTITY Eacute CDATA “É” >	Латинская прописная буква E с ударением	U+00C9	ISOlat1
<!ENTITY Ecirc CDATA “Ê”	Латинская прописная буква E с циркумфлексом	U+00CA	ISOlat1
<!ENTITY Euml CDATA “Ë” >	Латинская прописная буква E с диэрезой	U+00CB	ISOlat1
<!ENTITY Igrave CDATA “Ì” >	Латинская прописная буква I с глухим ударением	U+00CC	ISOlat1
<!ENTITY Iacute CDATA “Í” >	Латинская прописная буква I с ударением	U+00CD	ISOlat1
<!ENTITY Icirc CDATA “Î” >	Латинская прописная буква I с циркумфлексом сверху	U+00CE	ISOlat1
<!ENTITY Iuml CDATA “Ï” >	Латинская прописная буква I с диэрезой (умляутом)	U+00CF	ISOlat1
<!ENTITY ETH CDATA “Ð” >	Латинская прописная буква ETH	U+00D0	ISOlat1
<!ENTITY Ntilde CDATA “Ñ” >	Латинская прописная буква N с тильдой	U+00D1	ISOlat1
<!ENTITY Ograve CDATA “Ò” >	Латинская прописная буква O с тупым ударением	U+00D2	ISOlat1
<!ENTITY Oacute CDATA “Ó” >	Латинская прописная буква O с ударением	U+00D3	ISOlat1
<!ENTITY Ocirc CDATA “Ô” >	Латинская прописная буква O с кружочком сверху	U+00D4	ISOlat1
<!ENTITY Otilde CDATA “Õ” >	Латинская прописная буква O с тильдой	U+00D5	ISOlat1
<!ENTITY Ouml CDATA “Ö” >	Латинская прописная буква O с диэрезой (умляутом)	U+00D6	ISOlat1
<!ENTITY times CDATA “×” >	Знак умножения	U+00D7	ISOnum
<!ENTITY Oslash CDATA “Ø” >	Латинская прописная буква O с косой чертой	U+00D8	ISOlat1
<!ENTITY Ugrave CDATA “Ù” >	Латинская прописная буква U с глухим ударением	U+00D9	ISOlat1
<!ENTITY Uacute CDATA “Ú” >	Латинская прописная буква U с ударением	U+00DA	ISOlat1
<!ENTITY Ucirc CDATA “Û” >	Латинская прописная буква U с циркумфлексом сверху	U+00DB	ISOlat1
<!ENTITY Uuml CDATA “Ü” >	Латинская прописная буква U с тремой (умляутом)	U+00DC	ISOlat1
<!ENTITY Yacute CDATA “Ý” >	Латинская прописная буква Y с ударением	U+00DD	ISOlat1
<!ENTITY THORN CDATA “Þ” >	Латинская прописная буква THORN	U+00DE	ISOlat1
<!ENTITY szlig CDATA “ß” >	Латинская строчная буква sharp s = ess-zed	U+00DF	ISOlat1
<!ENTITY agrave CDATA “à” >	Латинская строчная буква a с глухим ударением	U+00E0	ISOlat1
<!ENTITY aacute CDATA “á” >	Латинская строчная буква a с ударением	U+00E1	ISOlat1
<!ENTITY acirc CDATA "â">	Латинская строчная буква a с кружочком сверху	U+00E2	ISOlat1
<!ENTITY atilde CDATA "ã">	Латинская строчная буква a с тильдой	U+00E3	ISOlat1
<!ENTITY auml CDATA "ä">	Латинская строчная буква a с тремой (умляутом)	U+00E4	ISOlat1
<!ENTITY aring CDATA "å">	Латинская строчная буква a с кружочком сверху	U+00E5	ISOlat1
<!ENTITY aelig CDATA "æ">	Латинская строчная буква ae = латинская строчная лигатура ae	U+00E6	ISOlat1
<!ENTITY ccedil CDATA "ç">	Латинская строчная буква c с седилью	U+00E7	ISOlat1
<!ENTITY egrave CDATA "è">	Латинская строчная буква e с глухим ударением	U+00E8	ISOlat1
<!ENTITY eacute CDATA "é">	Латинская строчная буква e с ударением	U+00E9	ISOlat1
<!ENTITY ecirc CDATA "ê">	Латинская строчная буква e с циркумфлексом сверху	U+00EA	ISOlat1
<!ENTITY euml CDATA "ë">	Латинская строчная буква e с тремой (умляутом)	U+00EB	ISOlat1
<!ENTITY igrave CDATA "ì">	Латинская строчная буква i с глухим ударением	U+00EC	ISOlat1
<!ENTITY iacute CDATA "í">	Латинская строчная буква i с ударением	U+00ED	ISOlat1
<!ENTITY icirc CDATA "î">	Латинская строчная буква i с циркумфлексом сверху	U+00EE	ISOlat1
<!ENTITY iuml CDATA "ï">	Латинская строчная буква i с тремой (умляутом)	U+00EF	ISOlat1
<!ENTITY eth CDATA "ð">	Латинская строчная буква eth	U+00F0	ISOlat1
<!ENTITY ntilde CDATA "ñ">	Латинская строчная буква n с тильдой	U+00F1	ISOlat1
<!ENTITY ograve CDATA "ò">	Латинская строчная буква o с глухим ударением	U+00F2	ISOlat1
<!ENTITY oacute CDATA "ó">	Латинская строчная буква o с ударением	U+00F3	ISOlat1
<!ENTITY ocirc CDATA "ô">	Латинская строчная буква o с циркумфлексом сверху	U+00F4	ISOlat1
<!ENTITY otilde CDATA "õ">	Латинская строчная буква o с тильдой	U+00F5	ISOlat1
<!ENTITY ouml CDATA "ö">	Латинская строчная буква o с тремой (умляутом)	U+00F6	ISOlat1
<!ENTITY divide CDATA "÷">	Знак деления	U+00F7	ISOnum
<!ENTITY oslash CDATA "ø">	Латинская строчная буква o с косой чертой	U+00F8	ISOlat1
<!ENTITY ugrave CDATA "ù">	Латинская строчная буква u с глухим ударением	U+00F9	ISOlat1
<!ENTITY uacute CDATA "ú">	Латинская строчная буква u с ударением	U+00FA	ISOlat1
<!ENTITY ucirc CDATA "û">	Латинская строчная буква u с циркумфлексом сверху	U+00FB	ISOlat1
<!ENTITY uuml CDATA "ü">	Латинская строчная буква u с тремой (умляутом)	U+00FC	ISOlat1
<!ENTITY yacute CDATA "ý">	Латинская строчная буква y с ударением	U+00FD	ISOlat1
<!ENTITY thorn CDATA "þ">	Латинская строчная буква thorn	U+00FE	ISOlat1
<!ENTITY yuml CDATA "ÿ">	Латинская строчная буква y с тремой (умляутом)	U+00FF	ISOlat1

<

/p> Эталонные символьные объекты для символов, математических символов и греческих букв

Эталонные символьные объекты в этом разделе производят символы, которые могут быть представлены глифами из широко известного шрифта Adobe Symbol, включая греческие буквы, различные скобки, а также секцией математических операторов (+ . - и т.д.).

Чтобы поддержать эти объекты агенты пользователя могут поддерживать целиком ISO10646 или использовать другие средства. Отображение глифов для этих символов может быть реализовано через отображение соответствующих символов ISO10646 или другими способами, такими как установление внутреннего соответствия перечисленных объектов, коды символов и порядковые номера символов в заданном шрифтовом наборе.

Использование греческих символов. Этот символьный набор содержит все буквы, используемые в современном греческом алфавите. Однако, он не включает в себя греческую пунктуацию, символы со знаками ударения или безпробельные акценты (tonos, dialytika), необходимые для их формирования. Здесь нет архаичных букв, уникальных коптских букв или комбинированных букв политонического греческого языка. Определенные здесь объекты предназначены не для представления современного греческого текста, а для применения в технических математических текстах.

Список символов

Греческие символы (ISOgrk3)
Определение	Название символа	Уникод
<!ENTITY Alpha CDATA "Α">	Греческая прописная альфа (A)	U+0391
<!ENTITY Beta CDATA "Β">	Греческая прописная бета (B)	U+0392
<!ENTITY Gamma CDATA "Γ">	Греческая прописная гамма (G)	U+0393
<!ENTITY Delta CDATA "Δ">	Греческая прописная дельта (D)	U+0394
<!ENTITY Epsilon CDATA "Ε">	Греческая прописная эпсилон (E)	U+0395
<!ENTITY Zeta CDATA "Ζ">	Греческая прописная зета (Z)	U+0396
<!ENTITY Eta CDATA "Η">	Греческая прописная эта (H)	U+0397
<!ENTITY Theta CDATA "Θ">	Греческая прописная тэта (Q)	U+0398
<!ENTITY Iota CDATA "Ι">	Греческая прописная иота (I)	U+0399
<!ENTITY Kappa CDATA "Κ">	Греческая прописная каппа (K)	U+039A
<!ENTITY Lambda CDATA "Λ">	Греческая прописная лямбда (L)	U+039B
<!ENTITY Mu CDATA "Μ">	Греческая прописная мю (M)	U+039C
<!ENTITY Nu CDATA "Ν">	Греческая прописная ню (N)	U+039D
<!ENTITY Xi CDATA "Ξ">	Греческая прописная кси (X)	U+039E
<!ENTITY Omicron CDATA "Ο">	Греческая прописная омикрон (O)	U+039F
<!ENTITY Pi CDATA "Π">	Греческая прописная пи (P)	U+03A0
<!ENTITY Rho CDATA "Ρ">	Греческая прописная ро (R)	U+03A1
<!ENTITY Sigma CDATA "Σ">*)	Греческая прописная сигма (S)	U+03A3
<!ENTITY Tau CDATA "Τ">	Греческая прописная тау (T)	U+03A4
<!ENTITY Upsilon CDATA "Υ">	Греческая прописная ипсилон (U)	U+03A5
<!ENTITY Phi CDATA "Φ">	Греческая прописная фи (F)	U+03A6
<!ENTITY Chi CDATA "Χ">	Греческая прописная хи (C)	U+03A7
<!ENTITY Psi CDATA "Ψ">	Греческая прописная пси (Y)	U+03A8
<!ENTITY Omega CDATA "Ω">	Греческая прописная омега (W)	U+03A9
<!ENTITY alpha CDATA "α">	Греческая строчная альфа (a)	U+03B1
<!ENTITY beta CDATA "β">	Греческая строчная бета (b)	U+03B2
<!ENTITY gamma CDATA "γ">	Греческая строчная гамма (g)	U+03B3
<!ENTITY delta CDATA "δ">	Греческая строчная дельта (d)	U+03B4
<!ENTITY epsilon CDATA "ε">	Греческая строчная эпислон (e)	U+03B5
<!ENTITY zeta CDATA "ζ">	Греческая строчная зета (z)	U+03B6
<!ENTITY eta CDATA "η">	Греческая строчная эта (h)	U+03B7
<!ENTITY theta CDATA "θ">	Греческая строчная тета (q)	U+03B8
<!ENTITY iota CDATA "ι">	Греческая строчная иота (i)	U+03B9
<!ENTITY kappa CDATA "κ">	Греческая строчная каппа (k)	U+03BA
<!ENTITY lambda CDATA "λ">	Греческая строчная лямбда (l)	U+03BB
<!ENTITY mu CDATA "μ"	Греческая строчная мю (m)	U+03BC
<!ENTITY nu CDATA "ν">	Греческая строчная ню (n)	U+03BD
<!ENTITY xi CDATA "ξ">	Греческая строчная кси (x)	U+03BE
<!ENTITY omicron CDATA "ο">	Греческий строчный омикрон (o)	U+03BF
<!ENTITY pi CDATA "π">	Греческая строчная пи (p)	U+03C0
<!ENTITY rho CDATA "ρ">	Греческая строчная ро (r)	U+03C1
<!ENTITY sigmaf CDATA "ς">	Греческая строчная финальная сигма	U+03C2
<!ENTITY sigma CDATA "σ">	Греческая строчная сигма (s)	U+03C3
<!ENTITY tau CDATA "τ">	Греческая строчная тау	U+03C4
<!ENTITY upsilon CDATA "υ">	Греческий строчный ипсилон (u)	U+03C5
<!ENTITY phi CDATA "φ">	Греческая строчная фи (j)	U+03C6
<!ENTITY chi CDATA "χ">	Греческая строчная хи (c)	U+03C7
<!ENTITY psi CDATA "ψ">	Греческая строчная пси (y)	U+03C8
<!ENTITY omega CDATA "ω">	Греческая строчная омега (w)	U+03C9
<!ENTITY thetasym CDATA "ϑ">	Греческий тета символ	U+03D1
<!ENTITY upsih CDATA "ϒ">	Греческий ипсилон с крючком	U+03D2
<!ENTITY piv CDATA "ϖ">	Греческий символ пи	U+03D6

<

/p> *) Не существует Sigmaf, и нет также символа U+03A2

Общая пунктуация
Определение	Название символа	Уникод	Название набора
<!ENTITY ensp CDATA " ">	en пробел	U+2002	ISOpub
<!ENTITY emsp CDATA " ">	em пробел	U+2003	ISOpub
<!ENTITY thinsp CDATA " ">	Узкий пробел	U+2009	ISOpub
<!ENTITY zwnj CDATA "‌">	Разрываемый соединитель нулевой ширины	U+200C	NEW RFC 2070
<!ENTITY zwj CDATA "‍">	Соединитель нулевой ширины	U+200D	NEW RFC 2070
<!ENTITY lrm CDATA "‎">	Знак слево-направо	U+200E	NEW RFC 2070
<!ENTITY rlm CDATA "‏">	Знак справа-налево	U+200F	NEW RFC 2070
<!ENTITY ndash CDATA "–">	en дефис	U+2013	ISOpub
<!ENTITY mdash CDATA "—">	em дефис	U+2014	ISOpub
<!ENTITY lsquo CDATA "‘">	Левая кавычка	U+2018	ISOnum
<!ENTITY rsquo CDATA "’">	Правая кавычка	U+2019	ISOnum
<!ENTITY sbquo CDATA "‚">	Single low-9 quotation mark	U+201A	NEW
<!ENTITY ldquo CDATA "“">	Левая двойная кавычка	U+201C	ISOnum
<!ENTITY rdquo CDATA "”">	Правая двойная кавычка	U+201D	ISOnum
<!ENTITY bdquo CDATA "„">	double low-9 quotation mark	U+201E	NEW
<!ENTITY dagger CDATA "†"	Кинжал †	U+2020	ISOpub
<!ENTITY Dagger CDATA "‡">	Двойной кинжал ‡	U+2021	ISOpub
<!ENTITY bull CDATA "•">	Маленький черный кружочек (bullet) • **)	U+2022	ISOpub
<!ENTITY hellip CDATA "…">	Многоточие = трехточечный пунктир …	U+2026	ISOpub
<!ENTITY permil CDATA "‰"	Знак промиль ‰	U+2030	ISOtech
<!ENTITY prime CDATA "′">	Прайм = минуты = фут	U+2032	ISOtech
<!ENTITY Prime CDATA "″">	Дубль прайм = секунды = дюймы	U+2033	ISOtech
<!ENTITY lsaquo CDATA "‹">	Одиночная, угловая левая кавычка	U+2039	Предложено ISO
<!ENTITY rsaquo CDATA "›">	Одиночная, угловая правая кавычка	U+203A	Предложено ISO
<!ENTITY oline CDATA "‾">	Верхняя черта	U+203E	NEW
<!ENTITY frasl CDATA "⁄">	Косая черта дроби	U+2044	NEW
<!ENTITY euro CDATA "€">	Знак евро €	U+20AC	NEW

<

/p> **) bullet не тождественен оператору bullet, U+2219

Буквоподобные символы
Определение	Название символа	Уникод	Название набора
<!ENTITY weierp CDATA "℘">	Прописная письменная P	U+2118	ISOamso
<!ENTITY image CDATA "ℑ">	Прописная жирная буква I = мнимая часть	U+2111	ISOamso
<!ENTITY real CDATA "ℜ">	Прописная жирная буква R = символ действительной части	U+211C	ISOamso
<!ENTITY trade CDATA "™">	Символ торговой марки	U+2122	ISOnum
<!ENTITY alefsym CDATA "ℵ">	Символ alef ***)	U+2135	NEW

***) Cимвол alef не тождественен букве иврита alef, U+05D0 хотя тот же самый глиф может быть использован для отображения обоих символов

Стрелки
Определение	Название символа	Уникод	Название набора
<!ENTITY larr CDATA "←">	Стрелка влево	U+2190	ISOnum
<!ENTITY uarr CDATA "↑">	Стрелка вверх	U+2191	ISOnum
<!ENTITY rarr CDATA "→">	Стрелка вправо	U+2192	ISOnum
<!ENTITY darr CDATA "↓">	Стрелка вниз	U+2193	ISOnum
<!ENTITY harr CDATA "↔">	Двухсторонняя горизонтальная стрелка	U+2194	ISOamsa
<!ENTITY crarr CDATA "↵">	Стрелка вниз с поворотом налево = возврат каретки	U+21B5	NEW
<!ENTITY lArr CDATA "⇐">	Двойная стрелка влево +)	U+21D0	ISOtech
<!ENTITY uArr CDATA "⇑">	Двойная стрелка вверх	U+21D1	ISOamsa
<!ENTITY rArr CDATA "⇒">	Двойная стрелка вправо ++)	U+21D2	ISOtech
<!ENTITY dArr CDATA "⇓">	Двойная стрелка вниз	U+21D3	ISOamsa
<!ENTITY hArr CDATA "⇔">	Двойная двухсторонняя стрелка	U+21D4	ISOamsa

+) Уникод не утверждает, что lArr тождественно 'implied by' но не имеет какого-либо другого символа для этих целей.

Так ? lArr может использоваться для ' is implied by' как это рекомендует ISOtech

++) Уникод не утверждает, что это 'implies' символ, но не имеет другого символа для этих целей, таким образом, ? rArr может использоваться для 'implies' как это рекомендует ISOtech

Математические операторы
Определение	Название символа	Уникод	Название набора
<!ENTITY forall CDATA "∀">	Для всех ?	U+2200	ISOtech
<!ENTITY part CDATA "∂">	Частный дифференциал ?	U+2202	ISOtech
<!ENTITY exist CDATA "∃">	Существует ?	U+2203	ISOtech
<!ENTITY empty CDATA "∅">	Пустой набор = диаметр ?	U+2205	ISOamso
<!ENTITY nabla CDATA "∇">	Набла = обратная разница	U+2207	ISOtech
<!ENTITY isin CDATA "∈">	Элемент чего-то ?	U+2208	ISOtech
<!ENTITY notin CDATA "∉">	Не элемент чего-то ?	U+2209	ISOtech
<!ENTITY ni CDATA "∋">	Содержит, как член ?	U+220B	ISOtech
<!ENTITY prod CDATA "∏">	n-кратное произведение= знак произведения ?#)	U+220F	ISOamsb
<!ENTITY sum CDATA "∑">	n-кратная сумма ?##)	U+2211	ISOamsb
<!ENTITY minus CDATA "−">	Знак минус ?	U+2212	ISOtech
<!ENTITY lowast CDATA "∗">	Оператор звездочка ?	U+2217	ISOtech
<!ENTITY radic CDATA "√">	Квадратный корень = знак радикала v	U+221A	ISOtech
<!ENTITY prop CDATA "∝">	пропорционально ?	U+221D	ISOtech
<!ENTITY infin CDATA "∞">	Бесконечность (Ґ )	U+221E	ISOtech
<!ENTITY ang CDATA "∠">	Угол (Р )	U+2220	ISOamso
<!ENTITY and CDATA "∧">	Логическое И =призма ?	U+2227	ISOtech
<!ENTITY or CDATA "∨">	Логическое ИЛИ ?	U+2228	ISOtech
<!ENTITY cap CDATA "∩">	Пересечение ?	U+2229	ISOtech
<!ENTITY cup CDATA "∪">	Объединение ?	U+222A	ISOtech
<!ENTITY int CDATA "∫">	Интеграл ?	U+222B	ISOtech
!ENTITY there4 CDATA "∴">	Следовательно ?	U+2234	ISOtech
<!ENTITY sim CDATA "∼">	Оператор тильда = изменяется с = подобно тому ###)	U+223C	ISOtech
<!ENTITY cong CDATA "≅">	Приблизительно равно ?	U+2245	ISOtech
<!ENTITY asymp CDATA "≈">	Почти равно= асимптотическое приближение к ?	U+2248	ISOamsr
<!ENTITY ne CDATA "≠">	Не равно (№ )	U+2260	ISOtech
<!ENTITY equiv CDATA "≡">	Идентично = тождественно равно (є )	U+2261	ISOtech
<!ENTITY le CDATA "≤">	Меньше или равно (Ј )	U+2264	ISOtech
<!ENTITY ge CDATA "≥">	Больше или равно ?	U+2265	ISOtech
<!ENTITY sub CDATA "⊂">	Входит в ?	U+2282	ISOtech
<!ENTITY sup CDATA "⊃">	Включает в себя L	U+2283	ISOtech
<!ENTITY nsub CDATA "⊄">	Не является субнабором чего-то ?	U+2284	ISOamsn
<!ENTITY sube CDATA "⊆">	Входит в или тождественен ?	U+2286	ISOtech
<!ENTITY supe CDATA "⊇">	Включает в себя или тождественен ?	U+2287	ISOtech
<!ENTITY oplus CDATA "⊕">	Плюс в кружочке = direct sum (Е )	U+2295	ISOamsb
<!ENTITY otimes CDATA "⊗">	Векторное произведение = знак умножения в кружочке (Д )	U+2297	ISOamsb
<!ENTITY perp CDATA "⊥">	Ортогонально = перпендикулярно (^ )	U+22A5	ISOtech
<!ENTITY sdot CDATA "⋅">	Оператор точка ####)	U+22C5	ISOamsb

<

/p> #) prod не тождественен символу U+03A0 ' греческая прописная буква pi' хотя один и тот же глиф может быть использован для отображения обоих

##) sum не тождественен символу U+03A3 'греческая прописная буква сигма’ хотя один и тот же глиф может быть использован для отображения обоих

###) tilde оператор не тождественен символу U+007E, хотя один и тот же глиф может быть использован для отображения обоих

####) Оператор dot не тождественен символу U+00B7 центральная точка

Различные технические символы
Определение	Название символа	Уникод	Название набора
<!ENTITY lceil CDATA "⌈">	left ceiling = apl upstile	U+2308	ISOamsc
<!ENTITY rceil CDATA "⌉">	right ceiling (` )	U+2309	ISOamsc
<!ENTITY lfloor CDATA "⌊">	left floor = apl downstile	U+230A	ISOamsc
<!ENTITY rfloor CDATA "⌋">	right floor	U+230B	ISOamsc
<!ENTITY lang CDATA "〈">	левая угловая скобка	U+2329	ISOtech
<!ENTITY rang CDATA "〉">	правая угловая скобка= закрывающая скобка	U+232A	ISOtech

Геометрические формы
Определение	Название символа	Уникод	Название набора
<!ENTITY loz CDATA "◊">	ромб (а )	U+25CA	ISOpub

Различные символы
Определение	Название символа	Уникод	Название набора
<!ENTITY spades CDATA "♠">	черные пики (Є )	U+2660	ISOpub
<!ENTITY clubs CDATA "♣">	черные крести=лист кислицы (§ )	U+2663	ISOpub
<!ENTITY hearts CDATA "♥">	черные черви (© )	U+2665	ISOpub
<!ENTITY diams CDATA "♦">	черные бубни (Ё )	U+2666	ISOpub

Эталонные символьные объекты для символов разметки текста и интернационализации

Эталонные символьные объекты в этой секции предназначены для символов разметки текста (markup) (они те же, что и в HTML 2.0 и 3.2), для обозначения пробелов и дефисов.

Остальные символы в этой секции используются для интернационализации.

Добавлены некоторые символы из CP-1252, которые не встречаются в наборах HTMLlat1 или HTMLsymbol. Все они из диапазона 128 - 159 символьного набора cp-1252. Эти объекты позволяют обозначать символы независимо от платформы.

Для поддержки этих объектов агенты пользователя могут поддерживать полный набор ISO10646 или использовать другие средства. Отображение глифов этих символов может быть реализовано, если возможно отображение символов ISO10646 или другими средствами.

Список символов

Специальные символы HTML. Контроли C0 и базовый латинский
Определение	Название символа	Уникод	Название набора
<!ENTITY quot CDATA """>	Кавычка = APL quote	U+0022	ISOnum
<!ENTITY amp CDATA "&">	Знак &	U+0026	ISOnum
<!ENTITY lt CDATA "<">	Знак меньше чем	U+003C	ISOnum
<!ENTITY gt CDATA ">">	Знак больше чем	U+003E	ISOnum

Латинские буквы, расширение А
Определение	Название символа	Уникод	Название набора
<!ENTITY OElig CDATA "Œ">	Латинская прописная лигатура OE	U+0152	ISOlat2
<!ENTITY oelig CDATA "œ">	Латинская строчная лигатура oe	U+0153	ISOlat2
<!ENTITY Scaron CDATA "Š">	Латинская прописная буква S с короной	U+0160	ISOlat2
<!ENTITY scaron CDATA "š">	Латинская строчная буква s с короной	U+0161	ISOlat2
<!ENTITY Yuml CDATA "Ÿ">	Латинская прописная буква Y с тремой (умляутом)	U+0178	ISOlat2
Латинские буквы, расширение B
Определение	Название символа	Уникод	Название стандарта
<!ENTITY fnof CDATA "ƒ" -->	Латинская строчная буква f с крючком = флорин	U+0192	ISOtech
Модификаторы букв
Определение	Название символа	Уникод	Название стандарта
<!ENTITY circ CDATA "ˆ">	Модификатор буквы – облегченное ударение	U+02C6	ISOpub
<!ENTITY tilde CDATA "˜">	Малая тильда	U+02DC	ISOdia

<

/p>

Статический алгоритм Хафмана

2.6.5 Статический алгоритм Хафмана

Статический алгоритм Хафмана можно считать классическим (см. также Р. Галлагер. Теория информации и надежная связь. “Советское радио”, Москва, 1974.) Определение статический в данном случае отностится к используемым словарям. Смотри также www.ics.ics.uci.edu/~dan/pubs/DataCompression.html (Debra A. Lelewer и Daniel S. Hirschberg).

Пусть сообщения m(1),…,m(n) имеют вероятности P(m(1)),… P(m(n)) и пусть для определенности они упорядочены так, что P(m(1)) і P(m(2)) і … і P(m(N)). Пусть x1,…, xn – совокупность двоичных кодов и пусть l1, l2,…, lN – длины этих кодов. Задачей алгоритма является установление соответствия между m(i) и xj. Можно показать, что для любого ансамбля сообщений с полным числом более 2 существует двоичный код, в котором два наименее вероятных кода xN и xN-1 имеют одну и ту же длину и отличаются лишь последним символом: xN имеет последний бит 1, а xN-1 – 0. Редуцированный ансамбль будет иметь свои два наименее вероятные сообщения сгруппированными вместе. После этого можно получить новый редуцированный ансамбль и так далее. Процедура может быть продолжена до тех пор, пока в очередном ансамбле не останется только два сообщения. Процедура реализации алгоритма сводится к следующему (см. Рисунок 2.6.5.1). Сначала группируются два наименее вероятные сообщения, предпоследнему сообщению ставится в соответствие код с младшим битом, равным нулю, а последнему – код с единичным младшим битом (на рисунке m(4) и m(5)). Вероятности этих двух сообщений складываются, после чего ищутся два наименее вероятные сообщения во вновь полученном ансамбле (m(3) и m`(4); p(m`(4)) = p(m(4)) + P(m(5))).

Структура передаваемой информации (каждое слово содержит или бита)

Рисунок 4.7.1.2. Структура передаваемой информации (каждое слово содержит 32 или 64 бита)

Каждый пакет содержит в конце субполе контроля четности. Все сигналы кроме соединения (interconnect) используют приемники и передатчики эмиттерно-связанной логики (ECL). Формат I-поля показан на рис 4.1.7.3.

Структура ресурса и объекта

Рисунок 4.5.6.1.2. Структура ресурса и объекта

Протокол HTTP представляет собой протокол запросов-откликов. Клиент посылает запрос серверу в форме, определяющей метод, URI и версию протокола. В конце запроса следует MIME-подобное сообщение, содержащее модификаторы, информацию о клиенте и, возможно, другие данные. Сервер откликается, посылая статусную строку, которая включает в себя версию протокола, код результата (успех/неудача) и MIME-подобное сообщение, в котором содержатся данные о сервере и метаинформация.

Большинство HTTP-обменов инициируются пользователем и состоят из запросов ресурсов, имеющихся на определенном сервере. В простейшем случае такой запрос может быть реализован путем соединения пользовательского агента (UA) и базового сервера.

Более сложная ситуация возникает, когда присутствует один или более посредников в цепочке обслуживания запроса/отклика. Существует три стандартные формы посредников: прокси, туннель и внешний порт (gateway). Прокси представляет собой агент переадресации, получающий запрос для URI, переписывающий все сообщение или его часть и отправляющий переделанный запрос серверу, указанному URI. Внешний порт (gateway) представляет собой приемник, который работает на уровень выше некоторых других серверов и транслирует, если необходимо, запрос нижележащему протоколу сервера. Туннель действует как соединитель точка-точка и не производит каких-либо видоизменений сообщений. Туннель используется тогда, когда нужно пройти через какую-то систему (например, Firewall) в условиях, когда эта система не понимает (не анализирует) содержимое сообщений.

Запрос -------------------------------------->

UA -----v----- A -----v----- B -----v----- C -----v----- O

должна иметь как минимум

Таблица должна иметь как минимум одну группу колонок. В отсутствии определения группы считается, что таблица имеет одну группу колонок, включающую в себя все колонки таблицы. Атрибут width элемента colgroup определяет ширину по умолчанию каждой из колонок в группе. Формат “0*”, требующий минимальной ширины, может быть отменен элементом col.

должна содержать хотя

Таблица должна содержать хотя бы одну группу рядов. Каждая группа рядов делится на три секции: заголовок, собственно таблица и подпись под таблицей. Заголовок и подпись являются опционными. Элемент thead определяет заголовок, tfoot – подпись под таблицей, а элемент tbody - тело таблицы. thead, tfoot и tbody, если они присутствуют, должны содержать один или более рядов. Ниже приведен пример использования элементов thead, tfoot и tbody.

<table>

<thead>

<tr> … информация заголовка …

align="justify"></thead>

<tfoot>

<tr> … информационная подпись под таблицей …

</tfoot>

<tbody>

	<tr> … первый ряд блока первых данных …
	<tr> … второй ряд блока первых данных …

</tbody>

<tbody>

	<tr> … первый ряд блока вторых данных …
	<tr> … второй ряд блока вторых данных …
	<tr> … третий ряд блока вторых данных …

</tbody>

</table>

tfoot в рамках определения table должен появляться до tbody, так чтобы агент пользователя мог осуществлять разбор подписи до получения всех данных таблицы.

14.6. Опционные метки групп рядов

Когда таблица содержит только одно тело и не имеет заголовка и нижней подписи, начальная и конечная метки tbody могут быть опущены. Когда блок таблицы содержит заголовок, начальная и конечная метки элемента thead являются необходимыми. Конечная метка может быть опущена, когда далее следует стартовая метка tfoot или tbody. когда блок таблицы содержит нижняя подпись, необходима начальная метка элемента tfoot. Конечная метка может быть опущена, когда далее следуют начальная метка thead или tbody.

14.7. Группы колонок. Элементы colgroup и col

<!element colgroup - o (col*) >

<!attlist colgroup %attrs;		-- %coreattrs, %i18n, %events --
	span number 1	-- число колонок в группе по умолчанию --
	width cdata #implied	-- ширина колонки по умолчанию --
	%CEllhalign;	-- горизонтальное выравнивание в ячейках --
	%CEllvalign;	-- вертикальное выравнивание в ячейках -- >

Определения атрибутов

span = integer

Атрибут в случае своего присутствия определяет число колонок в группе по умолчанию. Агент пользователя должен игнорировать этот атрибут, если текущая группа содержит один или более элементов col. Значение атрибута по умолчанию равно единице.

width = length

Атрибут определяет значение ширины колонки по умолчанию для текущей группы колонок. Кроме того, для стандартных значений пикселя и процента этот атрибут может иметь специальную форму “0*”, которая означает, что ширина каждой колонки в группе должна иметь минимальную ширину для размещения имеющегося текста.

может быть отображена следующим образом

Таблица может быть отображена следующим образом.

A test table with merged cells

	Average	Other category	misc
height	weight
males	1.9	0.003
females	1.7	0.002

Пример 2 иллюстрирует группировку рядов и колонок. Пример взят из “developing international software”, by nadine kano.

Code-page support in Microsoft Window

NT 3.1

NT 3.51

1250

1251

1252

1253

1254

1255

1256

1257

1361

unicode (BMP of ISO/IEC-10646)

windows 3.1 eastern european

windows 3.1 cyrillic

windows 3.1 us (ansi)

windows 3.1 greek

windows 3.1 turkish

hebrew

arabic

baltic

korean

437

708

709

710

720

MS-DOS united states

arabic (asmo 708)

arabic (asmo 449+, bcon v4)

arabic (transparent arabic)

arabic (transparent asmo)

15. Информация о пути. Элемент base

<!element base - o empty>

<!attlist base href %url #required

target cdata #implied -- где развернуть подключенный ресурс -- >

Описание атрибута

href = url

Этот атрибут задает абсолютный url, который используется как базовый при определении относительных url.

В HTML проходы всегда задаются с помощью URL. Относительные URL получаются на основе базового URL, который может быть получен различными путями. Элемент base позволяет описать базовый URL явно. Например:

<html>

<head>

</head>

….

</html>

Относительный URL “../gee/foo/html” будет в этом случае получен в виде:

http://www.barre.fr/gee/foo.html

15.1. Связи и якоря

HTML-связь представляет собой соединение одного WWW-ресурса с другим.

Определение связей и якорей
В HTML любая связь имеет два конца и направление. Связь начинается в источнике и завершается в месте назначения. Любое описание связи определяет оба эти конца. Один конец задается местом описания связи, другой – атрибутом этой связи. Связь соответствует какому-то WWW-ресурсу (HTML-документу, изображению, видео-клипу, текущему документу, звуковому файлу и т.д.). Конец связи может быть также задан якорем. Якорь – это именованный указатель на определенную часть документа. Связь устанавливает соответствие между источником и местом назначения. Но помимо этого связь может определять тип информации. Связи могут носить самый разный характер, например, указания “next” или “previous” также задают определенные связи. Связи могут использоваться пользователем и для определения порядка печати документов. Атрибут rel определяет, что связь имеет начало в текущем документе. Атрибут rev указывает, что описанная связь имеет в качестве места назначения текущий документ. В HTML имеется два элемента, определяющие связь, это link и a.
Link может появиться в секции head HTML-документа. Этот элемент определяет взаимоотношение между зоной текущего документа и другим ресурсом.
Элемент A может появиться в теле документа, он устанавливает связь между зоной текущего документа и другим ресурсом. Элемент a в отличие от link может иметь содержимое (текст, изображения и т.д.). Другим важным отличием этих двух элементов является то, что А интерпретируется агентом пользователя как указание “извлечь ресурс, находящийся на другом конце связи”. Извлеченный ресурс может обрабатываться агентом пользователя разными способами:
Открыть новый документ в том же окне, открыть документ в другом окне, запустить новую программу и т.д.
Атрибут title может быть установлен в элементах для выдачи дополнительной информации о природе связи.
15.2. Элементы, определяющие якоря
Существует два способа специфицировать якоря в HTML-документах.
Использовать элемент А (служит для формирования связей и якорей).

Применить атрибут id любого элемента.
Так как документы могут быть написаны на разных языках, link и a поддерживают атрибуты lang, dir и charset.
15.3. Элемент А
<!element a - - (%inline)* -(a)>

<!attlist a

	%attrs;	-- %coreattrs, %i18n, %events --
	charset cdata #implied	-- перекодировка символов в подключенном ресурсе --
	name cdata #implied	-- именованный конец связи --
	href %url #implied	-- url для подключенного ресурса --
	target cdata #implied	-- где развернуть ресурс --
	rel cdata #implied	-- типы прямых связей --
	rev cdata #implied	-- типы обратных связей --
	accesskey cdata #implied	-- символ ключа доступа --
	shape %shape rect	-- для использования с object shapes --
	coords %coords #implied	-- для использования с object shapes --
	tabindex number #implied	-- положения табуляции -- >

Описания атрибутов
name = cdata
Этот атрибут указывает на то, что элемент использован для описания якоря. Значение этого атрибута является уникальным именем якоря. Это имя действительно в пределах данного документа. Атрибут name работает в том же пространстве имен, что и атрибут ID.
href = url
Этот атрибут указывает на то, что элемент использован для описания связи. Значение атрибута равно положению одного из концов связи (другой конец задан положением этого элемента).
rel = cdata
Этот атрибут указывает на то, что источником связи является текущая позиция в документе. Значение Href в этом случае определяет место назначения связи. Значение rel специфицирует тип связи. Этот атрибут может включать в себя список типов связей, разделенных пробелами.
rev = cdata
Этот атрибут указывает на то, что место назначения связи соответствует текущей позиции в документе. Значение Href в этом случае определяет положение источника. Значение rev специфицирует тип связи. Этот атрибут может включать в себя список типов связей, разделенных пробелами.
charset = cdata
Этот атрибут специфицирует перекодировку символов для данной связи.

Значение этого атрибута должно быть именем “charset” описанным в RFC-2045. Значение по умолчанию этого атрибута равно “ISO-8859-1”.
Ниже приведен пример использования А-элемента.
<a href=http://www.3w.org/>w3c web site</a>
Эта ссылка указывает на базовую страницу консорциума WWW. Когда пользователь активирует эту связь, агент пользователя обратится к указанному ресурсу и откроет HTML-документ. Агент пользователя представляет ссылки в документе так, чтобы выделить их из текста (например, подчеркивает их). Чтобы сообщить агенту пользователя в явном виде, какой набор символов следует использовать при отображении, следует установить соответствующее значение атрибута charset.
<a href =http://www.w3.org/ charset=”ISO-8859-1”>w3c web site</a>
Ниже приведен пример, иллюстрирующий описание якоря с именем “anchor-one” в файле “one.html”.
… текст до якоря …
<a name=”anchor-oner”>this is the location of anchor one.</a>

… текст после якоря …
Это определение присваивает якорь зоне документа, содержащей текст “This is the location of anchor one”. Определив якорь, мы можем установить с ним связь из того же или постороннего документа. URL, который указывает на якорь, завершаются символом #, за которым следует имя якоря. Ниже приведены примеры такого URL.
Абсолютный URL: http://www.mycompany.com/one.html">http://www.mycompany.com/one.html#anchor-one
Относительный URL: ../one.html#anchor-one
Когда связь задана в пределах документа: #anchor-one
Таким образом, связь, определенная в файле “two.html”, который находится в том же каталоге, что и “one.html” имеет ссылку на якорь в виде:
<a href=”./one.html#anchor-one” anchor one</a>
Элемент А в следующем примере определяет якорь и связь в одно и то же время.
<a name=”anchor-two” href=”html://wwwsomecompany.com/people/ian/vocation/family.png”>

</a>
Этот пример содержит связь с www-ресурсом другого типа (png-изображение). Активация связи должна извлечь это изображение из сети и отобразить его.

15.4. Связи mailto
Автор может сформировать связи, которые не ведут к какому-либо документу, а реализуют отправку e-mail сообщения по некоторому адресу. Когда такая связь активизируется, агент пользователя вызывает почтовую программу. Для реализации таких связей введено значение mailto атрибута Href.
<a href=”mailto:semenov@ns.itep.ru”> yury semenov</a>
Когда пользователь активизирует эту связь, агент пользователя открывает почтовую программу и заносит в поле “to:” значение “semenov@ns.itep.ru”.
15.5. Вложенные связи
Связи и якоря, описанные элементом А не допускают вложения. Например, ниже приведенная запись недопустима.
<a name=”outer-anchor” href=”next-outer.html”> an outer anchor and link <a name=”inner-anchor” href=”next-inner.html”>an inner anchor and link.</a></a>
15.6. Якоря с атрибутом id
Атрибут id может использоваться для размещения якоря в области начальной метки любого элемента. Ниже приведен пример использования id для размещения якоря в элементе Н2. Якорь подвязан здесь посредством А-элемента.
<h2 id=”section2”>section two</h2>

… позднее в документе …

please refer to <a href=”#section2”>section two</a> above for more details.
Атрибуты ID и name работают в общем пространстве имен (см. ISO10646). Это означает, что они не могут описать якоря с идентичными именами в пределах одного документа.
15.7. Элемент link
<!element link - o empty>

<!attlist link

	%attrs;	-- %coreattrs, %i18n, %events --
	href %url #implied	-- url для подключаемого ресурса --
	rel cdata #implied	-- forward link types --
	rev cdata #implied	-- reverse link types --
	type %contenttype #implied	-- advisory internet content type --
	media cdata #implied	-- для представления в этой среде --
	target cdata #implied	-- место, где производится отображение -- >

Этот элемент, который должен использоваться в Head-секции документа (любое число раз), определяет связь, независящую от среды.

Хотя Link не имеет содержимого, он предоставляет информацию, обрабатываемую агентами пользователя. Ниже в предлагаемом примере показано как в секции head документа могут появиться несколько определений Link. Атрибуты rel и rev определяют, откуда связь начинается и где кончается.
<html>

<head>

<link rel =”index” href=”../index.html”>

<link rel =”next” href=”chapter_3.html”>

<link rev =”previous” href=”chapter_1.html”>

</head>

……
15.8. Типы связей
Атрибуты rel и rev определяют начало и конец связи, но их значение или значения задают также природу связи. Если для элемента А атрибуты rel и rev не являются обязательными для link, хотя бы один из них присутствовать должен. Агент пользователя может интерпретировать эти атрибуты множеством путей, например, через меню или “клавишу next”. Ниже перечислены некоторые типы связей.

Содержимое	соединение выполняет функцию оглавления документа.
Индекс	соединение предлагает индекс документа.
Глоссарий	соединение предлагает глоссарий терминов для данного документа.
copyright	соединение воспроизводит заявление о защите авторских прав.
Следующий	связь осуществляет переход к следующему документу из списка (next)
Предыдущий	связь осуществляет переход к предыдущему документу из списка (previous)
Содержание	связь вызывает переход к первому из ряда документов.
Справка	связь производит вызов документов, дающих дополнительную информацию по некоторым вопросам (help)
Закладка	связь реализует переход в определенную точку документа, часто такой точкой является заголовок главы или раздела (bookmark).
Стилевой лист	связь указывает на внешний стилевой лист.
Альтернатива	связь указывает на различные версии того же самого документа, например, на переводы данного документа на иностранные языки (alternate).

15.9. Связи с поисковыми системами
Элемент Link может использоваться для решения задач поиска документов по ключевым словам и другим признакам, например, язык или представления документа в виде, допускающем печать.

Ниже приведен пример, где сообщается поисковой системе о месте нахождения печатной копии руководства.
<head>

<link media=”print” title=”the manual in postscript”

	rel=”alternate”
	href=”http://someplace.com/manual/postscript.ps”>

</head>
А в этом примере мы заставляем поисковую систему найти первую страницу собрания документов.
<head>

<link rel=”start” title=”the first page of the manual”

href=”html://someplace.com/manual/postscript.ps”>

	%attrs;	-- %coreattrs, %i18n, %events --
	declare (declare) #implied	-- декларирует но не присваивает конкретных значений флагу --
	classid %url #implied	-- идентифицирует приложение --
	codebase %url #implied	-- некоторые системы требуют дополнительного url --
	data %url #implied	-- ссылка на объектные данные --
	type %contenttype #implied	-- Интернетовский тип данных --
	codetype %contenttype #implied	-- Интернетовский тип для кодов --
	standby cdata #implied	-- сообщение, отображаемое при загрузке --
	align %oalign #implied	-- позиционирование в пределах документа --
	height %length #implied	-- предлагаемая высота --
	width %length #implied	-- предлагаемая ширина --
	border %length #implied	-- предлагаемая ширина рамки --
	hspace %length #implied	-- предлагаемый горизонтальный пробел --
	vspace %length #implied	-- предлагаемый вертикальный пробел --
	usemap %url #implied	-- reference to image map --
	shapes (shapes) #implied	-- объект имеет сформированные гипертекстные связи --
	name %url #implied	-- представить, как часть формы --
	tabindex number #implied	-- position in tabbing order -- >

Определения атрибутов
codebase = url
Этот атрибут специфицирует базовый проход для определения относительного URL, описанного classid.

Если атрибут не задан, значением по умолчанию является базовый URL данного документа.
classid = URL
Этот атрибут специфицирует положение механизма отображения через url.
codetype = cdata
Этот атрибут специфицирует internet media type данных, ожидаемых механизмом отображения, определенным classid. Атрибут является опционным, но рекомендуемым, когда имеется classid, так как это позволяет агенту пользователя избежать загрузки информации для неподдерживаемого типа среды. Если явно величина не задана, его значение по умолчанию соответствует значению атрибута type.
data = URL
Этот атрибут специфицирует положение данных, которые должны быть отображены.
type = cdata
Этот атрибут специфицирует Internet media type для данных, заданных атрибутом data. Атрибут является опционным, но рекомендуемым, когда задан атрибут data, так как это позволяет агенту пользователя избежать загрузки информации с типом, неподдерживаемым средой.
declare
Если присутствует, этот булев атрибут делает текущее определение object лишь декларацией.
standby = cdata
Этот атрибут специфицирует сообщение, которое агент пользователя может отобразить при загрузке объектных приложений и данных.
align = texttop|middle|textmiddle|baseline|textbottom|left|center|right
Не рекомендуется к использованию. Этот атрибут специфицирует положение объекта по отношению к окружающему контексту.
Большинство агентов пользователей снабжены механизмом для отображения базовых типов информации, таких как текст, картинки в GIF-формате, цвета, шрифты и т.д. В HTML элемент object определяет положение механизма отображения и положение данных, необходимых для механизма отображения. Агент пользователя интерпретирует элемент object согласно следующим правилам.
Агент пользователя должен сначала попробовать механизм отображения, заданный атрибутом элемента. Если агент пользователя не может поддержать этот механизм по какой-либо причине, он должен попытаться работать с содержимым элемента.
Важным следствием конструкции элемента object является то, что он предлагает механизм для описания альтернативного механизма отображения различных объектов.

Каждая декларация object может предлагать альтернативный механизм отображения. Если агент пользователя не может воспользоваться имеющимся механизмом, он может обратиться к тексту, который может представлять собой другой элемент object. В ниже приведенном примере использовано несколько деклараций object для иллюстрации альтернативных способов отображения. Агент пользователя сначала попробует отобразить первый элемент object, а далее будет пытаться воспользоваться: аплетом eath, написанным на языке python, mpeg анимацией, изображением земли в формате GIF и, наконец, альтернативным текстом.
<object title=”the earth as seen from space”

classid=”http://www.observer.mars/theearth.py”>

<object data=”theearth.mpeg” type=”application/mpeg”>

the <strong> ”earth"</strong> as seen from space.

		</object>
	</object>

</object>
Самая внешняя декларация специфицирует аплет, который не требует данных или начальных параметров. Вторая декларация специфицирует MPEG-анимацию и не определяет механизм отображения, предполагая, что с этой работой справится агент пользователя. Здесь установлен атрибут type, таким образом, что в случае если агент пользователя не может отобразить MPEG, он может не копировать “theearth.mpeg” из сети. Третья декларация специфицирует позицию GIF-файла и предлагает альтернативный текст на случай, когда другие механизмы не приведут к успеху.
Отображаемая информация может извлекаться двумя путями: из текущей строки илиb из внешнего источника. Первый способ дает большее быстродействие, но требует много места.
16.1. Инициализация объекта. Элемент param.

<!element param - empty	-- именованное значение параметра -- >
<!attlist param name cdata #required	-- имя параметра --
	value cdata #implied	-- значение параметра --
	valuetype (data\|ref\|object) data	-- способ интерпретации значения --
	type cdata #implied	-- internet media type -- >

<

Определения атрибутов
name = cdata

Этот атрибут определяет имя параметра исполнения.

value = cdata
Этот атрибут специфицирует значение параметра исполнения, заданного атрибутом name. Значение этого параметра не имеет какого-либо смысла для HTML, он определяется рассматриваемым объектом.
valuetype=data|ref|object
Этот атрибут специфицирует тип значения, определенного атрибутом value. Возможны значения:

data:	значение, заданное value, после преобразования любых вложенных символов и цифровых объектов будет непосредственно передано механизму отображения в виде строки. Этот тип используется по умолчанию и может появляться в стартовой метке элемента.
ref:	значение, заданное value, является url, который определяет ресурс, где записано значение параметра исполнения. URL должно передаваться механизму отображения в не преобразованном виде.
object:	значение, заданное value, является фрагментом URL, который определяет декларацию object в том же самом документе. В этом случае определение object должно идентифицироваться его атрибутом ID.

<object declare	id=”earth_declaration”
	data=”theearth.mpeg”
	type=”application/mpeg”>
	<object src=”theearth.gif”>
	the <strong>earth</strong> as seen from space.
	</object>

</object>

…далее в документе …

click to see a neat <a href=”#earth_declaration”>

animation of the earth! </a>
Последующий пример иллюстрирует то, как можно специфицировать значения исполнительных параметров, которые являются объектами. В этом примере мы посылаем текст гипотетическому механизму его отображения. Механизм отображения распознает параметр, названный “font”. Значение этого параметра само является объектом, который управляет использованием определенного шрифта. Взаимоотношение этого объекта и механизма отображения устанавливается путем присвоения id “tribune” декларации объекта шрифта и обращением к нему из элемента param.

<object declare	id=”tribune”
	type=”application/x-webfont”
	data=”tribune.gif”>

</object>

… здесь отображается текст из файла kublakhan.txt …

<object classid=http://foo.bar.com/poem_viewer

data=”kublakhan.txt”>

<param name=”font” valuetype=”object” value=”#tribune”>

<p>you’re missing a really cool poem viewer …

</object>
Агент пользователя, который не поддерживает атрибут declare, должен пытаться отображать содержимое декларации object.

Выравнивание объектов
Атрибут align для данного элемента применять не рекомендуется, предпочтительнее использование стилевых листов.
17. Изображения. Элемент img

<!element img - o empty	-- введение изображения в текст документа -- >
<!attlist img %attrs;	-- %coreattrs, %i18n, %events --
	src %url #required	-- url вводимого рисунка --
	alt cdata #implied	-- описание для чисто текстовых броузеров --
	align %ialign #implied	-- вертикальное или горизонтальное выравнивание --
	height %pixels #implied	-- предлагаемая высота в пикселях --
	width %pixels #implied	-- предлагаемая ширина в пикселях --
	border %pixels #implied	-- предлагаемая толщина рамки в пикселях --
	hspace %pixels #implied	-- предлагаемая ширина горизонтального поля --
	vspace %pixels #implied	-- предлагаемая ширина вертикального поля --
	usemap %url #implied	-- use client-side image map --
	ismap (ismap) #implied	-- use server-side image map --

Определение атрибутов
src = URL
Этот атрибут специфицирует положение (указатель на) ресурса, содержащего изображение. Общепринятые форматы: GIF, JPG, PNG.
align = bottomiddle|top|left|right
Применение не рекомендуется. Атрибуты определяют положение изображения по отношению к окружающему тексту.
Элемент IMG вводит изображение в текущий документ в точке его описания. Но тем не менее, рекомендуется вводить рисунок в текст с помощью элемента object. Рассмотрим, как семейное фото может быть включено в документ.
<img src=”html://www.somecompany.com/people/ian/vocation/family.png”

alt=”a photo of my family at the lake.”>

Это же может быть сделано с помощью object следующим образом.
<object data=http://www.somecompany.com/people/ian/vocation/family.png

type=”image/png”>

Фото моей семьи на озере.

</object>
Атрибут alt специфицирует текст, который будет выведен в случае, когда изображение не может быть отображено по какой-либо причине.
18. Введение аплетов. Элемент applet

<!element applet - - (param | %inline) *>

<!attlist applet

	codebase %url #implied	-- опционный базовый url для аплета --
	archive cdata #implied	-- архивный список с элементами, разделенными с помощью запятых --
	code cdata #implied	-- файл класса аплета --
	object cdata #implied	-- специализированный файл аплета --
	alt cdata #implied	-- описание для чисто текстовых броузеров --
	name cdata #implied	-- позволяет аплетам найти друг друга --
	width %pixels #required	-- предлагаемая ширина в пикселях --
	height %pixels #required	-- предлагаемая высота в пикселях --
	align %ialign #implied	-- вертикальное или горизонтальное выравнивание --
	hspace %pixels #implied	-- предлагаемые горизонтальные поля --
	vspace %pixels #implied	-- предлагаемые вертикальные поля -- >

width=”500” height=”500”>

	default	специфицирует всю область.
	rect	выделяет прямоугольную область.
	circle	выделяет круговую область.
	poly	выделяет область, ограниченную многогранником.

coords = length-list
Этот атрибут специфицирует положение и форму области на экране. Число и порядок значений зависит от определенной формы. Возможны комбинации:

	rect:	левый-х, верхний-у, правый-х, нижний-у.
	circle:	х центра, у центра, радиус.
	poly:	х1, у1, х2, у2,…хn, yn.

Начало координат размещено в верхнем левом углу объекта. Значения координат выражаются в пикселях или в процентах.

Для элемента object описан также булев атрибут shapes, который определяет то, что объект является картой изображения. Ниже представлен пример с картой изображения клиента.
<object data=:navbar.gif” shapes>

<a href=”guide.html” shape=”rect” coords=”0,0,118,28”>access guide</a> |

<a href=”shotcut.html” shape=”rect” coords=”118,0,184,28”>go</a> |

<a href=”search.html” shape=”circ” coords=”184,200,60”>search</a> |

<a href=”top10.html” shape=”poly” coords=”276,0,373,28,50,50,276,0”>top ten</a>

</object>
Если элемент object содержит атрибут shapes, агент пользователя должен анализировать содержимое элемента с целью поиска якорей. Если две или более областей перекрываются, область, определенная первой, имеет приоритет.
20.2. Карты изображения клиента с map и area
Элементы map и area предоставляют альтернативный механизм для карт изображения клиента.
<!element map - - (area)*>

<!attrlist map %coreattrs;	-- id, class, style, title --
	name cdata #implied >

<!element area – o empty>

<!attrlist area

	shape %shape rect	-- контролирует интерпретацию координат --
	coords %coords #implied	-- список значений, разделенных запятыми --
	href %url #implied	-- эта область используется как гипертекстная связь --
	target cdata #implied	-- где отображать подключенный ресурс --
	nohref (nohref) #implied	-- эта область не вызывает никаких действий --
	alt cdata #implied	-- описание для исключительно текстовых броузеров --
	tabindex number #implied	-- position in tabbing order -- >

Определение атрибута

nohref

Этот булев атрибут (если =true) указывает на то, что данная область не имеет никаких связей.

Несколько элементов (object, img и input) имеют атрибут usemap = URL для спецификации карты изображения клиента описанной элементами map и area.
Рассмотрим пример, представленный выше, переписанный в терминах MAP и AREA.
<object data=:navbar1.gif” usemap=”#map></object>

<map name=”map1”>

	<area href=”guide.html”
		alt=”search”
		shape=”rect”
		coords=”184,0,276,28”>

<area href=”top10.html”

	alt=”top ten”
	shape=”poly”
	coords=”276,0,373,28,50,50,276,0”>

</map>
Атрибут alt специфицирует альтернативный текст на случай, когда карта изображения не может быть отображена. map не совместима с версией HTML 2.0.
Карты изображения сервера
Карты изображения сервера могут представлять интерес в случае, когда карта изображения слишком сложна для стороны клиента. Такая карта может быть создана с помощью элемента img. Для того чтобы сделать это, нужно установить булев атрибут ismap в описании элемента IMG. Соответствующие области должны быть описаны с помощью атрибута usemap. Когда пользователь активирует область карты изображения, соответствующие координаты посылаются непосредственно серверу, где помещен документ. Координаты на экране выражаются в пикселях. Агент пользователя берет новый URL из URL, описанного атрибутом HREF, присоединив к нему символ “?”, за которым следуют координаты х и у, разделенные запятой. Например, в предыдущем примере, если пользователь кликнет в области x=10, y=27, то будет получен URL=/cgibin/navbar.map?10,27.
В следующем примере первая активная область определяет связь со стороны клиента. Вторая - определяет связь со стороны сервера, но не определяет ее форму и размер (это осуществляется значением по умолчанию атрибута shape). Так как области этих связей перекрываются, первая имеет более высокий приоритет. Таким образом, кликнув мышкой где-либо в прямоугольной области, мы пошлем соответствующие координаты серверу.
<object data=”game.gif” shapes>

	<a href=”guide.html” shape=”rect” coords=”0,0,118,28”>
		rules of the game </a>
	<a href=http://www.acme.com/cgi-bin/competition
		ismap
		shape=”default”>
		guess the location </a>

</object>
21. Визуальное представление изображений, объектов и аплетов
Применение атрибутов элементов img и object для целей управления отображением не рекомендуется, предпочтение, как и раньше здесь отдается стилевым листам.

Атрибуты height и width дают агенту пользователя информацию о размере изображения или объекта, что позволяет зарезервировать для него место, а тем временем продолжить отображение документа. Оба атрибута могут иметь значение типа length. Агент пользователя может изменить масштаб, если это необходимо. Атрибуты vspace и hspace специфицируют размер полей вокруг изображения или объекта. Значения по умолчанию этих атрибутов не определено, оно должно быть мало, но не равно нулю.
22. Как специфицировать альтернативный текст?
Описание атрибута

alt = cdata
Для агента пользователя, который не может отображать изображения, формы или аплеты, этот атрибут позволяет ввести альтернативный текст. Язык этого текста задается атрибутом lang. Атрибут alt является обязательным для элемента area и опционным для img, applet и input.
23. Стилевые листы
Стилевые листы являются главным инструментом при разработке дизайна HTML-страниц. Они дают разработчику возможность преобразовать текст в изображение, отображать таблицы, писать программы и делать многое другое. HTML 4.0 поддерживает следующие возможности:
Гибкое размещение стилевой информации. Помещение стилевых листов в отдельные файлы упрощает их повторное использование.
Независимость от стилевых особенностей используемого языка. Данная спецификация HTML не привязывает его к какому-то определенному языку.
Каскадирование стилевых листов. Эта особенность позволяет совместно использовать стилевую информацию из нескольких источников.
Зависимость от среды. HTML позволяет описать документ независимым от среды способом, что обеспечивает доступ широкому кругу людей, работающих в различных средах (Windows, X11, Mac, мультимедиа системы и пр.). Стилевые листы позволяют адаптироваться к среде наилучшим образом, используя все предоставляемые ей возможности.
Альтернативные стили. Разработчик может предложить пользователю несколько альтернативных стилей представления данных. Например, отображение с мелкими или крупными шрифтами, с или без графических объектов и т.д.

HTML- документ может содержать стилевые рекомендации внутри, но можно их импортировать и извне. Синтаксис стилевых правил определяется языком стилевых листов CSS (Cascading Style Sheets), который не является частью HTML. Так как агент пользователя должен осуществлять разбор стилевых инструкций, пользователь обязан декларировать, какой стилевой язык он использует. Можно использовать элемент META для установки стилевого языка по умолчанию. Так для установления в качестве стилевого языка по умолчанию CSS, в head документа нужно включить следующую декларацию.
<meta http-equiv=”content-style-type” content=”text/css”>
Стилевой язык может быть задан также в http-заголовках. Например:
content-style-type: text/css
Если использовано несколько деклараций стилевого языка, работает самая последняя декларация. Если нет явной декларации стилевого языка, по умолчанию устанавливается CSS. HTML-элементы и атрибуты определяют начало стилевого листа. Конец стилевого листа определяется открытым разграничителем конечной метки, за которым следует начальный символ имени SGML [a-za-z]. Агент пользователя должен иметь соответствующий хандлер стилевого листа.
Одним из строчных стилевых атрибутов является style = Cdata. Этот атрибут специфицирует стилевую информацию для текущего элемента. Ниже приведен пример задания цвета и размера шрифта в тексте параграфа.
<p type=”text/css” style=”font-size: 12pt; color: fuschia”>aren’t style sheet wonderful?
Декларация типа имя: значение является конструкцией языка CSS. Если стиль планируется использовать повторно в нескольких элементах, более корректным будет применение элемента style, а не атрибута style, который носит одноразовый характер.
23.1. Стилевая информация заголовка. Элемент style
<!element style - - cdata -- стилевая информация --

<!attlist style

	%i18n;	-- lang, dir, для использования с title --
	type cdata #implied	-- тип содержимого internet для стилевого языка --
	media cdata #implied	-- предназначено для использования в этих средах --
	title cdata #implied	-- рекомендуемый title -- >

<

Описание атрибутов
type = cdata
Этот атрибут специфицирует язык стилевого листа (заменяет значение по умолчанию). Стилевой язык специфицируется также как и тип среды Интернет (internet media type) (т.е. “text/css”).
media cdata-list
Этот атрибут специфицирует среду для стилевой информации. Это может быть одна среда или перечень, где отдельные элементы списка разделены запятыми. Возможные типы сред:

	screen:	Вывод на экран дисплей (без многостраничной поддержки). Значение по умолчанию.
	print:	Постраничный вывод на непрозрачную бумагу. Предназначен также для вывода на экран в режиме preview.
	projection:	Вывод на проектор.
	braille:	Вывод кодов Брайля на тактильное устройство
	speach:	Вывод на речевой синтезатор.
	all:	Вывод на все устройства сразу.

Элемент style позволяет разработчику установить стилевые правила в заголовке документа. HTML допускает любое число элементов style в секции head документа. Агент пользователя, который не поддерживает стилевые листы или специфический стилевой язык, используемый элементом style, должен прятать содержимое элемента style. Управление средой особенно интересно, когда применяются внешние стилевые листы, так как агент пользователя может сэкономить время, копируя через сеть только те стилевые листы, которые используются на данном устройстве вывода.
Следующая декларация CSS style устанавливает рамку вокруг каждого Н1 элемента в документе и центрирует ее на странице.
<head>

<style type=”text/css”>

		h1 {border-width: 1; border: solid; text-align: center}
	</style>

</head>
Для спецификации того, что этот стиль информации должен применяться только для Н1-элементов определенного класса, модифицируем эту запись следующим образом.
<head>

<style type=”text/css”>

		h1.myclass {border-width: 1; border: solid; text-align: center}
	</style>

</head>

<body>

	<h1 class=”myclass”> this H1 is affected by our style </h1>
	<h1 this one is not affected by our style </h1>

<

</body>
И наконец, для того чтобы ограничить зону действия стилевой информации одним случаем Н1, установим атрибут ID.
<head>

	<style type=”text/css”>
		h1.myid {border-width: 1; border: solid; text-align: center}
	</style>

</head>

<body>

	<H1 class=”myclass”> this H1 is not affected </h1>
	<H1 this one is affected by style </H1>
	<H1> this h1 is not affected </H1>

</body>
В следующем примере использован элемент span для определения шрифтового стиля первых нескольких слов.
<head>

	<style type=”text/css”>
		span.sc-ex { font-variant: small-caps }
	</style>

</head>

<body>

	<p><span id=”sc-ex”> the first</span> few words of
		this paragraph are in small-caps

</body>
В следующем примере используется div и атрибут class для выравнивания последовательности параграфов. Эта стилевая информация может быть использована повторно, например, для форматирования резюме научных статей путем установки атрибута class в соответствующем месте документа.
<head>

	<style type=”text/css”>
		div.abstact {text-align: justify }
	</style>

</head>

<body>

	<div class=”abstract”>
	<p>the chieftain product range is our market winner for the coming year.
	this report sets out how to position chieftain against competing products.
	<p>chieftain replaces the commander range, which will remain on the
	price list until further notice.

</div>

</body>
23.2. Типы среды
HTML позволяет разработчику конструировать документы, структура которых не зависит от специфических свойств среды. В результате пользователь может просматривать этот документ с использованием самых разных агентов пользователя: на персональной ЭВМ, рабочей станции, Х-терминале, специально приспособленном телефонном аппарате и т.д..
Атрибут media специфицирует среду вывода для формирования стилевых правил.

Установив атрибут media, разработчик может позволить агенту пользователя избежать копирования через сеть стилевых листов, не используемых в данном документе. Ниже предлагается пример деклараций для элемента Н1. При отображении на экране текст будет голубым и выровненным по центру, при печати текст будет выровнен по центру. Предусмотрена возможность вывода и на речевой синтезатор.
<head>

	<style type=”text/css” media=”screen”>
		h1 { color: blue }
	</style>

type=”text/css” media=”screen”>

type=”text/css” media=”print”>

type=”text/css” media=”speach”>

</head>
23.3. Внешние стилевые листы
Стилевые листы могут быть определены отдельно от документа. Это позволяет использовать такие стилевые листы во многих документах. Кроме того, стиль может быть изменен без модификации самого документа. Любой стиль обычно представляет собой иерархию стилевых листов. Некоторые из них используются вне зависимости от выбора пользователя. Для выбора внешних стилевых листов используется элемент Link. При этом необходимо установить следующие атрибуты:

href	для определения места размещения внешнего стилевого файла (href=url).
rel	определяет, является ли данный стилевой лист постоянным (rel=”stylesheet”), стилевым листом по умолчанию (rel=”stylesheet”) или листом по выбору (rel=”alternate stylesheet”).
title	устанавливает заголовок в случае, когда стилевой лист является листом по умолчанию (активируется и деактивируется пользователем).

p.special { color: rgb(230, 100, 180) }

none	следующая строка будет отображена как обычно (значение по умолчанию).
left	следующая строка будет помещена ниже плавающего объекта на левом поле.
right	следующая строка будет помещена ниже плавающего объекта на правом поле.
all	следующая строка будет помещена ниже плавающего объекта на любом из доступных полей.

Рассмотрим вариант, когда текст размещается справа от изображения, и посмотрим, что будет после прерывания строки с помощью BR.

Если атрибут clear=”none”, следующая строка начнется сразу под уже имеющимся текстом.

Если же clear = “left” или all, то мы получим:
Используя стилевые листы, мы можем потребовать, чтобы все разрывы строк обрабатывались аналогичным образом. Для реализации этого можно записать:
<style type=”text/css”>

br { clear: left }

</style>
Для того чтобы такая схема размещения текста сработала только раз, следует воспользоваться атрибутом ID.
<head>

…….

<style type=”text/css”>

br.mybr }clear: left}

</style>

</head>

<body>

…….

……..

</body>
23.7. Элементы управления шрифтами: tt, i, b, big, small, strike, s и u
<!entity % font

“tt | i | b | u | s | strike | big | small “>

<!element (%font|%phrase) - - (%inline)*>

<!attlist (%font|%phrase) %attrs; -- %coreattrs, %i18n, %events -- >

tt:	соответствует шрифту телетайпа (символы равной ширины).
i:	курсив
b:	полужирный шрифт.
big:	шрифт с крупными буквами.
small:	мелкий шрифт.
strike:	перечеркнутый шрифт (к использованию не рекомендуется)
u:	подчеркнутый шрифт (к использованию не рекомендуется)

<

Ниже приведены примеры управления шрифтами.
<b>bold</b>

<i>italic</i>, <b><i>bold italic</i></b>, <tt>teletype text</tt>

<big>big</big> <small> small </small> text.
Броузер отобразит при этом на экране:
bold, italic, bold italic, teletype text, big, small text.
Использование стилевых листов позволяет получить значительно большее многообразие шрифтов. Например, нижеприведенный текст даст распечатку голубым курсивом:
<head>

<style>

p.mypar {font-style: italic; color: blue}

</style>

</head>
<p id=”mypar”> … далее следует текст, печатаемый голубыми буквами курсивом.
23.8. Элементы модификаторов шрифтов: font и basefont
<!element font - - (%inline)* -- локальное изменение шрифта -->

<!attlist font

	size cdata #implied	-- [+]nn напр. size=”+1”, size=4 --
	color cdata #implied	-- #rgbgbb in hex, напр. red: “#ff0000” --
	face cdata #implied	-- список имен шрифтов, разделенных запятыми -- >

<!element basefont - o empty>

<!attlist basefont

	size cdata #required	-- базовый размер шрифта для элементов font --
	color cdata #implied	-- #rgbgbb in hex, напр. red: “#ff0000” --
	face cdata #implied	-- список имен шрифтов, разделенных запятыми -- >

С этими элементами могут использоваться атрибуты (все они не рекомендуются к использованию):
size = cdata
Атрибут определяет размер шрифта (1-7).
color = color
Атрибут определяет цвет шрифта.
face = cdata-list
Атрибут определяет список шрифтов, которые агент пользователя должен рассматривать в порядке приоритета.
Элемент font изменяет размер и цвет шрифта для текста, в нем содержащегося. Элемент basefont устанавливает базовый размер шрифта (с помощью атрибута size). Размер шрифта, заданного font является относительным по отношению к размеру, определенному basefont. Если basefont не задан, значением по умолчанию считается 4. Ниже приведены примеры задания шрифтов с помощью font (данная форма определения размера шрифта не рекомендуется).

<p> <font size=1> size=1</font>

<font size=2> size=2</font>

<font size=3> size=3</font>

<font size=4> size=4</font>

<font size=5> size=5</font>

<font size=6> size=6</font>

<font size=7> size=7</font>
Агент пользователя при этом отобразит следующее
size=1 size=2 size=3 size=4 size=5 size=6 size=7
23.9. Элемент hr
<!element hr - o empty>

<!attlist hr %coreattrs;	-- id, class, style, title --
	%events;
	align (left\|right\|center) #implied
	() #implied
	size %pixels #implied
	width %length #implied >

Определение атрибутов

Этот булев атрибут требует, чтобы агент пользователя пользовался одноцветным способом отображения линии.
size = length
(Не рекомендуется) Этот атрибут определяет высоту линии.
width = length
(Не рекомендуется) Этот атрибут определяет ширину линии (по умолчанию 100%), то есть линия пресекает весь экран.
Пример использования элемента hr.
<hr width=”50%” align=”center”>

<hr size=”5” width=”50%” align=”center”>

<hr size=”5” width=”50%” align=”center”>
24. Рамки (frames)
Обычный документ имеет одну секцию заголовка и одну секцию тела документа. Документ с рамками имеет заголовок (head), frameset (набор рамок) и, опционно, тело документа. Секция frameset специфицирует раскладку объектов в основном окне агента пользователя. Секция body предлагает альтернативу для случая агентов пользователя, которые не поддерживают frameset.
24.1. Элемент frameset
<!element frameset - - ((frameset|frame) + & noframes?)>

<!attlist frameset

	-- абсолютные значения в пикселях, проценты или относительные значения --
	rows cdata #implied	-- если не задано, по умолчанию rows=1 --
	cols cdata #implied	-- если не задано, по умолчанию cols=1 --
	onload %script #implied	-- все рамки загружены --
	onunload %script #implied	-- все рамки удалены -- >

Определения атрибутов

rows = length-list
Этот атрибут специфицирует выкладку горизонтальных рамок. Значение представляет собой список длин, разделенных запятыми. Если атрибут не задан, значение по умолчанию равно 100%.
cols = length-list
Этот атрибут специфицирует выкладку вертикальных рамок. Значение представляет собой список длин, разделенных запятыми. Если атрибут не задан, значение по умолчанию равно 100%.
Все рамки предполагаются прямоугольными. Установка атрибута rows определяет число рамок по горизонтали, а атрибут cols задает число рамок по вертикали. Таким образом, задается сетка рамок. Если атрибут rows не задан, каждая колонка занимает всю длину страницы. Если атрибут cols не задан, каждый ряд занимает всю ширину страницы. Если не заданы оба атрибута, на странице присутствует одна рамка, занимающая всю страницу.
Размер может задаваться в пикселях (абсолютно), в процентах от размеров экрана или в относительных длинах в форме i*, где i – целое число. Когда заданы оба атрибута, агент пользователя сначала выделяет размеры, заданные абсолютно, затем оставшуюся часть делит в соответствии с определенными долями. Значение * эквивалентно 1*. Отображение страницы осуществляется слева направо и сверху вниз. Пример (экран делится на две равные части, верхнюю и нижнюю):
<frameset rows=”50%, 50%”>

… остальная часть определения …

</frameset>
В следующем примере создается три колонки: вторая имеет фиксированную ширину в 250 пикселей (что удобно для картинки известного размера). Первая получает 25% оставшегося пространства, а третья – 75%.
<frameset cols=”1*,250,3*”>

… остальная часть определения …

</frameset>
В следующем примере создается решетка 2х3
<frameset rows=”30%,70%” cols=”33%,34%,33%”>

… остальная часть определения …

</frameset>
В следующем примере предполагается, что высота окна равна 1000 пикселей. Для первой рамки выделяется 30% общей высоты (300 пикселей). Для второй рамки выделено точно 400 пикселей. Это оставляет 300 пикселей на две оставшиеся рамки.

Высота четвертой рамки определена как “2*”, а третей - *, следовательно, третья получит 100, а четвертая – 200 пикселей.
<frameset rows=”30%,400,*,2*” >

… остальная часть определения …

</frameset>
Если при задании абсолютных размеров остается свободное место, или возникает перерасход пространства, агент пользователя пропорционально увеличит или уменьшит размеры рамок. frameset могут вкладываться друг в друга на любом уровне. В приведенном примере внешний frameset делит имеющееся пространство на три равные колонки. Внутренний frameset делит вторую область на два ряда не равной высоты.
<frameset rows=”33%,33%,34%” >

…содержимое первой рамки…

	<frameset rows=”40%,50%” >
	…содержимое второй рамки первого ряда…
	…содержимое второй рамки второго ряда…
	</frameset>
	…содержимое третей рамки…

</frameset>
24.2. Элемент frame
<!element frame - o empty>

<!attlist frame

	name cdata #implied	-- имя рамки --
	src %url #implied	-- источник содержимого рамки --
	frameborder (1\|0) 1	-- request frame border? --
	marginwidth %pixels #implied	-- ширина полей в пикселях --
	marginheight %pixels #implied	-- высота полей в пикселях --
	noresize (noresize) #implied	-- позволить пользователям изменять размеры рамок? --
	scrolling (yes/no/auto) auto	-- делать полосу прокрутки или нет? -- >

Определения атрибутов
name = cdata
Атрибут присваивает имя текущей рамке. К этому имени можно адресоваться.
src = url
Этот атрибут специфицирует положение исходного документа, содержимое которого заключено в рамку.
noresize
Этот булев атрибут говорит агенту пользователя, что размер окна рамки не может быть изменен.
scrolling = auto|yes|no
Этот атрибут специфицирует информацию о возможности прокрутки информации в данной рамке. Возможные значения:

	auto:	говорит агенту пользователя, что он может организовывать скроллинг по своему усмотрению (значение по умолчанию)
	yes:	говорит агенту пользователя, что он должен обеспечить скроллинг информации в окне.
	no:	говорит агенту пользователя, что скроллинг делать не нужно.

<

frameborder=1|0
Этот атрибут предоставляет агенту пользователя информацию о рамке вокруг текущего окошка. 1 означает, что агент пользователя должен прочертить границу вокруг текущей рамки (значение по умолчанию). 0 означает, что агент пользователя не должен прочерчивать границу вокруг текущей рамки.
marginwidth = length
Этот атрибут специфицирует правое и левое поля между текстом и границей рамки. Значение должно быть больше одного пикселя. Значение по умолчанию определяет агент пользователя.
marginheight = length
Этот атрибут специфицирует размер верхнего и нижнего поля между текстом и границей рамки. Значение должно быть больше одного пикселя. Значение по умолчанию определяет агент пользователя.
Атрибут SRC определяет источник текста, помещаемого в рамку. Содержимое рамки не может быть записано в том же документе, в котором описана сама рамка. Пример:
<html>

<frameset cols=”33%, 33%, 33%”>

	<frameset rows=”*,200”>
		<frame src=”contents_of_frame1.html”>
		<frame src=”contents_of_frame2.gif”>
	</frameset>
	<frame> src=”contents_of_frame3.html”>
	<frame> src=”contents_of_frame4.html”>

</frameset>

</html>
В результате будет получена раскладка рамок, показанная ниже не рисунке.
Ниже приведенный пример содержит в себе ошибку, так как текст второй рамки включен в описание самой рамки.
<html>

<frameset cols=”50%,50%”>

	<frame src=”contents_of_frame1.html”>
	<frame src=”#anchor_in_same_document”>

</frameset>

<body>

… некоторый текст…

<h2><a name=”anchor_in_same_document”>important section</a></h2>

… некоторый текст…

</body>

</html>
Существует атрибут target = cdata, который специфицирует имя рамки, где должна быть размещена информация. Путем присвоения с помощью атрибута name имени рамке разработчик может ссылаться на нее, как на адрес связей. Атрибут target может быть установлен для элементов, создающих связи (А, link), карты изображения (area) и формы (form).

Ниже предлагается пример, где target позволяет динамически изменять содержимое рамки:
<html>

<frameset rows=”50%,50%”>

	<frame name=”fixed” src=”init_fixed.html”>
	<frame name=”dynamic” src=”init_dynamic.html”>

</frameset>

</html>
Затем в init_dynamic.html мы организуем связь с рамкой под именем “dynamic”
<html>

<body >

… начало документа …

now you may advance to

<a href=”slide2.html” target=”dynamic”>slide 2.</a>

… продолжение документа …

you’re doing great. now on to

<a href=”slide3.html” target=”dynamic”>slide 3.</a>

</body>

</html>
Активирование любой связи приводит к открытию документа в рамке с именем “dynamic”, в то время как другие рамки (“fixed”) остаются со своим исходным содержимым.
24.3. Установка для связей адресов по умолчания
Когда многие связи в документе указывают на один и тот же адрес, имеется возможность специфицировать адрес только один раз, а ссылки обеспечить путем введения атрибута target в нужные элементы. Это делается путем установки атрибута target элемента base. Рассмотрим предыдущий пример с этой точки зрения.
<html>

<head>

<base target=”dynamic”>

</head>

<body>

… начало документа …
now you may advance to <a href=”slide2.html”>slide 2.</a>

… продолжение документа …

you’re doing great. now on to

<a href=”slide3.html”>slide 3.</a>

</head>

</html>
Существует несколько методов сделать рамку адресом связи.
Если элемент имеет атрибут target, указывающий на известную рамку, тогда при активации элемента, документ связанный с этим элементом, будет загружен в данную рамку.
Если элемент не имеет атрибута target и имеет элемент base, тогда именно base определяет рамку, куда будет произведена загрузка.
Если элемент и base не имеют атрибута target, документ, соответствующий элементу, будет загружен в рамку, содержащую этот элемент.
Если любой адрес (target) указывает на рамку f, агент пользователя создаст новое окно и рамку, припишет имя f этой рамке и загрузит документ, соответствующий элементу, в эту новую рамку.

Имя рамки должно начинаться с буквы (a-za-z). Агент пользователя должен игнорировать любые другие имена. Существует несколько имен, зарезервированных для специальных целей.

_blank	агент пользователя должен загрузить документ в новую безымянную рамку.
_self	агент пользователя должен загрузить документ в ту же рамку, что и элемент, который ссылается на этот адрес (target).
_parent	агент пользователя должен загрузить документ в frameset, породивший текущую рамку. Это значение эквивалентно _self, если текущая рамка не имеет прародителя.
_top	агент пользователя должен загрузить документ в полное исходное окно. Значение эквивалентно _self, если текущее окно не имеет прародителя.

Агенты пользователя, которые не поддерживают рамки, должны отображать секцию body, которая следует за самым внешним frameset документа. Агенты пользователя, которые поддерживают рамки, должны игнорировать эту секцию body.
24.4. Элемент noframes
<!element noframes - - (#pcdata, ((body,#pcdata)|

(((%blocklevel)|%font|%phrase|%special|%formctrl),%block)))>

Элемент noframes специфицирует содержимое, которое должно быть отображено, только когда не отображаются рамки. Агенты пользователя могут отображать содержимое только в случае, когда они сконфигурированы с блокировкой поддержки рамок.
Предположим, что имеется frameset, определенный в “top.html”, который отображает документ “main.html”, и оглавление этого документа (“table_of_contents.html”). Тогда содержимое “top.html”:
<html>

<frameset cols=”50%,50%”>

	<frame src=”main.html”>
	<frame src=”table_of_contents.html”>

</frameset>

</html>
Когда пользователь читает “top.html”, а агент пользователя не поддерживает работу с рамками, на экране ничего не появится, если в секции body (“top.html”) нет альтернативного текста. Если мы введем ”table_of_contents.html” и ”main.html” непосредственно в body, задача ассоциации документов будет решена. Но при этом мы можем заставить агента пользователя, который поддерживает рамки, скопировать один и тот же документ дважды.

Более экономно включить оглавление в начало ”main.html”, в элемент noframes:
<html>

<body>

<noframes>

… оглавление …

</noframes>

… остальная часть документа …

</body>

</html>
Элемент noframes может использоваться в frameset-секции документа. Например:
<!doctype html public "-//w3c//dtd HTML 4.0 frameset//en"

"http://www.w3.org/tr/rec-html40">

<html>

<head>

<title>a frameset document with noframes</title>

</head>

<frameset cols="50%, 50%">

<frame src="main.html">

<frame src="table_of_contents.html">

<noframes>

<p>here is the <a href="main-noframes.html">

версия документа non-frame.</a>

</noframes>

</frameset>

</html>
24.5. Элемент iframe

<!element iframe - - (%flow;)*

-- субокно в блоке текста -->

<!attlist iframe

	%coreattrs;	-- id, class, style, title --
	longdesc %uri; #implied	-- указатель на более длинное описание (дополнение к title) --
	name cdata #implied	-- имя файла для адресации --
	src %uri; #implied	-- источник содержимого рамки --
	frameborder (1\|0) 1	-- request frame borders? --
	marginwidth %pixels; #implied	-- ширина поля в пикселях --
	marginheight %pixels; #implied	-- высота поля в пикселях --
	scrolling (yes\|no\|auto) auto	-- наличие поля прокрутки --
	align %ialign; #implied	-- вертикальное и горизонтальное выравнивание --
	height %length; #implied	-- высота рамки --
	width %length; #implied	-- ширина рамки -- >

Описание атрибутов
longdesc = uri
Этот атрибут специфицирует связь с длинным описанием рамки. Это описание должно быть дополнением короткого описания, данного в атрибуте title.
name = cdata
Этот атрибут присваивает имя текущей рамке. Это имя может использоваться в последующих ссылках.
width = length
Ширина рамки.
height = length
Высота рамки.
Элемент Iframe позволяет разработчику ввести рамку в блок текста.

Эта процедура схожа с введением одного HTML-документа в другой с помощью элемента object. Информация, которая должна быть введена, определяется атрибутом src этого элемента. Содержимое элемента Iframe отображается только агентами пользователя, которые не поддерживают рамки. Пример, когда рамка вводится внутрь текста, приведен ниже.
<iframe src="foo.html" width="400" height="500"

scrolling="auto" frameborder="1">

[Ваш агент пользователя не поддерживает рамки или сконфигурирован без поддержки рамок]. Кликните для извлечения <a href="foo.html"> сопряженного документа. </a>]

</iframe>
Размеры этих рамок не могут быть изменены.
25. Формы
HTML-форма представляет собой часть документа, содержащая обычный текст, разметку (markup) и специальные элементы управления, называемые controls. controls служат для приема и обработки текста, вводимого пользователем. Форма – это аналог стандартного бланка, заполняемого пользователем. Заполненная форма может быть послана по почте другому пользователю, или передана программе для последующей обработки. Каждый control (графа бланка) должен иметь имя, а его значение определяется его типом. Ниже приведен пример формы, где используются метки и различного типа кнопки:
<form action="http://somesite.com/prog/adduser" method="post">

<p>

<label for="firstname">first name: </label>

<input type="text" id="firstname"><br>

<label for="lastname">last name: </label>

<input type="text" id="lastname"><br>

<label for="email">email: </label>

<input type="text" id="email"><br>

<input type="radio" name="sex" value="male"> male<br>

<input type="radio" name="sex" value="female"> female<br>

<input type="submit" value="send"> <input type="reset">

</p>

</form>
Каждый control имеет исходное и текущее значение, каждое из которых представляет собой символьную строку. Исходное значение может быть определено с помощью соответствующего атрибута.
Кнопки
Разработчики могут создавать три типа кнопок:
submit-кнопки. При активации эти кнопки преадресуют форму адресату. Форма может содержать более одной submit-кнопки.
Кнопки сброса: При активации эти кнопки возвращают все controls в исходное состояние.
Кнопки нажатия. Эти кнопки не имеют какого-либо фиксированного назначения. Каждой такой кнопке может быть поставлен в соответствие, например, скрипт клиента.
Разработчик создает кнопку с помощью элемента button или input. Следует иметь в виду, что элемент button предоставляет более широкие возможности, чем input.
Переключатели
Переключатели (chekbox; и радио-кнопки) представляют собой двухпозиционные приборы, которые могут находиться в состоянии on/off (вкл/выкл). Пользователь может переводить этот переключатель из одного состояния в другое. Переключатель находится в состоянии "on", когда установлен соответствующий атрибут управляющего элемента.
Несколько переключателей могут относиться к одному и тому же control, позволяя, например, выбрать одно из нескольких значений определенного параметра. Для формирования переключателя используется элемент input.
Радио-кнопки
Радио-кнопки схожи с переключателями. Но здесь при наличии нескольких кнопок, относящихся к одному имени control, перевод одной кнопки в состояние "on" переводит все другие кнопки с тем же именем в состояние "off". Для создания радио-кнопок используется элемент input.
Меню
Меню предоставляет пользователю выбор из нескольких возможностей. Для формирования меню используется элемент select, в сочетании с элементами optgroup и option.
Ввод текста
Разработчик может создать два типа controls, которые позволяют вводить текст.

Элемент input создает однострочный control для ввода, а textarea предназначен для многострочного ввода. В обоих случаях введенный текст становится текущим значением control.

Выбор файла
Этот тип control позволяет пользователю выбрать файлы, так что их содержимое будет введено в форму. Для обеспечения выбора файла используется элемент input.
Скрытые элементы управления control
Разработчик может создать control, которые не отображаются на экране, но величины которых заносятся в форму. Для формирования скрытого control используется элемент input.
Объектные control
Разработчик может ввести в форму общие объекты, так что соответствующие величины будут заноситься в форму. Для работы с объектными control используется элемент object.
Элементы, используемые для создания controls, обычно вводятся в элемент FORM, но могут появляться и вне декларации FORM, когда они используются для построения интерфейса пользователя.

25.1. Элемент FORM

<!element form - - (%block;\|script)+ -(form)	-- интерактивная форма -->
<!attlist form %attrs;	-- %coreattrs, %i18n, %events --
	action %uri; #required	-- хандлер форм со стороны сервера --
	method (get\|post) get	-- http метод для ввода форм --
	enctype %contenttype; "application/x-www-form-urlencoded"
	onsubmit %script; #implied	-- форма введена --
	onreset %script; #implied	-- форма возвращена в исходное состояние --
	accept-charset %charsets; #implied	-- список поддерживаемых символьных наборов -->

Определение атрибутов
action = url
Этот атрибут специфицирует агента, который осуществляет обработку формы. Например, возможным значением атрибута может быть HTTP URI (для передачи формы программе) или mailto URI (для пересылки формы по электронной почте).
method = get|post
Этот атрибут специфицирует http-метод, который будет использоваться для представления данных. Возможные значения: "get" (по умолчанию) и "post". Метод post вводит пары имя/значение в тело формы.

enctype = content-type
Этот атрибут специфицирует тип содержимого (internet media type), используемого при передаче формы серверу (когда метод = "post"). Значение по умолчанию атрибута равно "application/x-www-form-urlencoded". Значение "multipart/form-data" должно использоваться в сочетании с type="file” элемента input.
accept-charset = charset list
Этот атрибут специфицирует список кодировок символов для входных данных, которые должны быть приняты сервером, обрабатывающим эти формы. Значения атрибута представляют собой список значений символьных комбинаций, разделенных пробелами или запятыми. Сервер должен интерпретировать этот список и воспринимать любой односимвольный код. Значение этого атрибута по умолчанию равно "unknown". Агент пользователя может интерпретировать это значение как символьную комбинацию, которая была использована для передачи документа, содержащего этот элемент form.
accept = content-type-list
Этот атрибут специфицирует список типов содержимого (в качестве разделителей используются занятые), которые сможет корректно воспринять и обработать сервер форм.
Элемент form работает как контейнер для controls. Он специфицирует:
Выкладку формы (заданную содержимым элемента).
Программу, которая будет обрабатывать заполненную форму (атрибут action). Принимающая программа должна быть способна разобрать пары имя/значение, для того чтобы использовать их.
Метод, посредством которого данные пользователя будут посланы серверу (атрибут method).
Кодировку символов, которая должна быть воспринята сервером, для того чтобы успешно произвести последующую обработку полученной формы (атрибут accept-charset). Агенты пользователя могут подсказать пользователю значения атрибута accept-charset и/или ограничить возможность ввода неузнаваемых символов.
Ниже приведен пример, который показывает форму, которая должна быть обработана программой "adduser". Форма посылается программе с помощью метода http "post”.

<form action="http://somesite.com/prog/adduser" method="post">

...form contents...

</form>
Следующий пример показывает, как послать форму по заданному электронному адресу:
<form action="mailto:kligor.t@gee.whiz.com" method="post">

...содержимое формы...

</form>

25.2. Элемент input
<!entity % inputtype

"(text | password | checkbox | radio | submit | reset |

file | hidden | image | button)" >

<!element input - o empty	-- управление формой -->
<!attlist input %attrs;	-- %coreattrs, %i18n, %events --
type %inputtype; text	-- what kind of widget is needed --
name cdata #implied	-- представить как часть формы --
value cdata #implied	-- необходимо для радио-кнопок и переключателей --
checked (checked) #implied	-- для радио-кнопок и переключателей --
disabled (disabled) #implied	-- не доступно в данном контексте --
readonly (readonly) #implied	-- для текста и пароля --
size cdata #implied	-- разный для каждого типа полей --
maxlength number #implied	-- макс. число символов для текст. полей --
src %uri; #implied	-- для полей с изображением --
alt cdata #implied	-- краткое описание --
usemap %uri; #implied	-- использование карты изображения клиента --
tabindex number #implied	-- position in tabbing order --
accesskey %character; #implied	-- клавиша доступа --
onfocus %script; #implied	-- элемент выделен --
onblur %script; #implied	-- элемент не выделен --
onselect %script; #implied	-- некоторый текст был выбран --
onchange %script; #implied	-- значение элемента изменилось --
accept %contenttypes; #implied	-- list of mime types for file upload -->

Определение атрибутов

type = text|password|checkbox|radio|submit|reset|file|hidden|image|button
Этот атрибут специфицирует тип создаваемого control. Значение по умолчанию "text".

name = cdata
Этот атрибут присваивает имя control.

value = cdata
Этот атрибут специфицирует начальное значение control.

size = cdata
Этот атрибут сообщает агенту пользователя исходную ширину control. Ширина задается в пикселях, за исключением случая, когда тип атрибута "text" или "password". В этом варианте ширина измеряется числом символов.
maxlength = number
Когда тип атрибута "text" или "password", этот атрибут специфицирует максимальное число символов, которое предлагается ввести пользователю. Это число может превзойти указанный размер, тогда агент пользователя должен предложить механизм скроллинга.
checked.
Когда тип атрибута "radio" или "checkbox", этот булев атрибут указывает, что кнопка нажата. Агент пользователя должен игнорировать этот атрибут для всех других видов control.
src = url
Когда тип атрибута "image", этот атрибут специфицирует положение изображения, которое будет использовано для украшения кнопки.
Атрибут type элемента input определяет то, какой управляющий элемент создан.

text	Этот тип создает текстовый бокс на одну строчку. Значение текстового control равно введенному тексту.
password	Подобен типу “text”, но отображение ввода делается так, что вводимые символы не видны (напр. каждому введенному символу ставится в соответствие *). Значение данного типа control равно введенному тексту. Служит для ввода паролей.
checkbox	Представляет собой двух позиционный переключатель (вкл/выкл=on/off). Когда переключатель в положении on, значение checkbox = “active”. Состояние переключателя передается только в случае, когда переключатель в состоянии on.

Нижеследующий фрагмент HTML представляет собой пример простой формы, которая позволяет пользователю ввести свою фамилию имя, электронный адрес и т.д.
<form action="http://somesite.com/prog/adduser" method="post">

<p>

first name: <input type="text" name="firstname"><br>

last name: <input type="text" name="lastname"><br>

email: <input type="text" name="email"><br>

<input type="radio" name="sex" value="male"> male<br>

<input type="radio" name="sex" value="female"> female<br>

<input type="submit" value="send"> <input type="reset">

</p>

</form>

radio	также является двухпозиционным переключателем. Единственным отличием от checkbox является то, что при наличии нескольких радио-кнопок с идентичным именем в состоянии on может быть всегда только одна.
submit	формирует кнопку submit. При активации этой кнопки пользователем, форма передается по адресу, указанному атрибутом action элемента form. Форма может содержать несколько таких кнопок.
image	Создает графический образ кнопки submit. Значение атрибута src специфицирует URL изображения кнопки. Рекомендуется воспользоваться атрибутом alt, чтобы создать альтернативный текст для агентов пользователя, не поддерживающих графику. Если кнопка активизирована, форма передается серверу-адресату. Передаваемые данные содержат значения name.x=x и name.y=y, где “name” – значение атрибута name, х – число пикселей от левого края изображения, а у – число пикселей от верхней кромки изображения. Это позволяет варьировать реакцию сервера от координат места, где была нажата кнопка мышки.
reset	Создает кнопку сброса. При нажатии этой кнопки пользователем всем controls формы присваиваются исходные значения, заданные атрибутом value. Пара имя/значение кнопки reset вместе с формой не пересылается.
button	Создает кнопку, которая не имеет заранее определенной функции. Эта функция определяется скриптом клиента, который запускается при нажатии этой кнопки. Например, создадим кнопку, которая вызывает функцию verify:
	<input type=”button” value=”click me” onclick=”verify()”>
hidden	Создает элемент, не видимый при работе агента пользователя. Однако, имя и значение элемента передаются серверу вместе с формой. Эта форма controls используется для запоминания информации в паузах между обменами клиент/сервер. Следующий control типа hidden, тем не менее, должен передавать свое значение вместе с формой.
	<input type=”password” style=”display:none”
		name=”invisible-password”
		value=”mypassword”>
file	Позволяет пользователю присоединить содержимое файла к форме.

Следующий пример представляет собой анкету, предложенную выше, дополненную кнопками submit и reset. Кнопки содержат изображения, для чего использован элемент img.
<form action="http://somesite.com/prog/adduser" method="post">

<p>

first name: <input type="text" name="firstname"><br>

last name: <input type="text" name="lastname"><br>

email: <input type="text" name="email"><br>

<input type="radio" name="sex" value="male"> male<br>

<input type="radio" name="sex" value="female"> female<br>

<button name="submit" value="submit" type="submit">

send<img src="/icons/wow.gif" alt="wow"></button>

<button name="reset" type="reset">

reset<img src="/icons/oops.gif" alt="oops"></button>

</p>

</form>
Внешне данная форма будет выглядеть для пользователя следующим образом:

25.3. Элемент isindex
<!element isindex - o empty>

<!attlist isindex

	%coreattrs;	-- id, class, style, title --
	%i18n;	-- lang, dir --
	prompt cdata @implied	-- сообщение-приглашение (prompt) -->

Элемент использовать не рекомендуется, вместо него лучше применять элемент input.
Описание атрибута

prompt = cdata
Атрибут специфицирует строку приглашения для ввода. Служит для ввода одной строки пользователем. Например:
<isindex prompt=”enter your name: “>
Та же задача решается с использованием элемента input следующим образом (рекомендуемый вариант):
<form action=”…” method=”post”>

enter your name: <input type=”text”>

</form>
25.4. Элемент button
<!element button - - (%flow;)* -(a|%formctrl;|form|fieldset) -- клавиша -->

<!attlist button

	%attrs	-- %coreattrs, %i18n, %events --
	name cdata #implied
	value cdata #implied	-- при представлении посылать серверу --
	type (button\|submit\|reset) submit	-- для использования в качестве кнопки --
	disabled (disabled) #implied	-- в данном контексте недоступно --
	tabindex number #implied	-- position in tabbing order --
	accesskey %character; #implied	-- клавиша доступа --
	onfocus %script; #implied	-- элемент выделен --
	onblur %script; #implied	-- элемент не выделен -- >

<

Описание атрибутов
name = cdata
Этот атрибут присваивает имя кнопке.

value = cdata
Этот атрибут присваивает значение кнопке.

type = button | submit | reset
Этот атрибут декларирует тип кнопки. Когда атрибут не задан, поведение кнопки не определено. Возможные значения:

	button:	Создает простую кнопку, которая может запускать скрипт.
	submit:	Создает кнопку, которая служит для отправки формы серверу (значение по умолчанию).
	reset:	Создает кнопку сброса для формы.

Элемент button с типом “submit”, содержащий изображение (т.е. элемент img), очень похож на элемент input с типом “image”. Но их поведение на фазе отображения различно. В этом контексте элемент input предполагает плоское изображение, а button – объемное (кнопка нажимается и отбрасывает тень). Ниже приведен пример использования элементов input и button:
<form action="http://somesite.com/prog/adduser" method="post"><p>

first name: <input type="text" name="firstname"><br>

last name: <input type="text" name="lastname"><br>

email: <input type="text" name="email"><br>

<input type="radio" name="sex" value="male"> male<br>

<input type="radio" name="sex" value="female"> female<br>

<button name="submit" value="submit" type="submit">

send<img src="/icons/wow.gif" alt="wow"></button>

<button name="reset" type="reset">

reset<img src="/icons/oops.gif" alt="oops"></button>

</p>

</form>
Если используется button с элементом img, рекомендуется применение img-элемента с атрибутом alt, чтобы обеспечить совместимость с агентами пользователя, не поддерживающими графику. Недопустимо использование карты изображения с img в элементе button:
<button>

<img src=”foo.gif” usemap=”…”>

</button>
Элемент button с типом “reset” очень похож на элемент input с типом “reset”.
25.5. Элемент select
<!element select - - (optgroup|option)+ -- селектор опции -->

<!attlist select

	%attrs;	-- %coreattrs, %i18n, %events --
	name cdata #implied	-- имя поля --
	size number #implied	-- rows visible --
	multiple (multiple) #implied	-- по умолчанию один выбор --
	disabled (disabled) #implied	-- недоступно в данном контексте --
	tabindex number #implied	-- position in tabbing order --
	onfocus %script; #implied	-- элемент выделен --
	onblur %script; #implied	-- элемент не выделен --
	onchange %script; #implied	-- значение элемента изменено -->

Определение атрибутов
name = cdataЭтот атрибут присваивает имя control.

size = number
Если элемент select представлен в виде окна с полосой прокрутки, этот атрибут специфицирует число рядов в списке, которые должны быть видны одновременно. Визуальный агент пользователя не должен представлять элемент select в качестве окна; он может использовать и другой механизм, например, выпадающее меню.
multiple
Этот булев атрибут позволяет обеспечить множественный выбор. При отсутствии этого атрибута допускается только один выбор.
Элемент select создает список вариантов, из которых может выбирать пользователь. Каждый элемент select должен предложить как минимум один вариант. Каждый вариант специфицируется с помощью элемента option.

<!element option - o (#pcdata)	-- доступный выбор -->
<!attlist option	-- %coreattrs, %i18n, %events --
	%attrs;
	selected (selected) #implied
	disabled (disabled) #implied	-- недоступно в данном контексте --
	label %text; #implied	-- для использования иерархического меню --
	value cdata #implied	-- содержимое элемента по умолчанию -->

Описание атрибутов элемента option selected
Этот булев атрибут определяет то, что данная опция является уже выбранной (pre-selected).

value = cdata
Этот атрибут специфицирует исходное значение control. Если атрибут не установлен, исходное значение определяется содержимым элемента option.
label = text
Этот атрибут позволяет разработчику специфицировать более короткую метку, чем содержимое элемента option. Если атрибут задан, агент пользователя должен использовать в качестве метки опции значение атрибута, а не содержимое элемента option.
Элемент select помогает создать меню, с помощью которого осуществляется выбор опции. Ниже приведен пример создания такого меню.
<form action="http://somesite.com/prog/component-select" method="post">

<p>

<select multiple size="4" name="component-select">

<option selected value="component_1_a">component_1</option>

<option selected value="component_1_b">component_2</option>

<option>component_3</option>

<option>component_4</option>

<option>component_5</option>

<option>component_6</option>

<option>component_7</option>

</select>

<input type="submit" value="send"><input type="reset">

</p>

</form>
Атрибут size определяет, что в окне должно быть видно 4 опции. Реальное число опций равно 7, по этой причине выбор остальных опций возможен с помощью механизма скролинга.
Элемент optgroup позволяет разработчику логически сгруппировать опции. Это особенно удобно, когда пользователь должен сделать выбор из длинного списка опций. В HTML 4.0 все элементы optgroup должны быть специфицированы в пределах элемента select (т.е., группы не могут вкладываться друг в друга). В ниже приведенном примере показано использование элемента optgroup:
<form action="http://somesite.com/prog/someprog" method="post">

<p>

<select name="comos">

<optgroup label="portmaster 3">

<option label="3.7.1" value="pm3_3.7.1">portmaster 3 with comos 3.7.1

<option label="3.7" value="pm3_3.7">portmaster 3 with comos 3.7

<option label="3.5" value="pm3_3.5">portmaster 3 with comos 3.5

</optgroup>

<option label="3.7" value="pm2_3.7">portmaster 2 with comos 3.7

<option label="3.5" value="pm2_3.5">portmaster 2 with comos 3.5

</optgroup>

<optgroup label="irx">

<option label="3.7r" value="irx_3.7r">irx with comos 3.7r

<option label="3.5r" value="irx_3.5r">irx with comos 3.5r

</optgroup>

</select>

</form>
25.6. Элемент optgroup

<!element optgroup - - (option)+	-- группа опции -->
<!attlist optgroup
	%attrs;	-- %coreattrs, %i18n, %events --
	disabled (disabled) #implied	-- недоступно в данном контексте --

Определение атрибута
label = text [cs]
Этот атрибут специфицирует метку опции для группы опций.
Когда форма передается на обработку, каждый из выборов группируется с именем “component-select”.
25.7. Элемент textarea

<!element textarea - - (#pcdata)

-- поле многострочного текста -->

<!attlist textarea

	%attrs;	-- %coreattrs, %i18n, %events --
	name cdata #implied
	rows number #required
	cols number #required
	disabled (disabled) #implied	-- недоступно в данном контексте --
	readonly (readonly) #implied
	tabindex number #implied	-- position in tabbing order --
	accesskey %character; #implied	-- клавиша доступа --
	onfocus %script; #implied	-- элемент выделен --
	onblur %script; #implied	-- элемент не выделен --
	onselect %script; #implied	-- некоторый текст выбран --
	onchange %script; #implied	-- значение элемента изменено -- >

Определение атрибутов
name = cdata [ci]
Этот атрибут присваивает имя control.
rows = number [cn]
Этот атрибут специфицирует номер видимой строки текста. Пользователь может ввести больше строк, чем это число, по этой причине агент пользователя должен предоставить средства для скролирования текста, чтобы обеспечить доступ к строкам за пределами видимости окна.

cols = number [cn]
Этот атрибут специфицирует видимую ширину строки (в символах). Пользователь может иметь возможность ввести более длинные строки, так что агент пользователя должен обеспечить средства для скролирования текста по горизонтали. Агент пользователя может разрывать строки, чтобы их сделать видимыми по всей длине без горизонтального скролинга.
Пример использования элемента textarea для создания текстовой области размером 20 строк по 80 колонок. В исходный момент зона содержит только две строки.
<form action="http://somesite.com/prog/text-read" method="post">

<p>

<textarea name="thetext" rows="20" cols="80">

first line of initial text.

second line of initial text.

</textarea>

<input type="submit" value="send"><input type="reset">

</p>

</form>
25.8. Элемент label
<!element label - - (%inline;)* -(label) -- form field label text -->

<!attlist label

	%attrs;	-- %coreattrs, %i18n, %events --
	for idref #implied	-- matches field id value --
	accesskey %character; #implied	-- клавиша доступа --
	onfocus %script; #implied	-- элемент выделен --
	onblur %script; #implied	-- элемент не выделен -->

Определение атрибута
for = idref [cs]
Этот атрибут устанавливает соответствие между меткой и control. При наличии этого атрибута его значение должно совпадать с атрибутом id другого control того же документа. При отсутствии этого атрибута метка ставится в соответствие содержимому элемента.
Элемент label может использоваться для привязки информации к другим элементам control (за исключением других элементов label). Ниже приведены два примера использования элемента label.
<form action="..." method="post">

<table>

<tr>

<td><label for="fname">first name</label>

<td><input type="text" name="firstname" id="fname">

<tr>

<td><label for="lname">last name</label>

<td><input type="text" name="lastname" id="lname">

</table>

</form>

<form action="http://somesite.com/prog/adduser" method="post">

<p>

<label for="firstname">first name: </label>

<input type="text" id="firstname"><br>

<label for="lastname">last name: </label>

<input type="text" id="lastname"><br>

<label for="email">email: </label>

<input type="text" id="email"><br>

<input type="radio" name="sex" value="male"> male<br>

<input type="radio" name="sex" value="female"> female<br>

<input type="submit" value="send"> <input type="reset">

</p>

</form>
Для установления неявной связи между меткой и другим control контрольный элемент должен находиться внутри содержимого элемента label. В этом случае label может содержать только один контрольный элемент. В примере две метки неявно поставлены в соответствие двум вводимым текстам:
<form action="..." method="post">

<p>

<label>

first name

<input type="text" name="firstname">

</label>

<label>

<input type="text" name="lastname">

last name

</label>

</p>

</form>
25.9. Элементы fieldset и legend


<!element fieldset - - (#pcdata,legend,(%flow;)*) >

<!attlist fieldset

%attrs;	-- %coreattrs, %i18n, %events -- >
<!element legend - - (%inline;)*	-- легенда поля -->

<!entity % lalign "(top|bottom|left|right)">

<!attlist legend

%attrs;	-- %coreattrs, %i18n, %events -- >
accesskey %character; #implied	-- клавиша доступа -- >

Определение атрибута элемента legend

align = top|bottom|left|right

Не рекомендуется к применению. Этот атрибут специфицирует положение легенды по отношению к набору полей. Возможные значения:

top:	Легенда размещается сверху (значение по умолчанию).
bottom:	Легенда размещается внизу.
left:	Легенда размещается слева.
right:	Легенда размещается справа.

<!element script - - %script;

-- текст скрипта -->

<!attlist script

charset %charset; #implied	-- кодировка символов, подключенного ресурса --
type %contenttype; #required	-- тип содержимого языка скрипта --
src %uri; #implied	-- uri для внешнего скрипта --
defer (defer) #implied	-- ua может отложить исполнение скрипта -->

Определение атрибутов
src = URI [ct]
Этот атрибут специфицирует местонахождения внешнего скрипта.
type = content-type
Этот атрибут специфицирует язык скрипта, включенного в элемент. Язык специфицируется в содержимом content-type (напр., "text/javascript"). Разработчик должен выдать значения этого атрибута, так как не существует никакого значения по умолчанию.
language = cdata
Не рекомендуется к применению. Этот атрибут специфицирует язык скрипта, включенного в элемент. Его содержимое представляет собой идентификатор языка. Но из-за отсутствия стандарта атрибут type предпочтительнее.
defer
Установка этого булева атрибута сообщает агенту пользователя о том, что скрипт не будет генерировать какого-либо текста документа, что позволяет агенту пользователя продолжить разборку и представление документа.
Элемент script размещает скрипт внутри документа. Этот элемент может встретиться в head или body HTML-документа любое число раз. Сам скрипт может находиться в содержательной части элемента script или во внешнем файле. Если атрибут src не установлен, агент пользователя должен интерпретировать содержимое элемента, как скрипт. Если же src содержит URL, то агент пользователя должен игнорировать содержимое элемента и получить скрипт через URL. Разработчик должен идентифицировать язык скрипта. Для того чтобы определить язык всех скриптов в документе, необходимо включить следующую meta-декларацию в head документа:
<meta http-equiv="content-script-type" content="type">

где “type” соответствует internet media type, именующему язык скрипта. В отсутствии META-декларации, значение по умолчанию может быть установлено с помощью HTTP-заголовка “content-script-type”
content-script-type: type
где “type” соответствует internet media type.
27.2. Локальная декларация языка скрипта
Можно описать язык скрипта в каждом элементе script независимо с помощью атрибута type. В отсутствии значения языка по умолчанию этот атрибут должен быть обязательно установлен. При наличии значения по умолчанию атрибут type переписывает это значение. Ниже приведен пример, где значение языка скриптов по умолчанию равно “text/tcl”. Один скрипт включен в заголовок, он размещен во внешнем файле и написан на языке “text/vbscript”. Включен скрипт и в тело script (написан на “text/javascript”).
<!doctype html public "-//w3c//dtd html 4.0//en"

"http://www.w3.org/tr/rec-html40/strict.dtd">z

<html>

<head>

<title>a document with script</title>

<meta http-equiv="content-script-type" content="text/tcl">

<script type="text/vbscript" src="http://someplace.com/progs/vbcalc">

</script>

</head>

<body>

<script type="text/javascript">

...some javascript...

</script>

</body>

</html>
27.3. Ссылки на html-документы из скрипта
В каждом языке имеется соглашение относительно взаимодействия с HTML-объектами. Содержимым элемента script является скрипт и по этой причине агент пользователя не должен рассматривать его как часть HTML-текста. Текст скрипта начинается сразу после начальной метки и завершается любой меткой, которая начинается с символов “</”. Ниже следующий пример не является корректным из-за наличия “</em>” символов внутри элемента script (эта комбинация указывает на окончание скрипта):
<scipt type=”text/javascript”>

document.write (“<em> this won’t work</em>”

</script>

Корректная версия записи выглядит как:
<scipt type=”text/javascript”>

document.write (“<em> this will work<\/em>”

</script>
В tcl можно это записать как:
<scipt type=”text/tcl”>

document.write (“<em> this will work<\/em>”

%attrs;

-- %coreattrs, %i18n, %events -- >

descset	0	9	unused
	9	2	9
	11	2	unused
	13	1	13
	14	18	unused
	32	95	32
	127	1	unused
	128	32	unused
	160	55136	160
	55296	2048	unused -- суррогаты --
	57344	1056768	57344

capacity	sgmlref
	totalcap	150000
	grpcap	150000
	entcap	150000
scope	document

syntax

shunchar

controls

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 127

	baseset	"ISO 646irv:1991//charset
		international reference version (irv)//esc 2/8 4/2"

descset 0 128 0

function

re	13
rs	10
space	32
tab sepchar	9

naming	lcnmstrt ""
	ucnmstrt ""
	lcnmchar ".-_:"
	ucnmchar ".-_:"
	namecase	general	yes
		entity	no
delim	general	sgmlref
	shortref	sgmlref
names	sgmlref
quantity	sgmlref
	attcnt	60
	attsplen	65536	-- Это наибольшие величины --
	litlen	65536	-- разрешенные в декларации --
	namelen	65536	-- Избегайте фиксированных пределов --
	pilen	65536	-- приложения агентов пользователя HTML --
	taglvl	100
	taglen	65536
	grpgtcnt	150
	grpcnt	64

features

	minimize
	datatag	no
	omittag	yes
	rank	no
	shorttag	yes
	link
	simple	no
	implicit	no
	explicit	no
	other
	concur	no
	subdoc	no
	formal	yes
	appinfo	none

>
29.4. Определение типа документа DTD (Document Type Definition)


<!-- Типовое применение:

	<!doctype html public "-//w3c//dtd html 4.0//en"
	"http://www.w3.org/tr/rec-html40/strict.dtd">
	<html>
	<head>
	...
	</head>
	<body>
	...
	</body>
	</html>

<!entity % contenttype "cdata"

-- тип среды, как в rfc2045 -->

<

<!entity % contenttypes "cdata"

-- список кодов типов среды, разделенных запятыми, в соответствие с [rfc-2045] -->

<!entity % charset "cdata"	-- символьное кодирования как в [rfc-2045] -->
<!entity % charsets "cdata"	-- список символьных кодов, разделенных пробелами, как в rfc-2045 -->
<!entity % languagecode "name"	-- код языка, как в [RFC-1766] -->
<!entity % character "cdata"	-- одиночный символ из [ISO10646] -->
<!entity % linktypes "cdata"	-- список типов связей (через пробел) -->
<!entity % mediadesc "cdata"	-- список дескрипторов среды (через запятую)-->
<!entity % uri "cdata"	-- uri -->
<!entity % datetime "cdata"	-- информация о дате и времени. Формат ISO -->
<!entity % script "cdata"	-- скрипты -->
<!entity % stylesheet "cdata"	-- информация стилевого листа -->
<!entity % text "cdata">

black =	#000000	green =	#008000
silver =	#C0C0C0	lime =	#00FF00
gray =	#808080	olive =	#808000
white =	#FFFFFF	yellow =	#FFFF00
maroon =	#800000	navy =	#000080
red =	#FF0000	blue =	#0000FF
purple =	#800080	teal =	#008080
fuchsia =	#FF00FF	aqua =	#00FFFF

--> <!entity % bodycolors "

bgcolor %color; #implied	-- фоновый цвет документа --
text %color; #implied	-- цвет текста документа --
link %color; #implied	-- цвета связей --
vlink %color; #implied	-- цвета посещенных URL --
alink %color; #implied	-- цвет выбранного URL -- ">

<



<!entity % htmllat1 public

"-//w3c//entities latin1//en//html"

"http://www.w3.org/tr/1998/rec-html40-19980424/htmllat1.ent">

%htmllat1;
<!entity % htmlsymbol public

"-//w3c//entities symbols//en//html"

"http://www.w3.org/tr/1998/rec-html40-19980424/htmlsymbol.ent">

%htmlsymbol;

<!entity % htmlspecial public

"-//w3c//entities special//en//html"

"http://www.w3.org/tr/1998/rec-html40-19980424/htmlspecial.ent">

%htmlspecial;



<!entity % coreattrs

"id id #implied

-- уникальный идентификатор, действительный для всего документа --

	class cdata #implied	-- список классов, разделенных пробелами --
	style %stylesheet; #implied	-- ассоциированная стилевая информация --
	title %text; #implied	-- рекомендуемые заголовки /приложения --" >

<!entity % i18n

	"lang %languagecode; #implied	-- код языка --
	dir (ltr\|rtl) #implied	-- направление для слабого/нейтрального текста --" >
<!entity % events
	"onclick %script; #implied	-- клавиша мышки была нажата --
	ondblclick %script; #implied	-- клавиша мышки была нажата дважды --
	onmousedown %script; #implied	-- клавиша мышки была нажата и удержана --
	onmouseup %script; #implied	-- клавиша мышки была отпущена --
	onmouseover %script; #implied	-- маркер был помещен на объект --
	onmousemove %script; #implied	-- маркер перемещался в пределах объекта --
	onmouseout %script; #implied	-- маркер удален с объекта --
	onkeypress %script; #implied	-- клавиша была нажата и отпущена --
	onkeydown %script; #implied	-- клавиша была зажата --
	onkeyup %script; #implied	-- клавиша была отпущена --" >

<!entity % html.reserved "ignore">



<![ %html.reserved; [

<!entity % reserved

	"datasrc %uri; #implied	-- a single or tabular data source --
	datafld cdata #implied	-- свойство или имя колонки --
	dataformatas (plaintext\|html) plaintext	-- текст или html --" >

	%attrs;	-- %coreattrs, %i18n, %events -- >
<!element (sub\|sup) - - (%inline;)*	-- нижний или верхний индексы -->
<!attlist (sub\|sup) %attrs;	-- %coreattrs, %i18n, %events -->
<!element span - - (%inline;)*	-- общий языковый/стилевой контейнер -->
<!attlist span %attrs	-- %coreattrs, %i18n, %events --
	%reserved	-- зарезервировано на будущее -->
<!element bdo - - (%inline;)*	-- i18n bidi over-ride -->
<!attlist bdo %coreattrs;	-- id, class, style, title --
	lang %languagecode; #implied	-- код языка --
	dir (ltr\|rtl) #required	-- направление -->
<!element br - o empty	-- принудительный разрыв строки -->
<!attlist br %coreattrs;	-- id, class, style, title -- >
<!element basefont - o empty	-- базовый размер шрифта -->
<!attlist basefont
ID id #implied	-- идентификатор документа --
size cdata #required	-- базовый размер шрифта для элементов font --
color %color; #implied	-- цвет текста --
face cdata #implied	-- список имен шрифтов, разделенных запятыми -- >

<!element font - - (%inline;)*	-- локальная смена шрифта -->
<!attlist font %coreattrs;	-- id, class, style, title --
	%i18n;	-- lang, dir --
	size cdata #implied	-- [+\|-]nn e.g. size="+1", size="4" --
	color %color; #implied	-- цвет текста --
	face cdata #implied	-- список имен шрифтов, разделенных запятыми -- >

<!attlist body %attrs;	-- %coreattrs, %i18n, %events --
	onload %script; #implied	-- документ был загружен --
	onunload %script; #implied	-- документ был удален -->
<!element address - - (%inline;)*	-- информация об авторе -->
<!attlist address %attrs;	-- %coreattrs, %i18n, %events -- >
<!element div - - (%flow;)*	-- общий языковый/стилевой контейнер -->
<!attlist div %attrs;	-- %coreattrs, %i18n, %events --
	%reserved;	-- зарезервировано на будущее -->

<!entity % shape "(rect|circle|poly|default)">

<!entity % coords "cdata"

-- список длин с запятыми между элементами -->

<!element a - - (%inline;)* -(a)	-- якорь -->
<!attlist a %attrs;	-- %coreattrs, %i18n, %events --
	charset %charset; #implied	-- кодировка подключенного ресурса --
	type %contenttype; #implied	-- рекомендуемый тип содержимого --
	name cdata #implied	-- именованный конец связи --
	href %uri; #implied	-- uri для связанного ресурса --
	hreflang %languagecode; #implied	-- код языка --
	rel %linktypes; #implied	-- прямые типы связи --
	rev %linktypes; #implied	-- обратные типы связи --
	target %frametarget; #implied	-- отображать в этой рамке --
	accesskey %character; #implied	-- клавиша доступа --
	shape %shape; rect	-- для использования с картой изображения клиента --
	coords %coords; #implied	-- для использования с картой изображения клиента --
	tabindex number #implied	-- индекс позиции в меню --
	onfocus %script; #implied	-- элемент выделен --
	onblur %script; #implied	-- элемент не выделен -- >

<

<!element map - - ((%block;)+ | area+)

-- карта изображения со стороны клиента -->

<!attlist map

	%attrs;	-- %coreattrs, %i18n, %events --
	name cdata #required	-- для ссылок через карту использования -- >
<!element area - o empty	-- карта изображения стороны клиента -->
<!attlist area
	%attrs;	-- %coreattrs, %i18n, %events --
	shape %shape; rect	-- управление интерпретацией координат --
	coords %coords; #implied	-- список длин, разделенных запятыми --
	href %uri; #implied	-- uri для подключенного ресурса --
	target %frametarget; #implied	-- отображать в этой рамке --
	nohref (nohref) #implied	-- эта область не производит действия --
	alt %text; #required	-- краткое описание --
	tabindex number #implied	-- положение при обходе меню --
	accesskey %character; #implied	-- клавиша доступа --
	onfocus %script; #implied	-- элемент выделен --
	onblur %script; #implied	-- элемент не выделен -- >

<!element link - o empty	-- связь, независящая от среды-->
<!attlist link
	%attrs;	-- %coreattrs, %i18n, %events --
	charset %charset; #implied	-- кодировка символов подключенного ресурса --
	href %uri; #implied	-- uri для подключенного ресурса --
	hreflang %languagecode; #implied	-- код языка --
	type %contenttype; #implied	-- рекомендуемый тип содержимого --
	rel %linktypes; #implied	-- прямые типы связей --
	rev %linktypes; #implied	-- обратные типы связей --
	media %mediadesc; #implied	-- для отображения в этих средах -- >
	target %frametarget; #implied	-- отображать в этой рамке -- >

<

<!entity % length "cdata"	-- nn для пикселей или nn% для %-длины -->
<!entity % multilength "cdata"	-- пиксель, процент или относительно -->
<!entity % multilengths "cdata"	-- список multilength, разделенных запятыми -->
<!entity % pixels "cdata"	-- целочисленная длина в пикселях -->
<!entity % ialign "(top\|middle\|bottom\|left\|right)"	-- центрировать? -->

<!element img - o empty

-- Встроенное изображение -->

<!attlist img

	%attrs;	-- %coreattrs, %i18n, %events --
	src %uri; #required	-- uri встроенного изображения --
	alt %text; #required	-- краткое описание --
	longdesc %uri; #implied	-- связь с длинным описанием (complements alt) --
	height %length; #implied	-- присвоение нового значения высоты --
	width %length; #implied	-- присвоение нового значения ширины--
	usemap %uri; #implied	-- для использования с картой изображения клиента --
	ismap (ismap) #implied	-- для использования с картой изображения сервера -->
	align %ialign; #implied	-- вертикальное или горизонтальное выравнивание--
	border %length; #implied	-- ширина границы для связи --
	hspace %pixels; #implied	-- горизонтальный пробельный массив--
	vspace %pixels; #implied	-- вертикальный пробельный массив-- >

<!element object - - (param | %flow;)*

-- общий встроенный объект -->

<!attlist object

	%attrs	-- %coreattrs, %i18n, %events --
	declare (declare) #implied	-- декларирует, но не инициирует флаг --
	classid %uri; #implied	-- идентифицирует реализацию --
	codebase %uri; #implied	-- базовый uri для classid, data, archive --
	data %uri; #implied	-- ссылка на данные объекта --
	type %contenttype; #implied	-- тип содержимого для данных --
	codetype %contenttype; #implied	-- тип содержимого для кода --
	archive %uri; #implied	-- архивный список с sp в качестве разделителей --
	standby %text; #implied	-- сообщение, отображаемое при загрузке --
	height %length; #implied	-- присваивает новое значение высоты --
	width %length; #implied	-- присваивает новое значение ширины --
	usemap %uri; #implied	-- для использования с картой изображения клиента --
	name cdata #implied	-- представляет как часть формы --
	tabindex number #implied	-- положение при обходе меню --
	align %ialign; #implied	-- вертикальное или горизонтальное выравнивание--
	border %length; #implied	-- ширина границы связи --
	hspace %pixels; #implied	-- горизонтальный пробельный массив--
	vspace %pixels; #implied	-- вертикальный пробельный массив--
	%reserved;	-- зарезервировано на будущее -->

<!element param - o empty

-- именованное значение свойства -->

align="justify"><!attlist param

	id id #implied	-- идентификатор документа --
	name cdata #required	-- имя свойства --
	value cdata #implied	-- значение свойства --
	valuetype (data\|ref\|object) data	-- Как интерпретировать значение --
	type %contenttype; #implied	-- тип содержимого для значения, когда valuetype=ref -->

<!element applet - - (param | %flow;)* -- аплет java -->

<!attlist applet %coreattrs;	-- id, class, style, title --
codebase %uri; #implied	-- опционный базовый uri для аплета --
archive cdata #implied	-- список архива с запятой в качестве разделителя--
code cdata #implied	-- файл класса аплета --
object cdata #implied	-- файл специального аплета --
alt %text; #implied	-- краткое описание--
name cdata #implied	-- позволяет аплетам найти друг друга --
width %length; #required	-- начальная ширина --
height %length; #required	-- начальная высота --
align %ialign; #implied	-- вертикальное или горизонтальное выравнивание --
hspace %pixels; #implied	-- горизонтальный пробельный массив--
vspace %pixels; #implied	-- вертикальный пробельный массив-- >

<!element hr - o empty	-- горизонтальная линейка -->
<!attlist hr %coreattrs;	-- id, class, style, title --
	%events; >

<!element p - o (%inline;)*	-- параграф -->
<!attlist p %attrs;	-- %coreattrs, %i18n, %events -- >
%align;	-- выравнивание текста -- >

<!element (%heading;) - - (%inline;)*	-- Заголовок -->
<!attlist (%heading;) %attrs;	-- %coreattrs, %i18n, %events -- >
%align;	-- выравнивание текста -- >

<!entity % pre.exclusion "img|object|big|small|sub|sup">

<!element pre - - (%inline;)* -(%pre.exclusion;) -- преформатированный текст -->

<!attlist pre %attrs; -- %coreattrs, %i18n, %events -- >

<!element q - - (%inline;)*	-- Кавычки для текста в пределах строки -->
<!attlist q %attrs;	-- %coreattrs, %i18n, %events --
	cite %uri; #implied	-- uri для исходного документа или сообщения -- >

<!element blockquote - - (%block;|script)+ -- Кавычки для многострочных блоков текста -->

<!attlist blockquote

	%attrs;	-- %coreattrs, %i18n, %events --
	cite %uri; #implied	-- uri для исходного документа или сообщения -->

<!element (ins\|del) - - (%flow;)*	-- введенный текст, стертый текст -->
<!attlist (ins\|del) %attrs;	-- %coreattrs, %i18n, %events --
	cite %uri; #implied	-- инфо о причине изменения --
	datetime %DAtetime; #implied	-- дата и время изменения -- >

<!element dl - - (dt\|dd)+	-- список определений -->
<!attlist dl %attrs;	-- %coreattrs, %i18n, %events -->
<!element dt - o (%inline;)*	-- term определения -->
<!element dd - o (%flow;)*	-- описание определения -->
<!attlist (dt\|dd) %attrs;	-- %coreattrs, %i18n, %events -->
<!element ol - - (li)+	-- упорядоченный список -->
<!attlist ol %attrs;	-- %coreattrs, %i18n, %events -->

<!entity % olstyle "cdata" -- ограничено перечнем: "(1|a|a|i|i)" -->

<!element ol - - (li)+ -- упорядоченный список -->

<!attlist ol

	%attrs;	-- %coreattrs, %i18n, %events --
	type %olstyle; #implied	-- стиль нумерации --
	compact (compact) #implied	-- уменьшенный зазор между позициями--
	start number #implied	-- начальный номер последовательности -- >

<!element ul - - (li)+	-- неупорядоченный список -->
<!attlist ul %attrs;	-- %coreattrs, %i18n, %events -- >
<!element li - o (%flow;)*	-- элемент списка -->
<!attlist li %attrs;	-- %coreattrs, %i18n, %events -- >

	type %ulstyle; #implied	-- стиль bullet --
	compact (compact) #implied	-- уменьшенный зазор между позициями-- >

><!element form - - (%block;|script)+ -(form)

-- интерактивная форма --&gt

<!attlist form %attrs;	-- %coreattrs, %i18n, %events --
	action %uri; #required	-- хандлер форм для стороны сервера --
	method (get\|post) get	-- http метод для представления форм --
enctype %contenttype; "application/x-www-form-urlencoded"
	onsubmit %script; #implied	-- форма была представлена --
	onreset %script; #implied	-- форма возвращена в исходное состояние --
	target %frametarget; #implied	-- отображать в этой рамке --
	accept-charset %charsets; #implied	-- список поддерживаемых символьных наборов -- >

<!element label - - (%inline;)* -(label) -- текст метки поля формы -->

<!attlist label %attrs;	-- %coreattrs, %i18n, %events --
	or idref #implied	-- проверяет корректность значения поля --
	accesskey %character; #implied	-- клавиша доступа --
	onfocus %script; #implied	-- элемент выделен --
	onblur %script; #implied	-- элемент не выделен -- >

<!element input - o empty	-- Управление формой -->
<!attlist input %attrs;	-- %coreattrs, %i18n, %events --
	type %inputtype; text	-- what kind of widget is needed --
	name cdata #implied	-- представить в качестве части формы --
	value cdata #implied	-- необходимо для радио кнопок и переключателей --
	checked (checked) #implied	-- для радио кнопок и переключателей --
	disabled (disabled) #implied	-- недоступно в данном контексте --
	readonly (readonly) #implied	-- для текста и пароля --
	size cdata #implied	-- разный для каждого из полей --
	maxlength number #implied	-- максимальное число символов для текстовых полей --
	src %uri; #implied	-- для полей с изображением --
	alt cdata #implied	-- краткое описание --
	usemap %uri; #implied	-- использует карту изображения клиента --
	tabindex number #implied	-- номер позиции в меню --
	accesskey %character; #implied	-- клавиша доступа --
	onfocus %script; #implied	-- элемент выделен --
	onblur %script; #implied	-- элемент не выделен --
	onselect %script; #implied	-- некоторая часть текста выделена --
	onchange %script; #implied	-- значение элемента изменилось --
	accept %contenttypes; #implied	-- список типов mime для файловой загрузки --
	align %ialign; #implied	-- вертикальное или горизонтальное выравнивание--
	%reserved;	-- зарезервировано на будущее -- >

<!element select - - (optgroup\|option)+	-- селектор опций -->
<!attlist select %attrs;	-- %coreattrs, %i18n, %events --
	name cdata #implied	-- имя поля --
	size number #implied	-- видимые строки --
	multiple (multiple) #implied	-- по умолчанию один выбор --
	disabled (disabled) #implied	-- недоступно в данном контексте --
	tabindex number #implied	-- номер позиции в меню --
	onfocus %script; #implied	-- элемент выделен --
	onblur %script; #implied	-- элемент не выделен --
	onchange %script; #implied	-- значение элемента изменилось --
	%reserved;	-- зарезервировано на будущее -- >

<!element optgroup - - (option)+	-- группа опций -->
<!attlist optgroup %attrs;	-- %coreattrs, %i18n, %events --
	disabled (disabled) #implied	-- недоступно в данном контексте --
	label %text; #required	-- для использования в иерархических меню -->

<!element option - o (#pcdata)	-- селективный выбор -->
<!attlist option %attrs;	-- %coreattrs, %i18n, %events --
	selected (selected) #implied
	disabled (disabled) #implied	-- недоступно в данном контексте --
	label %text; #implied	-- для использования в иерархических меню --
	value cdata #implied	-- значения по умолчанию содержимого элемента -->

<!element textarea - - (#pcdata)

-- многострочное текстовое поле -->

<!attlist textarea %attrs;	-- %coreattrs, %i18n, %events --
	name cdata #implied
	rows number #required
	cols number #required
	disabled (disabled) #implied	-- недоступно в данном контексте --
	readonly (readonly) #implied
	tabindex number #implied	-- номер позиции в меню --
	accesskey %character; #implied	-- клавиша доступа --
	onfocus %script; #implied	-- элемент выделен --
	onblur %script; #implied	-- элемент не выделен --
	onselect %script; #implied	-- некоторая часть текста выделена --
	onchange %script; #implied	-- значение элемента изменилось --
	%reserved;	-- зарезервировано на будущее -->

<!element fieldset - - (#pcdata,legend,(%flow;)*)	-- группа управлений формой -->
<!attlist fieldset %attrs;	-- %coreattrs, %i18n, %events -- >
<!element legend - - (%inline;)*	-- легенда поля -->
<!entity % lalign "(top\|bottom\|left\|right)">	-- выравнивание -->
<!attlist legend %attrs;	-- %coreattrs, %i18n, %events --
	accesskey %character; #implied	-- клавиша доступа -- >

<!element button - - (%flow;)* -(a|%formctrl;|form|fieldset)

-- кнопка нажатия -->

<!attlist button %attrs;	-- %coreattrs, %i18n, %events --
	name cdata #implied
	value cdata #implied	-- посылается серверу при представлении --
	type (button\|submit\|reset) submit	-- для использования в качестве кнопки в форме --
	disabled (disabled) #implied	-- не доступно в данном контексте --
	tabindex number #implied	-- номер позиции в меню --
	accesskey %character; #implied	-- клавиша доступа --
	onfocus %script; #implied	-- элемент выделен --
	onblur %script; #implied	-- элемент не выделен --
	%reserved;	-- зарезервировано на будущее -- >

<!entity % tframe "(void|above|below|hsides|lhs|rhs|vsides|box|border)">



<!entity % trules "(none | groups | rows | cols | all)">



<!entity % talign "(left|center|right)">



<!entity % cellhalign "align (left|center|right|justify|char) #implied

	char %character; #implied	-- символ выравнивания, напр. символ=':' --
	charoff %length; #implied	-- смещение символа выравнивания --" >

<



<!entity % cellvalign "valign (top|middle|bottom|baseline) #implied" >

<!element table - -
(caption?, (col*|colgroup*), thead?, tfoot?, tbody+)>

<!element caption - - (%inline;)*	-- Название таблицы -->
<!element thead - o (tr)+	-- Заголовок таблицы -->
<!element tfoot - o (tr)+	-- Подпись под таблицей -->
<!element tbody o o (tr)+	-- Тело таблицы -->
<!element colgroup - o (col)*	-- Группа колонок таблицы -->
<!element col - o empty	-- Колонка таблицы -->
<!element tr - o (th\|td)+	-- Строка таблицы -->
<!element (th\|td) - o (%flow;)*	-- Заголовок ячейки, данные ячейки таблицы -->

<!attlist table	-- Элемент таблицы --
	%attrs;	-- %coreattrs, %i18n, %events --
	summary %text; #implied	-- цель/структура для речевого вывода --
	width %length; #implied	-- ширина таблицы --
	border %pixels; #implied	-- управляет шириной рамки вокруг таблицы --
	frame %tframe; #implied	-- какую часть таблицы отображать--
	rules %trules; #implied	-- линии между строками и колонками --
	cellspacing %length; #implied	-- зазор между ячейками --
	cellpadding %length; #implied	-- зазор внутри ячеек --
	align %talign; #implied	-- положение таблицы по отношению к окну --
	bgcolor %color; #implied	-- фоновый цвет ячеек таблицы --
	%reserved;	-- зарезервировано на будущее --
	datapagesize cdata #implied	-- зарезервировано на будущее -- >

<!entity % calign "(top|bottom|left|right)">

<!attlist caption %attrs;

-- %coreattrs, %i18n, %events -- >

<!attlist colgroup %attrs;	-- %coreattrs, %i18n, %events --
	span number 1	-- число колонок в группе по умолчанию --
	width %multilength; #implied	-- значение ширины по умолчанию для вложенных col --
	%CEllhalign;	-- горизонтальное выравнивание в ячейках --
	%CEllvalign;	-- вертикальное выравнивание в ячейках -- >

<

<!-- Элементы col определяют свойства выравнивания для ячеек в одной или нескольких колонках.

Атрибут width специфицирует ширину колонок, напр.

width=64	ширина в пикселях
width=0.5*	относительная ширина 0.5

Атрибут span заставляет атрибуты одного элемента col работать для нескольких колонок. -->

<!attlist col	-- группы колонок и свойства --
	%attrs;	-- %coreattrs, %i18n, %events --
	span number 1	-- атрибуты col воздействуют на n колонок --
	width %multilength; #implied	-- спецификация ширины колонки --
	%CEllhalign;	-- горизонтальное выравнивание в ячейках --
	%CEllvalign;	-- вертикальное выравнивание в ячейках -- >

<!attlist (thead\|tbody\|tfoot)	-- секция таблицы --
	%attrs;	-- %coreattrs, %i18n, %events --
	%CEllhalign;	-- горизонтальное выравнивание в ячейках--
	%CEllvalign;	-- вертикальное выравнивание в ячейках -- >

<!attlist tr	-- строка таблицы --
	%attrs;	-- %coreattrs, %i18n, %events --
	%CEllhalign;	-- горизонтальное выравнивание в ячейках --
	%CEllvalign;	-- вертикальное выравнивание в ячейках -- >
	bgcolor %color; #implied	-- цвет фона для строки -- >

<!entity % scope "(row|col|rowgroup|colgroup)">

<!attlist (th\|td)	-- заголовок или данные ячейки --
	%attrs;	-- %coreattrs, %i18n, %events --
	abbr %text; #implied	-- сокращение для ячейки заголовка --
	axis cdata #implied	-- имена групп связанных заголовков --
	headers idrefs #implied	-- список id для ячеек заголовка
	scope %scope; #implied	-- область, перекрываемая ячеками заголовка --
	rowspan number 1	-- число строк в ячейке --
	colspan number 1	-- число колонок в ячейке --
	%CEllhalign;	-- горизонтальное выравнивание в ячейках --
	%CEllvalign;	-- вертикальное выравнивание в ячейках -- >
	nowrap (nowrap) #implied	-- подавление разрыва слов --
	bgcolor %color; #implied	-- цвет фона ячейки --
	width %pixels; #implied	-- ширина ячейки --
	height %pixels; #implied	-- высота ячейки -- >

<






<!entity % html.frameset "ignore">

<![ %html.frameset; [

<!element frameset - - ((frameset|frame)+ & noframes?) – разделение окна -->

<!attlist frameset %coreattrs;	-- id, class, style, title --
rows %multilengths; #implied	-- список длин, по умолчанию 100% (1 строка) --
cols %multilengths; #implied	-- список длин, по умолчанию 100% (1 колонка) --
onload %script; #implied	-- все рамки были загружены --
onunload %script; #implied	-- все рамки удалены -- >

]]>

<![ %html.frameset; [



<!element frame - o empty -- субокно -->

<!attlist frame

%coreattrs;	-- id, class, style, title --
longdesc %uri; #implied	-- указатель на длинное описание (complements title) --
name cdata #implied	-- имя рамки для обращений --
src %uri; #implied	-- источник содержимого рамки --
frameborder (1\|0) 1	-- запрос границ рамки? --
marginwidth %pixels; #implied	-- ширины полей в пикселях --
marginheight %pixels; #implied	-- высота поля в пикселях --
noresize (noresize) #implied	-- разрешить пользователям изменить размер рамок? --
scrolling (yes\|no\|auto) auto	-- есть или нет полоса прокрутки -- >

]]>

<!element iframe - - (%flow;)* -- inline subwindow -->

<!attlist iframe %coreattrs; -- id, class, style, title --

longdesc %uri; #implied	-- указатель на длинное описание --
name cdata #implied	-- имя рамки для обращений --
src %uri; #implied	-- источник содержимого рамки --
frameborder (1\|0) 1	-- запрос границ рамки? --
marginwidth %pixels; #implied	-- ширины полей в пикселях --
marginheight %pixels; #implied	-- высота поля в пикселях --
scrolling (yes\|no\|auto) auto	-- есть или нет полоса прокрутки --
align %ialign; #implied	-- вертикальное или горизонтальное выравнивание--
height %length; #implied	-- высота рамки --
width %length; #implied	-- ширина рамки -- >

<

<![ %html.frameset; [

<!entity % noframes.content "(body) -(noframes)">

]]>

<!entity % noframes.content "(%flow;)*">

<!element noframes - - %noframes.content;

< -- контейнер альтернативного сообщения для отображения без поддержки рамок -->

<!attlist noframes %attrs; -- %coreattrs, %i18n, %events -- >





<!entity % head.content "title & base?">

<!element head o o (%head.content;) +(%head.misc;) -- Заголовок документа -->

<!attlist head %i18n;	lang, dir
	profile %uri; #implied	-- именованный словарь мета инфо -- >

<!element title - - (#pcdata) -(%head.misc;) -- заголовок документа -->

<!attlist title %i18n>

<!element isindex - o empty -- однострочное сообщение – подсказка -->

<!attlist isindex

%coreattrs;	-- id, class, style, title --
%i18n;	-- lang, dir --
prompt %text; #implied	-- сообщение-подсказка -->

<!element base - o empty -- базовый uri документа -->

<!attlist base href %uri; #required -- uri, выполняющий функцию базового идентификатора -- >

target %frametarget; #implied	-- отображать в этой рамке -- >
<!element meta - o empty	-- общая метаинформация -->
<!attlist meta %i18n;	-- lang, dir, для использования с содержимым --
http-equiv name #implied	-- имя заголовка http отклика --
name name #implied	-- имя метаинформации --
content cdata #required	-- ассоциированная информация --
scheme cdata #implied	-- выбранная форма содержимого -- >

<!element style - - %stylesheet	-- стилевое инфо -->
<!attlist style %i18n;	-- lang, dir, для использования в заголовке --
	type %contenttype; #required	-- тип содержимого стилевого языка --
	media %mediadesc; #implied	-- предназначено для работы с этими средами --
	title %text; #implied	-- рекомендуемый title -- >

<

<!element script - - %script; -- декларации скрипта -->

<!attlist script charset %charset; #implied -- символьное кодирование подключенного ресурса --

type %contenttype; #required	-- тип содержимого языка скрипта --
language cdata #implied	-- предопределенное имя языка скрипта --
src %uri; #implied	-- uri внешнего скрипта --
defer (defer) #implied	-- ua может отложить исполнение скрипта --
event cdata #implied	-- зарезервировано на будущее --
for %uri; #implied	-- зарезервировано на будущее -- >

Сайт URI	URI для robots.txt
http://www.w3.org/	http://www.w3.org/robots.txt
http://www.w3.org:80/	http://www.w3.org:80/robots.txt
http://www.w3.org:1234/	http://www.w3.org:1234/robots.txt
http://w3.org/	http://w3.org/robots.txt

[CSS1]	"Cascading Style Sheets, level 1", H. W. Lie and B. Bos, 17 December 1996. Доступно по адресу: http://www.w3.org/TR/REC-CSS1-961217
[DATETIME]	"Date and Time Formats", W3C Note, M. Wolf and C. Wicksteed, 15 September 1997. Доступно по адресу: http://www.w3.org/TR/NOTE-datetime
[IANA]	"Assigned Numbers", STD 2, RFC 1700, USC/ISI, J. Reynolds and J. Postel, October 1994. Доступно по адресу: http://ds.internic.net/rfc/rfc1700.txt
[ISO639]	"Codes for the representation of names of languages", ISO 639:1988. Дополнительная информация может быть получена по адресу: http://www.iso.ch/cate/d4766.html. См. также http://www.sil.org/sgml/iso639a.html
[ISO3166]	"Codes for the representation of names of countries", ISO 3166:1993.
[ISO8601]	"Data elements and interchange formats -- Information interchange -- Representation of dates and times", ISO 8601:1988
[ISO8879]	"Information Processing -- Text and Office Systems -- Standard Generalized Markup Language (SGML)", ISO 8879:1986. Информация о стандарте может быть получена по адресу http://www.iso.ch/cate/d16387.html .
[ISO10646]	"Information Technology -- Universal Multiple-Octet Coded Character Set (UCS) -- Part 1: Architecture and Basic Multilingual Plane", ISO/IEC 10646-1:1993. Данная спецификация учитывает также первые пять поправок к документу ISO/IEC 10646-1:1993
[ISO88591]	"Information Processing -- 8-bit single-byte coded graphic character sets -- Part 1: Latin alphabet No. 1", ISO 8859-1:1987
[MIMETYPES]	Список зарегистрированных типов содержимого (типы MIME). Список зарегистрированных типов можно найти по адресу ftp://ftp.isi.edu/in-notes/iana/assignments/media-types /.
[RFC1555]	"Hebrew Character Encoding for Internet Messages", H. Nussbacher and Y. Bourvine, December 1993. Доступно по адресу: http://ds.internic.net/rfc/rfc1555.txt .
[RFC1556]	"Handling of Bi-directional Texts in MIME", H. Nussbacher, December 1993. Доступно по адресу: http://ds.internic.net/rfc/rfc1556.txt
[RFC1738]	"Uniform Resource Locators", T. Berners-Lee, L. Masinter, and M. McCahill, December 1994. Доступно по адресу: http://ds.internic.net/rfc/rfc1738.txt.
[RFC1766]	"Tags for the Identification of Languages", H. Alvestrand, March 1995. Доступно по адресу: http://ds.internic.net/rfc/rfc1766.txt
[RFC1808]	"Relative Uniform Resource Locators", R. Fielding, June 1995. Доступно по адресу: http://ds.internic.net/rfc/rfc1808.txt .
[RFC2044]	"UTF-8, a transformation format of Unicode and ISO 10646", F. Yergeau, October 1996. Доступно по адресу: http://ds.internic.net/rfc/rfc2044.txt
[RFC2045]	"Multipurpose Internet Mail Extensions (MIME) Part One: Format of Internet Message Bodies", N. Freed and N. Borenstein, November 1996. Доступно по адресу: http://ds.internic.net/rfc/rfc2045.txt. Учтите, что это RFC замещает RFC1521, RFC1522 и RFC1590.
[RFC2046]	"Multipurpose Internet Mail Extensions (MIME) Part Two: Media Types", N. Freed and N. Borenstein, November 1996. Доступно по адресу: http://ds.internic.net/rfc/rfc2046.txt. Учтите, что это RFC замещает RFC1521, RFC1522 и RFC1590.
[RFC2068]	"HTTP Version 1.1 ", R. Fielding, J. Gettys, J. Mogul, H. Frystyk Nielsen, and T. Berners-Lee, January 1997. Доступно по адресу: http://ds.internic.net/rfc/rfc2068.txt
[RFC2119]	"Key words for use in RFCs to Indicate Requirement Levels", S. Bradner, March 1997. Доступно по адресу: http://ds.internic.net/rfc/rfc2119.txt
[RFC2141]	"URN Syntax", R. Moats, May 1997. Доступно по адресу: http://ds.internic.net/rfc/rfc2141.txt
[SRGB]	"A Standard Default color Space for the Internet", version 1.10, M. Stokes, M. Anderson, S. Chandrasekar, and R. Motta, 5 November 1996. Доступно по адресу: http://www.w3.org/Graphics/Color/sRGB
[UNICODE]	"The Unicode Standard: Version 2.0", The Unicode Consortium, Addison-Wesley Developers Press, 1996. Спецификация учитывает также обнаруженные ошибки http://www.unicode.org/unicode/uni2errata/bidi.htm. Для получения дополнительной информации, рекомендуется посмотреть базовую страницу Unicode Consortium's по адресу http://www.unicode.org
[URI]	"Uniform Resource Identifiers (URI): Generic Syntax and Semantics", T. Berners-Lee, R. Fielding, L. Masinter, 18 November 1997. Доступно по адресу: http://www.ics.uci.edu/pub/ietf/uri/draft-fielding-uri-syntax-01.txt. Работа продолжается и ожидается, что тексты RFC-1738 и RFC-1808 будут пересмотрены.
[WEBSGML]	"Proposed TC for WebSGML Adaptations for SGML", C. F. Goldfarb, ed., 14 June 1997. Доступно по адресу: http://www.sgmlsource.com/8879rev/n1929.htm

<

Информационные ссылки

[BRYAN88]	"SGML: An Author' s Guide to the Standard Generalized Markup Language", M. Bryan, Addison-Wesley Publishing Co., 1988
[CALS]	Continuous Acquisition and Life-Cycle Support (CALS). CALS является стратегией Министерства обороны США для достижения эффективного создания, обмена и использования цифровых данных для оборудования и систем оружия. Дополнительная информация доступна на базовой странице CALS по адресу http://navysgml.dt.navy.mil/cals.html
[CHARSETS]	Registered charset values. Загрузка списка зарегистрированных наборов символов возможна по адресу ftp://ftp.isi.edu/in-notes/iana/assignments/character-sets
[CSS2]	"Cascading Style Sheets, level 2", B. Bos, H. W. Lie, C. Lilley, and I. Jacobs, November 1997. Доступно по адресу: http://www.w3.org/TR/WD-CSS2
[DCORE]	The Dublin Core: дополнительная информация доступна по адресу http://purl.org/metadata/dublin_core
[ETHNO]	"Ethnologue, Languages of the World", 12th Edition, Barbara F. Grimes editor, Summer Institute of Linguistics, October 1992.
[GOLD90]	"The SGML Handbook", C. F. Goldfarb, Clarendon Press, 1991.
[HTML30]	"HyperText Markup Language Specification Version 3.0", Dave Raggett, September 1995. Доступно по адресу: http://www.w3.org/MarkUp/html3/CoverPage
[HTML32]	"HTML 3.2 Reference Specification", Dave Raggett, 14 January 1997. Доступно по адресу: http://www.w3.org/TR/REC-html32
[HTML3STYLE]	"HTML and Style Sheets", B. Bos, D. Raggett, and H. Lie, 24 March 1997. Доступно по адресу: http://www.w3.org/TR/WD-style
[LEXHTML]	"A Lexical Analyzer for HTML and Basic SGML", D. Connolly, 15 June 1996. Доступно по адресу: http://www.w3.org/TR/WD-html-lex
[PICS]	Platform for Internet Content (PICS). Дополнительная информация доступна по адресу http://www.w3.org/PICS
[RDF]	The Resource Description Language: дополнительная информация доступна по адресу http://www.w3.org/Metadata/RDF
[RFC822]	"Standard for the Format of ARPA Internet Text Messages", Revised by David H. Crocker, August 1982. Доступно по адресу: http://ds.internic.net/rfc/rfc822.txt .
[RFC850]	"Standard for Interchange of USENET Messages", M. Horton, June 1983. Доступно по адресу: http://ds.internic.net/rfc/rfc850.txt
[RFC1468]	"Japanese Character Encoding for Internet Messages", J. Murai, M. Crispin, and E. van der Poel, June 1993. Доступно по адресу: http://ds.internic.net/rfc/rfc1468.txt
[RFC1630]	"Universal Resource Identifiers in WWW: A Unifying Syntax for the Expression of Names and Addresses of Objects on the Network as used in the World-Wide Web", T. Berners-Lee, June 1994. Доступно по адресу: http://ds.internic.net/rfc/rfc1630.txt
[RFC1866]	"HyperText Markup Language 2.0", T. Berners-Lee and D. Connolly, November 1995. Доступно по адресу: http://ds.internic.net/rfc/rfc1866.txt
[RFC1867]	"Form-based File Upload in HTML", E. Nebel and L. Masinter, November 1995. Доступно по адресу: http://ds.internic.net/rfc/rfc1867.txt. Ожидается, что RFC1867 будет поправлено, см.: ftp://ftp.ietf.org/internet-drafts/draft-masinter-form-data-01.txt, в настоящее время ведутся работы
[RFC1942]	"HTML Tables", Dave Raggett, May 1996. Доступно по адресу: http://ds.internic.net/rfc/rfc1942.txt
[RFC2048]	"Multipurpose Internet Mail Extensions (MIME) Part Four: Registration Procedures", N. Freed, J. Klensin, and J. Postel, November 1996. Доступно по адресу: http://ds.internic.net/rfc/rfc2048.txt. Учтите, что это RFC замещает RFC-1521, RFC-1522 и RFC-1590.
[RFC2070]	"Internationalization of the HyperText Markup Language", F. Yergeau, G. Nicol, G. Adams, and M. Dьrst, January 1997. Доступно по адресу: http://ds.internic.net/rfc/rfc2070.txt
[SGMLOPEN]	SGML Consortium. Базовая страница консорциума находится по адресу http://www.sgmlopen.org
[SP]	SP представляет собой общедоступный интерпретатор SGML. Доступно по адресу: ftp://ftp.jclark.com/pub/sp /. Дополнительная информация доступна по адресу: http://www.jclark.com
[SQ91]	"The SGML Primer", 3rd Edition, SoftQuad Inc., 1991
[TAKADA]	"Multilingual Information Exchange through the World-Wide Web", Toshihiro Takada, Computer Networks and ISDN Systems, Vol. 27, No. 2, pp. 235-241, November 1994.
[WAIGUIDE]	Базовая информация по формированию HTML документов доступна на сайте Web Accessibility Initiative (WAI): http://www.w3.org/WAI/.
[VANH90]	"Practical SGML", E. van Herwijnen, Kluwer Academic Publishers Group, Norwell and Dordrecht, 1990

может быть представлена в виде:

Таблица может быть представлена в виде:

1	2	3
4	6
7	8	9

Версия HTML 4.0 включает в себя механизмы контроля горизонтального и вертикального выравнивания, стилями границ таблицы и полями ячеек.

14.12. Горизонтальное и вертикальное выравнивание

<!entity % cellhalign “align (left|center|right|justify|char) #implied

char cdata #implied -- выравнивание по символу, напр. char=”:” --

charoff cdata #implied -- смещение выравнивания по символу -- >

<!entity % cellvalign “valign (top|middle|bottom|baseline) #implied” >

Определения атрибутов

align = left|center|right|justify|char

Этот атрибут определяет способ выравнивания текста в ячейке. Возможны следующие значения:

left:	выравнивание по левому краю (значение атрибута по умолчанию)
center:	Выравнивание текста в ячейке по центру (значение по умолчанию для заголовков)
right:	выравнивание текста по правому краю ячейки.
justify:	выравнивание текста по правой и левой границам.
char:	выравнивание текста по некоторому символу.

valign = top|middle|bottom|baseline

Этот атрибут определяет вертикальное позиционирование текста в ячейке таблицы. Возможны следующие значения:

top:	текст прижимается к верхней границе ячейки.
middle:	текст размещается по центру ячейки (значение по молчанию для заголовков)
bottom:	текст прижимается к нижней границе ячейки.
baseline:	все ячейки в ряду должны быть выровнены по высоте так, чтобы их первые строки были на одной высоте. Это не касается последующих строк.

char = cdata

Этот атрибут определяет символ в тексте, который будет выполнять роль оси для выравнивания. Значением по умолчанию является точка для английского языка и запятая - для французского (бывает полезно для колонок цифр с долями целого).

charoff = length

Если этот атрибут присутствует, он определяет смещение текста относительно символа выравнивания (рассматривается первый такой символ). Если в строке такого символа нет, то она должна быть сдвинута горизонтально в конец относительно позиции выравнивания.

Рассмотрим пример таблицы с выравниванием по символу точка.
<table border=”border”>

<colgroup>

<col><col align=”char” char=”.”>

<thead>

<tr><th>Vegetable <th>Cost per kilo

<tbody>

<tr> <td> lettuce <td>$1

<tr> <td> silver carrots <td>$10.50

<tr> <td>golden turnips <tr>$100.30

</table>
Отформатированная таблица будет выглядеть как:

vegetable	cost per kilo
lettuce	$1
silver carrots	$10.50
golden turnips	$100.30

void:	Ни одна из сторон. Значение по умолчанию.
above:	Только верхняя сторона.
below:	Только нижняя сторона.
hsides:	Только нижняя и верхняя стороны.
vsides:	Только правая и левая стороны.
lhs:	Только левая сторона.
rhs:	Только правая сторона.
box:	Все четыре стороны.
border:	Все четыре стороны.

rules = none|groups|rows|cols|all
Этот атрибут определяет, какие линии появится между ячейками в пределах таблицы. Возможные значения:

none:	Никаких линий, значение по умолчанию.
groups:	Линии имеются только между группами рядов и столбцов.
rows:	Линии имеются только между рядами.
cols:	Линии имеются только между столбцами.
all:	Линии имеются между рядами и столбцами.

border = cdata
Эти атрибуты определяют ширину рамки вокруг таблицы в пикселях. В приведенном ниже примере таблица имеет рамку в 5 пикселей и присутствует с правой и левой сторон таблицы. Разделительные линии имеются между всеми колонками.
<table border=”5” frame=vsides” rules=”cols”>

<tr> <td>1 <td>2 <td>3

<tr> <td>4 <td>5 <td>6

<tr> <td>7 <td>8 <td>9

</table>
Следующие установки должны выполняться агентом пользователя для совместимости.

Установка border=”0” подразумевает frame=”void” и, если не специфицировано иного, rules=”none”. Другие установки border подразумевают frame=”border” и, если не оговорено иное, rules=”all”. Значение “border” в стартовой метке элемента table должно интерпретироваться как значение атрибута frame. Это предполагает, что rules=”all” и ненулевое значение атрибута border. Так, например:
<frame border=”2”> у <frame border=”2” frame=”border” rules=”all”>

и

<frame border> <=< frame frame=”border” rules=”all”>
14.14 Поля ячейки
Два атрибута регулируют зазор между и внутри ячеек.
cellspacing = length
Этот атрибут определяет то, какое расстояние должно быть оставлено между рамкой таблицы и начальным или конечным краем ячейки для каждого ряда или колонки, а также между ячейками в таблице.
cellpadding = length
Этот атрибут определяет расстояние между границей ячейки и его содержимым.
Во всех последующих таблицах атрибут cellspacing определяет, что ячейки разделяются друг от друга и от рамки таблицы расстоянием в 20 пикселей. Атрибут cellpadding определяет, что верхняя и нижняя граница ячейки отстоит от его содержимого на 10% доступного пространства по вертикали (всего 20%). Аналогично поля ячейки в горизонтальном направлении составляют 10% от горизонтального размера ячейки.
<table>

<tr cellpadding=”20”> <tr>data1 <td cellpadding=”20%”>data2 <td>data3

</table>
Ниже приведены примеры, где проиллюстрировано взаимодействие различных элементов. Пример 1.
<table border=”border”>

<caption>A test table with merged cells </caption>

<tr>	<th> rowspan=2><th colspan=”2”>average
	<th rowspan=”2”>other<br>category<th>misc
<tr>	<th>height<th>weight
<tr>	<th>align=”left”>males<td>1.9<td>0.003
<tr>	<th> align=”left” rowspan=”2”>females<td>1.7<td>0.002

/table>

сдвинута к левому краю

Таблица сдвинута к левому краю документа.

center: Таблица размещена по центральной оси документа.

right: Таблица сдвинута к правому краю документа.

width = length

Этот атрибут определяет желательную ширину всей таблицы для агента пользователя. В отсутствии этого атрибута размер таблицы определяется агентом пользователя.

cols = integer

Этот атрибут задает число колонок в таблице. Если он задан, агент пользователя разворачивает таблицу по мере получения данных.

14.2. Вычисление числа рядов и колонок в таблице

Число рядов в таблице равно числу tr-элементов в ее содержимом. Агенты пользователя должны игнорировать ряды с номерами за пределами этого числа. Существует несколько путей определения числа колонок.

Сканирование рядов таблицы и определение максимального числа колонок. Если число колонок в таблице превосходит число ячеек, ряд дополняется пустыми ячейками.

Подсчитывается число колонок, как это специфицировано элементами COL и colgroup.

Используется атрибут COLS элемента table

Агент пользователя может предположить, что число колонок в примере, приведенном ниже равно трем.

… текст таблицы …

</table>

Если число колонок в таблице не задано атрибутом COLS, то визуальный агент пользователя будет ждать прихода всей информации о таблице, прежде чем приступит к ее отображению. Таким образом, атрибут cols позволяет отображать таблицу ряд за рядом по мере поступления данных.

14.3. Ориентация таблиц

Ориентация таблиц определяется атрибутом dir элемента table. Для таблиц, ориентированных слева направо (ориентация по умолчанию), первая колонка расположена слева, а первый ряд сверху. Возможна ориентация таблицы справа налево. Для того чтобы специфицировать таблицу с нумерацией колонок справа налево нужно установить значение атрибута dir.

… содержимое таблицы …

</table>

14.4. Надписи и таблица. Элемент caption

<!element caption - - (%inline;) +>

<!entity % calign “(top|bottom|left|right)”>

<!attlist caption	-- Надпись для таблицы --
	%attrs;	-- %coreattrs, %i18n, %events --
	align %CAlign; #implied	-- относительно таблицы -- >

Определение атрибута
align = top|bottom|left|right
Этот атрибут определяет положение подписи по отношению к таблице. Возможные значения:
top: подпись над таблицей. Это значение по умолчанию.
bottom: подпись под таблицей.
left: подпись слева от таблицы.
right: подпись справа от таблицы.
Надпись, если она присутствует, должна описывать природу таблицы. Элемент caption должен располагаться непосредственно после начальной метки table. Например:
<table cols=”3”>

<caption>cups of coffee consumed by each senator</caption>

… остальная часть таблицы …

</table>
14.5. Группы рядов. Элементы thead, tfoot и tbody
<!element thead – o (tr+)>

<!element tfoot - o (tr+)>

<!element tbody o o (tr+) >

<!attlist (thead\|tfoot\|tbody)-- секция таблицы --
	%attrs;	-- %coreattrs, %i18n, %events --
	%CEllhalign;	-- горизонтальное выравнивание в ячейке --
	%CEllvalign;	-- вертикальное выравнивание в ячейке -- >

в приведенном ниже примере

Таблица в приведенном ниже примере имеет две группы колонок. Первая группа содержит 10 колонок, а вторая – 5 колонок. Значение ширины колонки по умолчанию для каждой из колонок в первой группе равно 50 пикселей. Для второй группы ширина колонки определяется минимально возможным значением.

<table>

<thead>

<tr> ….

</thead>

14.8. Элемент col

<!element col - o empty>

<!attlist col	-- группы колонок и свойства --
	%attrs;	-- %coreattrs, %i18n, %events --
	span number 1	-- число колонок в группе --
	width cdata #implied	-- спецификация ширин колонок --
	%CEllhalign;	-- горизонтальное выравнивание в ячейках --
	%CEllvalign;	-- вертикальное выравнивание в ячейках -- >

Определение атрибута

width = length

Этот атрибут задает значение по умолчанию для ширины колонок в группе. Атрибут может также принимать значение “0*” (смотри выше) и “i*”, где i - целое. Это называется относительной шириной. Когда агент пользователя выделяет место для таблицы, он сначала определяет габариты, а уже затем делит выделенное пространство, определяя относительные ширины рядов и колонок. Число i при этом определяет относительную долю, выделяемую данной колонке. Значение “*” эквивалентно “1*”.

Каждая группа колонок может содержать нуль или более элементов col. Элемент col не определяет группу колонок в том смысле, как это делает colgroup, он предоставляет способ задать значения атрибутов для всех колонок группы. Атрибут span элемента col имеет следующее значение.

В отсутствии декларации span каждый элемент col представляет одну колонку. Если атрибут span имеет значение n>0, текущий элемент col действует на n колонок таблицы. Если атрибут span равен нулю, текущий элемент col имеет воздействие на все оставшиеся колонки таблицы, начиная с текущей. Что же касается colgroup, атрибут width для col воздействует на ширины колонок, к которым относится этот элемент.
Если элемент cal действует на несколько колонок, тогда его атрибут width специфицирует ширину каждой колонки в его зоне ответственности.
Ниже приведен пример таблицы, имеющей две группы колонок. Первая группа содержит три колонки, вторая – две колонки. Доступное место по горизонтали определяется следующим образом. Сначала агент пользователя выделяет 30 пикселей для первой колонки. Затем будет выделено минимально возможное место для второй колонки. Оставшееся место по горизонтали будет поделено на 6 равных частей. Колонка 3 получит 2 такие порции, колонка 4 – одну, а колонка 5 получит 3.
<table>

<colgroup>

	<col width=”30”>
	<col width=”0*”>
	<col width=”2*”>

	<col width=”1*”>
	<col width=”3*” align=”char” char=”:”>

<thead>

<tr> …..

</table>
Мы установили значение атрибута align во второй группе колонок равным “center”. Все ячейки в каждой колонке этой группы наследуют это значение. Но оно может быть изменено. В действительности последний элемент col делает это, специфицируя то, что все колонки, которыми он управляет, будут выровнены по символу “:”.
14.9. Ряды таблицы. Элемент tr
<!element tr - o (th|td)+>

<!attlist tr	-- ряд таблицы --
	%attrs;	-- %coreattrs, %i18n, %events --
	%CEllhalign;	-- горизонтальное выравнивание в ячейках --
	%CEllvalign;	-- вертикальное выравнивание в ячейках --
	bgcolor %color #implied	-- цвет фона в ряду -- >

Элементы TR действуют как контейнеры рядов ячеек таблицы. Ниже приведен пример таблицы, которая имеет три ряда, каждый из которых открывается элементом TR.
<table>

<caption>cups of coffee consumed by each senator</caption>

<tr> … Ряд заголовка …

<tr> … Первый ряд данных …

<tr> … Второй ряд данных …

… остальная часть таблицы …

</table>
14.10. Ячейки таблицы. Элементы th и td
<!element (th|td) - o %block>

<!attlist (th\|td)	-- Заголовок или данные ячейки --
	%attrs;	-- %coreattrs, %i18n, %events --
	axis cdata #iplied	-- содержимое ячейки по умолчанию --
	axes cdata #iplied	-- список имен axis --
	nowrap (nowrap) #implied	-- блокирует разрыв слов --
	bgcolor %color #implied	-- цвет фона ячейки --
	rowspan number	-- число рядов, охватываемых ячейкой --
	colspan number	-- число колонок, охватываемых ячейкой --
	%CEllhalign;	-- горизонтальное выравнивание в ячейках --
	%CEllvalign;	-- вертикальное выравнивание в ячейках -- >

<

Определения атрибутов
axis = cdata
Атрибут определяет сокращенное имя заголовка ячейки. Имя ячейки по умолчанию – ее содержимое.
axes = cdata-list
Значение этого атрибута представляет собой список имен axis, разделенных запятыми. Эти имена представляют собой заголовки рядов и колонок, принадлежащих данной ячейке. В отсутствии этого атрибута агент пользователя идентифицирует эти имена сам.
rowspan = integer
Этот атрибут специфицирует число рядов в текущей ячейке. Значение этого атрибута по умолчанию равно 1. Значение нуль означает, что ячейка включает в себя все ряды, начиная с текущего, до конца таблицы.
colspan = integer
Этот атрибут специфицирует число колонок в текущей ячейке. Значение этого атрибута по умолчанию равно 1. Значение нуль означает, что ячейка включает в себя все колонки, начиная с текущей, до конца таблицы.
nowrap
Использование не рекомендуется. В случае присутствия этот булев атрибут указывает агенту пользователя заблокировать автоматический разрыв слов при выкладке их в ячейку. Вместо этого атрибута рекомендуется использовать стилевой лист.
Элемент TH запоминает заголовок, в то время как TD – данные. Это позволяет агенту пользователя обрабатывать заголовки и данные по-разному даже в отсутствии стилевого листа. Ячейки могут быть пустыми (не содержать данных). Ниже приведен пример таблицы с четырьмя колонками, имеющими заголовки.
<table>

<caption>Cups of coffee consumed by each senator</caption>

<tr> <th>name <th>Cups <th> Type of coffee <th> Suger?

<tr> <td>T. Sexton <td>10 <td>espresso <td>no

<tr> <td>J. Dinnen <td>5 <td>decaf <td>yes

… остальная часть таблицы …

</table>
Агент пользователя представит верхнюю часть данной таблицы в виде:
Cups of coffee consumed by each senator

Name	Cups	Type of coffee	Sugar
T. Sexton	10	espresso	no
J. Dinnen	5	decaf	yes

Для того чтобы сделать таблицу более выразительной, можно ввести атрибут border в элемент table.

<table border=”border”>

… остальная часть таблицы …

</table>
Тогда агент пользователя отобразит начало данной таблицы следующим образом:
Cups of coffee consumed by each senator

Name	Cups	Type of coffee	Sugar
T. Sexton	10	espresso	no
J. Dinnen	5	decaf	yes

Ячейки с этикетками
Атрибуты axis и exes предоставляют возможность снабжать ячейки таблицы этикетками (labels). Синтезаторы речи могут использовать эти этикетки для идентификации содержимого и положения каждой ячейки. Программное обеспечение может рассматривать эти этикетки как имена полей базы данных при занесении содержимого таблицы в банк данных. Ниже представлен пример таблицы, где значение атрибута axis представляет собой фамилию сенатора.
<table border=”border”>

<caption>Caps of coffee consumed by each senator</caption>

<tr> <th>Name <th>Cups <th> Type of coffee <th> suger?

<tr> <td axis=”sexton” exes=”name”>T. Sexton <td>10

<td>espresso <td>no

<tr> <td axis=”dinnen” exes=”name”>J. Dinnen <td>5 <td>decaf <td>yes

</table>
14.11. Ячейки, которые занимают несколько рядов или колонок
Ячейки могут охватывать несколько рядов или колонок. Число рядов или колонок в ячейке определяется атрибутами rowspan и colspan для соответственно TH или TD-элементов. В таблице, которая была описана, ячейка в ряду 4 вторая колонка должна занимать три колонки, включая текущий ряд.
<table border=”border”>

<caption>Caps of coffee consumed by each senator</caption>

<tr> <th>Name <th>Cups <th> Type of coffee <th> suger?

<tr> <td>T. Sexton <td>10 <td>espresso <td>no

<tr> <td>J. dinnen <td>5 <td>decaf <td>yes

<tr> <td>A. Soria <td colspan=”3”<em>not available</em>

</table>
Эта таблица будет развернута визуальным агентом пользователя как:

Caps of coffee consumed by each senator

Name	Cups	Type of coffee	Suger?
T. Sexton	10	espresso	no
J. Dinnen	5	decaf	yes
A. Soria	not available

Этот пример иллюстрирует как описания ячеек, которые распространяются более чем на один ряд или колонку, влияет на определение последующих ячеек. Рассмотрим следующее описание таблицы.
<table border=”border”>

<tr> <td>1 <td rowspan=”2”>2 <td>3

<tr> <td>4 <td>6

<tr> <td>7 <td>8 <td>9

</table>

Transformation applied (применено преобразование)

14 Transformation applied (применено преобразование)

Должно добавляться промежуточным кэшем или прокси, если он использует какое-либо преобразование, изменяющее кодировку содержимого (как это специфицировано в заголовке Content-Encoding) или тип среды (как это описано в заголовке Content-Type) отклика, если только этот код предупреждения не присутствует уже в отклике.

UA – агент пользователя

Рисунок 4.5.6.1.3. UA – агент пользователя

На рисунке показаны три промежуточные ступени (A, B, и C) между агентом пользователя (UA) и базовым сервером (O). Запрос или отклик, двигаясь по этой цепочке, должен пройти четыре различных соединительных сегмента. Это обстоятельство крайне важно, так как некоторые опции HTTP применимы только для ближайших соединений. Хотя схема линейна, на практике узлы могут участвовать в большом числе других взаимодействий. Например, B может получать запросы от большого числа клиентов помимо A, и переадресовывать запросы к другим серверам кроме C.

Любой участник обмена, который не используется в качестве туннеля, может воспользоваться кэшем для запоминания запросов. Буфер может сократить длину цепочки в том случае, если у одного из участников процесса имеется в буфере отклик для конкретного запроса, что может, кроме прочего, заметно снизить требования к пропускной способности канала. Не все запросы могут записываться в кэш, некоторые из них могут содержать модификаторы работы с кэшем.

В действительности имеется широкое разнообразие архитектур и конфигураций буферных запоминающих устройств и прокси, разрабатываемых в настоящее время или уже доступных через World Wide Web. Эти системы включают иерархии прокси-серверов национального масштаба, задачей которых является сокращение трансокеанского трафика, системы, которые обслуживают широковещательные и мультикастинговые обмены, организации, распространяющие фрагменты информации с CD-ROM, занесенной в кэши и т. д.. HTTP-системы, используются в корпоративных сетях Интранет с большими пропускными способностями и перемежающимися соединениями. Целью HTTP/1.1 является поддержка широкого разнообразия уже существующих систем и расширение возможностей будущих приложений в отношении надежности и адаптируемости.

Коммуникации HTTP обычно реализуются через соединения TCP/IP. Порт по умолчанию имеет номер 80, но и другие номера портов вполне допустимы. Это не исключает использования HTTP поверх любого другого протокола в Интернет, или других сетей.
HTTP предполагает надежное соединение; применим любой протокол, который может гарантировать корректную доставку сообщений.

В HTTP/1.0, большинство приложений используют новое соединение для каждого обмена запрос/отклик. В HTTP/1.1, соединение может быть использовано для одного или более обменов запрос/отклик, хотя соединение может быть разорвано по самым разным причинам.

4.5.6.1.1. Соглашения по нотации и общая грамматика

1.1. Расширенные BNF

Все механизмы, специфицированные в данном документе, описаны с использованием обычного текста и расширенных форм Бахуса-Наура BNF (Backus-Naur Form; см. RFC 822). Пользователи должны быть знакомы с этой нотацией для понимания данной спецификации. Расширение BNF включает в себя следующие конструкции:

name = definition

Имя правила не требует помещения в угловые скобки. Некоторые базовые правила записываются прописными буквами, например, SP, LWS, HT, CRLF, DIGIT, ALPHA и пр.

"literal"

Двойные кавычки используются для выделения символьного текста.

rule1 | rule2

Элементы, разделенные вертикальной чертой, ("|") являются альтернативными, например, "yes | no" допускает yes или no (да или нет).

(rule1 rule2)

Элементы, помещенные в круглые скобки, рассматриваются как один элемент. Так, "(elem (foo | bar) elem)" допускают последовательности "elem foo elem" и "elem bar elem".

*rule

Символ "*", предшествующий элементу, указывает на повторение. Полная форма "*element" указывает как минимум на и как максимум повторений элемента. Значения по умолчанию равны 0 и бесконечности, так что "*( элемент)" позволяет любое число, включая ноль; "1*element" требует по меньшей мере один; а "1*2element" допускает один или два.

[rule]

В квадратные скобки заключаются опционные элементы; "[foo bar]" эквивалентно "*1(foo bar)".

N rule

Специальный повтор: "(элемент)" эквивалентно "*(элемент)"; то есть, точно (element).

Таким образом, 2DIGIT является 2-значным числом, а 3ALPHA представляет собой строку из трех буквенных символов.

#rule

Конструкция "#" определена подобно "*", для описания списка элементов. Полная форма имеет вид "#element ", отмечая, по меньшей мере и по большей элементов, отделенных друг от друга одной или более запятыми (",") и опционно строчным пробелом (LWS – Linear White Space). Это делает обычную форму списков очень простой. Запись "( *LWS элемент *( *LWS "," *LWS элемент)) " может быть представлена как "1#element". Всюду, где используется эта конструкция, допускаются нулевые элементы, но они не учитываются при подсчете элементов. То есть, допускается запись "(элемент), (элемент) ", но число элементов при этом считается равным двум. Следовательно, там, где необходим хотя бы один элемент, должен присутствовать, по крайней мере, один ненулевой элемент. Значениями по умолчанию являются 0 и бесконечность, таким образом "#элемент" позволяет любое число, включая нуль; "1#элемент" требует, по меньшей мере один, а "1#2элемент" допускает один или два.

; комментарий

Точка с запятой, смещенная вправо от линейки текста, открывает комментарий, который продолжается до конца строки. Это простой способ включения замечаний в текст спецификаций.

implied *LWS

Грамматика, описанная в данной спецификации, ориентирована на слова. Если не оговорено обратное, строчный пробел (LWS) может быть заключен между любыми двумя соседними словами (лексема или заключенная в кавычки строка), и между смежными лексемами (token) и разделителями (TSpecials) без изменения интерпретации поля. По крайней мере один разграничитель (TSpecials) должен присутствовать между любыми двумя лексемами, так как они иначе будут интерпретироваться как одна.

1.2. Основные правила

Следующие правила используются практически во всей спецификации для описания основных конструкций разбора (парсинга).

OCTET	=
CHAR	=
UPALPHA	=
LOALPHA	= < любая строчная буква US-ASCII "a".."z">
ALPHA	= UPALPHA \| LOALPHA (строчная или прописная буква)
DIGIT	=
CTL	=
CR	=
LF	=
SP	=
HT	=
	=

<

/p> HTTP/1. 1 определяет последовательность CR LF, как маркер конца для всех протокольных элементов, за исключением тела элемента. Маркер конца строки в пределах тела объекта определен соответствующим типом среды.

CRLF

= CR LF

HTTP/1.1 заголовки могут занимать несколько строк, если продолжение строки начинается с пробела или символа горизонтальной табуляции. Все строчные пробелы имеют ту же семантику, что и обычный пробел (SP).

LWS	= [CRLF] 1*( SP \| HT )

Правило TEXT используется только для содержимого описательных полей и значений, которые не предполагается передавать интерпретатору сообщений. Слова *TEXT могут содержать символы из символьного набора, не совпадающего с ISO 8859-1 [22], только когда они закодированы согласно правилам RFC-1522 [14].

TEXT

В некоторых протокольных элементах используются шестнадцатеричные цифровые символы.

HEX	= "A" \| "B" \| "C" \| "D" \| "E" \| "F" \| "a" \| "b" \| "c" \| "d" \| "e" \| "f" \| DIGIT

Многие значения полей заголовков HTTP/1.1 состоят из слов, разделенных LWS или специальными символами. Эти специальные символы должны представлять собой строки, заключенные в кавычки, чтобы использоваться в качестве значения параметра.

Token	= 1*
Tspecials	= "(" \| ")" \| "" \| "@"
	\| "," \| ";" \| ":" \| "\" \|
	\| "/" \| "[" \| "]" \| "?" \| "="
	\| "{" \| "}" \| SP \| HT

Комментарии могут быть включены в некоторые поля HTTP заголовков, при этом текст комментария заключается в скобки. Комментарии допустимы только для полей, содержащих "comment", как часть описания поля. В других полях скобки рассматриваются как элемент содержимого поля.

Комментарий	= "(" *( ctext \| комментарий) ")"
ctext	=

Строка текста воспринимается как одно слово, если она помещена в двойные кавычки.

quoted-string	= ( *(qdtext) )
qdtext	= >

Символ обратная косая черта ("\") может использоваться вместо кавычки внутри закавыченного текста или в структурах комментариев.

quoted-pair

= "\" CHAR

4.5.6.1.2. Параметры протокола

2.1. Версия HTTP

HTTP использует схему нумерации "." для отображения версии протокола. Политика присвоения версии протоколу ориентирована на то, чтобы позволить отправителю указать формат сообщения и его емкость. Номер версии не меняется при добавлении компонент сообщения, которые не влияют на характер обмена.

Число увеличивается, когда в протокол внесены изменения, которые не изменили общий алгоритм разбора сообщений, но которые изменили семантику сообщений и добавили новые возможности отправителю. Число увеличивается в случае, когда изменен формат протокольного сообщения.

Версия HTTP-сообщения указывается в поле HTTP-Version в первой строке сообщения.

HTTP	Version = "HTTP" "/" 1DIGIT "." 1DIGIT

Заметьте, что числа major и minor должны рассматриваться как независимые целые, так что каждое из них может быть увеличено за пределы одной цифры. Таким образом, HTTP/2.4 является более низкой версией, чем HTTP/2.13, которая в свою очередь ниже, чем HTTP/12.3. Начальные нули должны игнорироваться и не пересылаться

Приложения, посылающие запросы или отклики, так как это определено в спецификации, должны включать HTTP-Version "HTTP/1.1". Использование этого номера версии указывает, что посылающее приложение совместимо с этой спецификацией.

Версия HTTP приложения является верхней, совместимость с которой гарантируется. Приложения прокси-серверов и сетевых портов должны проявлять осторожность при переадресации сообщений с протокольной версией, отличной от поддерживаемой ими. Так как версия протокола указывает на возможности отправителя, прокси никогда не должны пересылать сообщения с версией больше, чем их собственная; если получено сообщение более высокой версии, прокси/порт должен либо понизить версию запроса, либо послать отклик об ошибке или переключиться в режим туннеля.

Запросы с версией ниже, чем у прокси/ порта могут быть повышены при переадресации, при этом major часть версии сервера и запроса должны совпадать.

Замечание: Преобразование между версиями может включать модификацию полей заголовка.

2.2. Универсальные идентификаторы ресурсов (URI)

URI известен под многими именами: WWW адрес, универсальный идентификатор документа (Universal Document Identifiers), универсальный идентификатор ресурса (Universal Resource Identifiers), и, наконец, универсальный локатор ресурса URL (Uniform Resource Locators; тождество URI и URL сомнительно, так как URL является частным случаем URI (примечание переводчика)) и универсальное имя ресурса (URN). Что касается HTTP, универсальный идентификатор ресурса представляет собой форматированную строку символов, которая идентифицирует имя, положение или какие-то еще характеристики ресурса.

2.2.1. Общий синтаксис

URI в HTTP может быть представлен в абсолютной или относительной форме по отношению к некоторому известному базовому URI, в зависимости от контекста его использования. Эти две формы отличаются тем, что абсолютный URI всегда начинается с имени схемы, за которым следует двоеточие (например HTTP: или FTP:).

URI	= ( absoluteURI \| relativeURI ) [ "#" фрагмент ]
AbsoluteURI	= схема ":" *( uchar \| reserved )
RelativeURI	= net_path \| abs_path \| rel_path
net_path	= "//" net_loc [ abs_path ]
abs_path	= "/" rel_path
rel_path	= [ проход ] [ ";" params ] [ "?" query ]
path	= fsegment *( "/" сегмент )
fsegment	= 1*pchar
segment	= *pchar
params	= param *( ";" param )
param	= *( pchar \| "/" )
scheme	= 1*( ALPHA \| DIGIT \| "+" \| "-" \| "." )
net_loc	= *( pchar \| ";" \| "?" )
query	= *( uchar \| reserved )
fragment	= *( uchar \| reserved )
pchar	= uchar \| ":" \| "@" \| "&" \| "=" \| "+"
uchar	= unreserved \| escape
unreserved	= ALPHA \| DIGIT \| safe \| extra \| national
escape	= "%" HEX HEX
reserved	= ";" \| "/" \| "?" \| ":" \| "@" \| "&" \| "=" \| "+"
extra	= "!" \| "*" \| "'" \| "(" \| ")" \| ","
safe	= "$" \| "-" \| "_" \| "."
unsafe	= CTL \| SP \| \| "#" \| "%" \| ""
national	=

<

/p> Более детальную информацию о синтаксисе и семантике URL можно найти в RFC-1738 [4] и RFC-1808 [11]. Приведенные выше BNF включают в себя национальные символы, недопустимые в URL, так как это специфицировано в RFC 1738, так как серверам HTTP не запрещено использование любых наборов символов, допустимых в rel_path частях адресов, HTTP-прокси могут получить запросы URI, не определенные в рамках RFC-1738.

Протокол HTTP не устанавливает каких-либо ограничений на длину URI. Серверы должны быть способны обрабатывать URI любых ресурсов, имеющих любую длину. Сервер должен выдать отклик 414 (Request-URI Too Long – URI запроса слишком длинен), если URI длиннее, чем может обработать сервер (см. раздел 9.4.15).

Замечание: Серверы должны избегать использования URI длиннее 255 байт, так как некоторые старые клиенты или прокси-приложения не могут корректно работать с такими длинами.

2.2.2. HTTP URL

Схема "HTTP" используется для локализации сетевых ресурсов с помощью протокола HTTP. Далее определены синтаксис и семантика HTTP URL, зависящие от схемы.

http_URL	= "http:" "//" host [ ":" port ] [ abs_path ]
host	=
port	= *DIGIT

Если номер порта не указан, предполагается порт 80. Семантика устроена так, что идентифицированный ресурс размещается на сервере, который ожидает TCP-соединения через порт данной ЭВМ, а Request-URI для ресурса находится в abs_path. Использование IP адресов в URL следует избегать всюду, где это возможно (см. RFC-1900 [24]). Если abs_path в URL отсутствует, он должен считаться равным "/", в случае, если он используется в качестве Request-URI для ресурса (раздел 4.1.2).

2.2.3. Сравнение URI

При сравнении двух URI с целью проверки их идентичности, клиент должен использовать по октетное сравнение с учетом регистра, в котором напечатаны символы. Допускаются следующие исключения:

Номер порта не указан, тогда для данного URI берется значение по умолчанию;

Сравнение имен ЭВМ и схем не должно быть чувствительным к строчным/прописным буквам;

Пустой abs_path эквивалентен abs_path "/".

Символы, отличные от типов "reserved" и "unsafe" устанавливаются равными их эквивалентам в кодировке ""%" HEX HEX".

Например, следующие три URI являются эквивалентными:

http://abc.com:80/~smith/home.html

http://ABC.com/%7Esmith/home.html

http://ABC.com:/%7Esmith/home.html

3.3. Форматы даты/времени

3.3.1. Полная дата

HTTP приложения допускают три различных формата для представления метки времени и даты:

Sun, 06 Nov 1994 08:49:37 GMT ; RFC-822, актуализировано в RFC-1123

Sunday, 06-Nov-94 08:49:37 GMT ; RFC-850, объявлено устаревшим в RFC-1036

Sun Nov 6 08:49:37 1994 ; ANSI C's ASCtime() format

Первый формат предпочтительнее, как стандарт Интернет и представляет собой форму фиксированной длины, определенную RFC-1123. Второй формат используется достаточно широко, но базируется на устаревшем документе RFC-850 [12], формат даты не имеет 4 цифр года. Клиенты и серверы HTTP/1.1, которые анализируют дату, должны уметь работать со всеми тремя форматами (для совместимости с HTTP/1.0), хотя они должны сами генерировать время/дату согласно формату RFC-1123.

Замечание: Получатели значений даты должны быть готовы принять коды, которые посланы не приложениями HTTP, что случается, когда данные поступают через прокси/порты или по почте в SMTP- или NNTP-форматах.

Все марки времени/даты HTTP должны соответствовать времени по Гринвичу (GMT). Это указано в первых двух форматах путем включения строки "GMT" и должно предполагаться во всех прочих случаях.

HTTP-date	= RFC-1123-date \| rRFC-850-date \| asctime-date
RFC-1123-date	= wkday "," SP date1 SP time SP "GMT"
RFC-850-date	= weekday "," SP date2 SP time SP "GMT"
asctime-date	= wkday SP date3 SP time SP 4DIGIT
date1	= 2DIGIT SP month SP 4DIGIT	; day month year (e.g., 02 Jun 1982)
date2	= 2DIGIT "-" month "-" 2DIGIT	; day-month-year (e.g., 02-Jun-82)
date3	= month SP ( 2DIGIT \| ( SP 1DIGIT ))	; month day (e.g., Jun 2)
time	= 2DIGIT ":" 2DIGIT ":" 2DIGIT	; 00:00:00 - 23:59:59
wkday	= "Mon" \| "Tue" \| "Wed" \| "Thu" \| "Fri" \| "Sat" \| "Sun"
weekday	= "Monday" \| "Tuesday" \| "Wednesday" \| "Thursday" \| "Friday" \| "Saturday" \| "Sunday"
month	= "Jan" \| "Feb" \| "Mar" \| "Apr" \| "May" \| "Jun" \| "Jul" \| "Aug" \| "Sep" \| "Oct" \| "Nov" \| "Dec"

Transfer-coding	= "chunked" \| transfer-extension
Transfer-extension	= token

Все значения транспортного кодирования не зависят от того, строчные или прописные буквы здесь использованы. HTTP/1.1 несет значения транспортного кодирования в поле заголовка Transfer-Encoding (раздел 13.40).

Транспортные кодировки аналогичны используемым значениям Content-Transfer-Encoding MIME, которые были введены для обеспечения безопасной передачи двоичных данных через 7-битную транспортную среду. Однако безопасная транспортировка имеет другие аспекты в рамках 8-битного протокола передачи сообщений. В HTTP, единственной небезопасной характеристикой тела сообщения является неопределенность его длины (раздел 6.2.2), или желание зашифровать данные при передаче по общему каналу.

Блочное кодирование фрагментов модифицирует тело сообщения для того, чтобы передать его в виде последовательности пакетов, каждый со своим индикатором размера, за которым следует опционная завершающая запись (footer), содержащая поля заголовка объекта. Это позволяет передать динамически сформированное содержимое, снабдив его необходимой информацией для получателя, который, в конце концов, сможет восстановить все сообщение.

Chunked	Body = *chunk "0" CRLF footer CRLF
Chunk	= chunk-size [ chunk-ext ] CRLF chunk-data CRLF
Hex-no-zero	=
Chunk-size	= hex-no-zero *HEX
Chunk-ext	= *( ";" chunk-ext-name [ "=" chunk-ext-value ] )
Chunk-ext-name	= token
Chunk-ext-val	= token \| quoted-string
Chunk-data	= chunk-size(OCTET)
footer	= *entity-header

<

/p> Блочное кодирование фрагментов завершается пакетом нулевой длины, за которыми следует завершающая запись и пустая строка. Назначение завершающей записи заключается в том, чтобы дать информацию о динамически сформированном объекте; приложения не должны пересылать поля заголовка в завершающей записи, кроме тех, которые специально оговорены, например, такие как Content-MD5 или будущие расширения HTTP для цифровой подписи. Пример процесса такого кодирования представлен в приложении 16.4.6.

Все приложения HTTP/1.1 должны быть способны получать и декодировать получаемые фрагменты ("chunked"-кодирование), и должны игнорировать расширения транспортного кодирования, которые они не понимают. Сервер, получающий тело объекта с транспортной кодировкой, которую он не понимает, должен отослать отклик c кодом 501 (Unimplemented – не применимо), и закрыть соединение. Сервер не должен использовать транспортное кодирование при посылке данных клиенту HTTP/1.0.

2.7. Типы среды

HTTP использует типы среды Интернет (Internet Media Types) в полях заголовка Content-Type (раздел 13.18) и Accept (раздел 13.1) для того, чтобы обеспечить широкий и открытый обмен с самыми разными типа среды.

Media-type	= type "/" subtype *( ";" parameter )
type	= token
subtype	= token

Параметры могут следовать за type/subtype в форме пар атрибут/значение.

Parameter	= attribute "=" value
	attribute	= token
	value	= token \| quoted-string

Имена типа, субтипа и атрибутов параметра могут набираться, как строчными, так и прописными буквами. Значения параметров могут быть и чувствительны к используемому регистру, в зависимости от семантики и имени параметра. Строчный пробел (LWS) не должен использоваться ни между типом и субтипом, ни между атрибутом и значением. Агенты пользователя, которые распознают тип среды, должны обрабатывать (или обеспечить обработку с использованием внешнего приложения для работы агента пользователя с типом/субтипом) параметры для типа MIME так, как это описано для данного типа/субтипа, и информировать пользователя о любых возникающих проблемах.

Замечание. Некоторые старые приложения HTTP не узнают параметры типа среды. При посылке данных старому HTTP-приложению, программы должны использовать параметры типа среды, только когда они необходимы по описанию типа/субтипа. Значения типа среды регистрируются IANA (Internet Assigned Number Authority). Процесс регистрации типа среды описан в RFC 2048 [17]. Использование незарегистрированных типов среды настоятельно не рекомендуется.

2.7.1. Канонизация и текст по умолчанию

Типы среды Интернет регистрируются каноническим образом. Вообще, тело объекта, передаваемого с помощью HTTP сообщений, должно быть представлено соответствующим каноническим способом, прежде чем будет послано, исключение составляет тип "text", как это описано в следующем параграфе.

В случае канонической формы субтип среды "text" использует CRLF для завершения строки текста. HTTP ослабляет это требование и позволяет передавать текст, используя просто CR или LF, представляющие разрыв строки. HTTP приложения должны воспринимать CRLF, “голое” CR и LF как завершение строки для текстовой среды полученной через HTTP. Кроме того, если текст представлен в символьном наборе, где нет октетов 13 и 10 для CR и LF соответственно, как это имеет место в случае мультибайтных символьных наборов, HTTP позволяет использовать соответствующие символьные представления для CR и LF. Эта гибкость в отношении разрыва строк относится только к текстовой среде в теле объекта; CR или LF не должны подставляться вместо CRLF в любые управляющие структуры HTTP (такие как поля заголовка).

Если тело объекта закодировано с помощью Content-Encoding, исходные данные, прежде чем подвергнуться кодированию должны были иметь форму, указанную выше.

Параметр "charset" используется с некоторыми типами среды, чтобы определить символьный набор (раздел 2.4). Когда параметр charset не задан отправителем явно, субтип среды "text" определяется так, что используется символьный набор по умолчанию "ISO-8859-1".

Данные с набором символов, отличным от "ISO-8859-1" или его субнабора, должны помечаться соответствующим значением charset.

Некоторые программы HTTP/1.0 интерпретируют заголовок Content-Type без параметра charset, неправильно предполагая, что "получатель должен решить сам, какой это набор". Отправители, желающие заблокировать такое поведение, могут включать параметр charset, даже когда charset равен ISO-8859-1 и должны делать так, когда известно, что это не запутает получателя.

К сожалению, некоторые старые HTTP/1.0 клиенты не обрабатывают корректно параметр charset. HTTP/1.1 получатели должны учитывать метку charset, присланную отправителем, и те агенты пользователя, которые умеют делать предположение относительно символьного набора, должны использовать символьный набор из поля content-type, если они поддерживают этот набор, а не набор, предпочитаемый получателем.

2.7.2. Составные типы

MIME обеспечивает нескольких составных типов – инкапсуляция одного или более объектов в общее тело сообщения. Все составные типы имеют общий синтаксис, как это определено в MIME [7], и должны включать граничный параметр, являющийся частью значения типа среды. Тело сообщения является само протокольным элементом и, следовательно, должно использовать только CRLF для обозначения разрывов строки. В отличии от MIME, завершающая часть любого составного cообщения должна быть пустой. HTTP приложения не должны передавать завершающую часть (даже если исходное составное сообщение содержит такую завершающую часть (эпилог-подпись).

В HTTP, составляющие части тела могут содержать поля заголовка, которые существенны для значения этих частей. Рекомендуется, чтобы поле заголовка Content-Location (раздел 13.15) было включено в часть тела каждого вложенного объекта, который может быть идентифицирован URL.

Вообще, рекомендуется, чтобы агент пользователя HTTP имел идентичное или схожее поведение с агентом пользователя MIME при получении составного типа. Если приложение получает неузнаваемый составной субтип, оно должно обрабатывать его также как "multipart/mixed".

Замечание: Тип "multipart/form-data" специально определен для переноса данных совместимого с методом обработки почтовых запросов, как это описано в RFC 1867 [15].

2.8. Лексемы (token) продукта

Лексемы продукта служат для того, чтобы позволить взаимодействующим приложениям идентифицировать себя с помощью имени и версии программного продукта. Большинство полей, использующих лексемы продукта допускают также включение в список субпродуктов, которые образуют существенную часть приложения, их лексемы отделяются пробелом. По договоренности, продукты перечисляются в порядке их важности для идентификации приложения.

Product	= token ["/" product-version]
Product-version	= token

Примеры:

User-Agent: CERN-LineMode/2.15 libwww/2.17b3

Server: Apache/0.8.4

Лексемы продукта должны быть короткими и, кроме того, использование их для оповещения или передачи маловажной информации абсолютно запрещено. Хотя любой символ лексемы может присутствовать в версии продукта, рекомендуется, чтобы эта лексема использовалась только для идентификации версии (то есть, последовательные версии одного и того же продукта должны отличаться только в части версии продукта).

2.9. Значения качества (Quality values)

HTTP согласование параметров содержимого (раздел 12) использует короткие числа с плавающей запятой для указания относительной важности (веса) различных согласуемых параметров. Вес нормализуется на истинное число в диапазоне 0 - 1, где 0 равен минимальному, а 1 максимальному значению. Приложения HTTP/1.1 не должны генерировать более трех чисел после запятой. Рекомендуется, чтобы конфигурация пользователя для этих значений удовлетворяла тем же ограничениям.

qvalue = ( "0" [ "." 0*3DIGIT ] ) | ( "1" [ "." 0*3("0") ] )

"Quality values" (значения качества) является неверным названием, так как эти значения в большей степени отражают относительную деградацию желательного качества.

2.10. Языковые метки

Языковая метка идентифицирует естественный язык.

Компьютерные языки в этот перечень не входят. HTTP использует языковые метки в полях Accept-Language и Content-Language.

Синтаксис и регистр языковых меток HTTP тот же, что и определенный в RFC 1766 [1]. Языковая метка содержит одну или более частей: первичная языковая метка и последовательность субметок, которая может и отсутствовать:

language-tag	= primary-tag *( "-" sub-tag )
primary-tag	= 1*8ALPHA
sub-tag	= 1*8ALPHA

Пробел не допустим в метке, применение строчных и прописных букв не играет никакой роли. Перечень языковых меток контролируется IANA. Ниже приведены примеры языковых меток:

en, en-US, en-cockney, i-cherokee, x-pig-latin

где любые две буквы первичной метки представляют собой языковую аббревиатуру ISO 639 и две буквы исходной субметки соответствуют коду страны ISO 3166 (последние три метки не являются зарегистрированными; все кроме последней могут быть зарегистрированы в будущем).

2.11. Метки объектов

Метки объектов служат для сравнения двух или более объектов из одного и того же запрошенного ресурса. HTTP/1.1 использует метки объектов в полях заголовков ETag (раздел 13.20), If-Match (раздел 13.25), If-None-Match (раздел 13.26) и If-Range (раздел 13.27). Метки объекта состоят из строк, заключенных в кавычки, перед ней может размещаться индикатор слабости.

entity-tag	= [ weak ] opaque-tag
Weak	= "W/"
opaque-tag	= quoted-string

"Сильная метка объекта" (strong entity tag) может принадлежать двум объектам ресурса, если они эквивалентны на октетном уровне.

"Слабая метка объекта " (weak entity tag) отмечается префиксом "W/", может относиться к двум объектам ресурса, только если объекты эквивалентны и могут быть взаимозаменяемы. Слабая метка объекта может использоваться для "слабого" сравнения.

Метка объекта должна быть уникальной для всех версий всех объектов, сопряженных с конкретным ресурсом. Значение данной метки объекта может использоваться для объектов, полученных в результате запросов для различных URI без использования данных об эквивалентности этих объектов.

2.12. Структурные единицы

HTTP/1. 1 позволяет клиенту запросить только часть объекта (диапазон). HTTP/1.1 использует структурные единицы, определяющие выделение части объекта, в полях заголовка Range (раздел 13.36) и Content-Range (раздел 13.17). Объект может быть разбит на фрагменты с использованием различных структурных единиц.

range-unit	= bytesunit \| other-range-unit
bytes-unit	= "bytes"
other-range-unit	= token

Message-header	= field-name ":" [ field-value ] CRLF
field-name	= token
field-value	= *( field-content \| LWS )

general-header	= Cache-Control	; Раздел 13.9
	\| Connection	; Раздел 13.10
	\| Date	; Раздел 13.19
	\| Pragma	; Раздел 13.32
	\| Transfer-Encoding	; Раздел 13.40
	\| Upgrade	; Раздел 13.41
	\| Via	; Раздел 13.44

<

/p> Имена полей общего заголовка могут быть расширены только при изменении версии протокола. Однако, новые или экспериментальные поля заголовка могут использоваться при условии, если партнеры обмена способны их распознавать, как поля общего заголовка. Не узнанные поля заголовка считаются полями заголовка объекта (entity).

4.5.6.1.4. Запрос

Сообщение-запрос от клиента к серверу включает в себя, в пределах первой строки сообщения, метод, который должен быть использован для ресурса, идентификатор ресурса и код версии используемого протокола.

Request	= Request-Line
	*( generalheader
	\| requestheader
	\| entityheader )
	CRLF
	[ messagebody ]

4.1. Строка запроса

Строка запроса начинается с лексемы метода, за которой следует Request-URI, версия протокола, завершается строка последовательностью CRLF. Элементы разделяются символами SP. Символы CR или LF запрещены кроме завершающей последовательности CRLF.

Request

Line = Method SP Request-URI SP HTTP-Version CRLF

4.1.1. Метод

Лексема Method указывает на метод, который должен быть применен к ресурсу, обозначенному Request-URI. При записи метода использование строчных или прописных букв не безразлично.

Method	= "OPTIONS"	; Раздел 9.2
	\| "GET"	; Раздел 9.3
	\| "HEAD"	; Раздел 9.4
	\| "POST"	; Раздел 9.5
	\| "PUT"	; Раздел 9.6
	\| "DELETE"	; Раздел 9.7
	\| "TRACE"	; Раздел 9.8
	\| extension-method extension-method = token

Список методов допустимых для ресурса может быть специфицирован полем заголовка Allow (раздел 13.7). Возвращаемый код отклика всегда оповещает клиента, допустим ли метод для ресурса, так как набор допустимых методов может меняться динамически. Серверам рекомендуется возвращать статусный код 405 (Метод не допустим), если метод известен серверу, но не приемлем для запрашиваемого ресурса и 501 (Не применим), если метод не узнан или не приемлем для сервера. Список методов, известных серверу может быть представлен в поле заголовка отклика Public (раздел 13.35).

Методы GET и HEAD должны поддерживаться всеми серверами общего назначения. Все другие методы являются опционными; однако, если применены вышеназванные методы, они должны быть применены с той же семантикой, что специфицирована в разделе 8.

5.1.2 URI запроса

URI запроса является универсальным идентификатором ресурса (раздел 2.2) и идентифицирует ресурс, который запрашивается.

Request-URI = "*" | absoluteURI | abs_path

Три опции для Request-URI зависят от природы запроса. Звездочка "*" означает, что запрос приложим не к заданному ресурсу, но к самому серверу, и допустим только, когда используемый метод не обязательно приложим к ресурсу. Примером может служить

OPTIONS * HTTP/1.1

Форма абсолютного URI необходима, когда запрос адресован к прокси-серверу. Прокси-серверу посылается запрос переадресации с целью получения отклика. Заметьте, что прокси может переадресовать запрос другому прокси или серверу, указанному абсолютным URI. Для того, чтобы избежать петель запросов прокси-сервер должен быть способен распознавать все имена серверов, включая любые псевдонимы, локальные вариации и численные IP-адреса. Пример строки запроса представлен ниже:

GET http://www.w3.org/pub/WWW/TheProject.html HTTP/1.1

Для того чтобы разрешить передачу абсолютных URI в запросах будущих версий HTTP, все серверы HTTP/1.1 должны уметь работать с запросами абсолютных форм URI.

Наиболее общей формой Request-URI является та, которая используется для идентификации ресурса на исходном сервере или внешнем порту сети. В этом случае абсолютный проход к URI должен быть занесен в abs_path (см. раздел 2.2.1) как Request-URI, а сетевой адрес URI (net_loc) должен быть занесен в поле заголовка Host. Например, клиент, желающий извлечь ресурс из выше приведенного примера непосредственно с базового сервера, установит TCP-соединение через порт 80 с ЭВМ "www.w3.org" и пошлет строки:

GET /pub/WWW/TheProject.html HTTP/1.1

Host: www.w3.org

за которыми следует остальная часть запроса.

Заметьте, что абсолютный проход не может быть пустым; если его нет в исходном URI, он должен быть задан в виде "/" (корневой каталог сервера).

Если прокси получает запрос без какого-либо прохода в Request-URI, а метод, специфицирован так, чтобы быть способным поддерживать форму “*” запросов, тогда последний прокси в цепочке запроса должен переадресовать запрос с "*" в качестве финального Request-URI. Например, запрос

OPTIONS http://www.ics.uci.edu:8001 HTTP/1.1

будет переадресован прокси как

OPTIONS * HTTP/1.1

Host: www.ics.uci.edu:8001

после подключения к порту 8001 ЭВМ "www.ics.uci.edu".

Request-URI передается в формате, описанном в разделе 3.2.1. Исходный сервер должен декодировать Request-URI, для того чтобы правильно интерпретировать запрос. Серверам рекомендуется откликаться на некорректный запрос Request-URI соответствующим статусным кодом.

В запросах, которые они переадресуют, прокси-серверы не должны переписывать "abs_path" часть Request-URI каким-либо способом, за исключением случая, описанного выше, когда нулевой abs_path заменяется на "*".

Замечание: Правило "no rewrite" препятствует прокси изменить смысл запроса, когда исходный сервер некорректно использует незарезервированный URL символ для зарезервированных целей. Следует остерегаться того, что некоторые предшествующие варианты прокси-серверов HTTP/1.1 допускали перезапись Request-URI.

4.2. Ресурс, идентифицируемый запросом

Исходному серверу HTTP/1.1 рекомендуется заботиться о точном определении ресурса, идентифицированного Интернет-запросом путем анализа Request-URI и поля заголовка Host.

Исходный сервер, который не разделяет ресурсы по запрашиваемого ЭВМ, может игнорировать значение поля заголовка Host. (См. раздел 16.5.1 по поводу других требований по поддержке Host в HTTP/1.1.)

Исходный сервер, который различает ресурсы с использованием имени ЭВМ, должен использовать следующие правила для определения ресурса в запросе HTTP/1.1:

Если Request- URI является absoluteURI, ЭВМ определена частью Request-URI. Любое значение поля заголовка Host в запросе должно игнорироваться.

Если Request-URI не является absoluteURI, а запрос содержит поле заголовка Host, ЭВМ определяется значением поля заголовка Host.

Если ЭВМ, так как это определено правилами 1 или 2, не является ЭВМ сервера, откликом должно быть сообщение об ошибке с кодом 400 (Плохой запрос - Bad Request).

Получатели HTTP/1.0-запроса, где отсутствует поле заголовка Host, могут попытаться использовать эвристику (напр., рассмотрение прохода URI на предмет уникальной конкретной ЭВМ) для того, чтобы определить, какой конкретный ресурс запрошен.

4.3. Поля заголовка запроса

Поля заголовка запроса позволяют клиенту передавать серверу дополнительную информацию о запросе и о самом клиенте. Эти поля действуют как модификаторы запроса, с семантикой, эквивалентной параметрам, характеризующими метод языка программирования.

Request-header	= Accept	; Раздел 13.1
	\| Accept-Charset	; Раздел 13.2
	\| Accept-Encoding	; Раздел 13.3
	\| Accept-Language	; Раздел 13.4
	\| Authorization	; Раздел 13.8
	\| From	; Раздел 13.22
	\| Host	; Раздел 13.23
	\| If-Modified-Since	; Раздел 13.24
	\| If-Match	; Раздел 13.25
	\| If-None-Match	; Раздел 13.26
	\| If-Range	; Раздел 13.27
	\| If-Unmodified-Since	; Раздел 13.28
	\| Max-Forwards	; Раздел 13.31
	\| Proxy-Authorization	; Раздел 13.34
	\| Range	; Раздел 13.36
	\| Referer	; Раздел 13.37
	\| User-Agent	; Раздел 13.42

Поля имен заголовка запроса могут быть безопасно расширены в сочетании с изменением версии протокола. Однако новым или экспериментальным полям может быть придана семантика полей заголовка запроса, если все участники обмена способны их распознать. Не узнанные поля заголовка рассматриваются как поля заголовка объекта.

4.5.6.1.5. Отклик

После получения и интерпретации сообщения-запроса, сервер реагирует, посылая HTTP сообщение отклик.

Response	= Status-Line	; Раздел 5.1
	*( general-header	; Раздел 3.5
	\| response-header	; Раздел 5.2
	\| entity-header )	; Раздел 6.1
	CRLF
	[ message-body ]	; Раздел 6.2

5.1. Статусная строка

Первая строка сообщения- отклика является статусной строкой, состоящей из кода версии протокола, за которым следует числовой статусный код и его текстовое представление, все элементы разделяются символами SP (пробел). Никакие CR или LF не допустимы, за исключением завершающей последовательности CRLF.

Status-Line = HTTP-Version SP Status-Code SP Reason-Phrase CRLF

5.1.1. Статусный код и словесный комментарий

Элемент Status-Code представляет собой 3-значный цифровой результирующий код попытки понять и исполнить запрос. Эти коды полностью определены в разделе 9. Словесный комментарий (Reason-Phrase) предназначен для того, чтобы дать краткое описание статусного кода. Статусный код служит для использования автоматами, а словесный комментарий для пользователей. Клиент не обязан рассматривать или отображать словесный комментарий.

Первая цифра статусного кода определяет класс отклика. Последние две цифры не имеют четко определенной функции. Существует 5 значений первой цифры:

1xx: Информационный – Запрос получен, процесс продолжается

2xx: Успех (Success) – Запрос успешно получен, понят и воспринят

3xx: Переадресация (Redirection) – Нужны дополнительные действия для завершения выполнения запроса

4xx: Ошибка клиента (Client Error) – Запрос содержит синтаксическую ошибку или не может быть выполнен

5xx: Ошибка сервера (Server Error) – Сервер не смог выполнить корректный запрос

Индивидуальные значения числовых статусных кодов определены в HTTP/1.1, а набор примеров, соответствующих причинам, представлен ниже. Комментарии причин, предлагаемые здесь, являются лишь рекомендательными – они могут быть заменены местными аналогами без последствий для протокола.

Status-Code	= "100"	; Continue
	\| "101"	; Switching Protocols
	\| "200"	; OK
	\| "201"	; Created
	\| "202"	; Accepted
	\| "203"	; Non-Authoritative Information
	\| "204"	; No Content
	\| "205"	; Reset Content
	\| "206"	; Partial Content
	\| "300"	; Multiple Choices
	\| "301"	; Moved Permanently
	\| "302"	; Moved Temporarily
	\| "303"	; See Other
	\| "304"	; Not Modified
	\| "305"	; Use Proxy
	\| "400"	; Bad Request
	\| "401"	; Unauthorized
	\| "402"	; Payment Required
	\| "403"	; Forbidden
	\| "404"	; Not Found
	\| "405"	; Method Not Allowed
	\| "406"	; Not Acceptable
	\| "407"	; Proxy Authentication Required
	\| "408"	; Request Time-out
	\| "409"	; Conflict
	\| "410"	; Gone
	\| "411"	; Length Required
	\| "412"	; Precondition Failed
	\| "413"	; Request Entity Too Large
	\| "414"	; Request-URI Too Large
	\| "415"	; Unsupported Media Type
	\| "500"	; Internal Server Error
	\| "501"	; Not Implemented
	\| "502"	; Bad Gateway
	\| "503"	; Service Unavailable
	\| "504"	; Gateway Time-out
	\| "505"	; HTTP Version not supported
	\| extension-code

<

/p>

Extension-code	= 3DIGIT
Reason-Phrase	= *

Статусные коды HTTP допускают расширение. HTTP приложения могут не понимать значение всех зарегистрированных статусных кодов, хотя их понимание, очевидно, является желательным. Однако, приложения должны понимать класс любого статусного кода, который задается его первой цифрой, и воспринимать не узнанный отклик как x00. Не узнанный статусный отклик не должен заноситься в буфер. Например, если клиентом получен не распознаваемый статусный код 431, он может предположить, что произошло что-то с запросом и рассматривать отклик так, как если бы он равнялся 400. В таких случаях агентам пользователя рекомендуется предоставлять пользователю объект с откликом, который содержит текст, поясняющий причину создавшейся ситуации.

5.2 Поля заголовка отклика

Поля заголовка отклика позволяют серверу передавать дополнительную информацию об отклике, который не может быть помещен в статусную строку. Эти поля заголовка дают информацию о сервере и доступе к ресурсу, идентифицированному Request-URI.

Response-header	= Age	; Раздел 13.6
	\| Location	; Раздел 13.30
	\| Proxy-Authenticate	; Раздел 13.33
	\| Public	; Раздел 13.35
	\| Retry-After	; Раздел 13.38
	\| Server	; Раздел 13.39
	\| Vary	; Раздел 13.43
	\| Warning	; Раздел 13.45
	\| WWW-Authenticate	; Раздел 13.46

Имена полей заголовка отклика могут быть расширены только в случае изменения версии протокола. Однако новые или экспериментальные поля могут быть введены с учетом семантики полей заголовка отклика, если все участники обмена способны распознавать эти поля. Не узнанные поля заголовка рассматриваются, как поля заголовка объекта (entity-header fields).

4.5.6.1.6. Объект (Entity)

Сообщения запрос и отклик могут нести в себе объект, если это не запрещено методом запроса или статусным кодом отклика. Объект состоит из полей заголовка объекта и тела объекта, хотя некоторые отклики включают в себя только заголовки объектов.

В данном разделе, как отправитель, так и получатель соотносятся к клиенту или серверу, в зависимости от того, кто отправляет и кто получает объект.

6.1. Поля заголовка объекта

Поля заголовка объекта определяют опционную метаинформацию о теле объекта или, если тело отсутствует, о ресурсе, идентифицированном в запросе.

Entity-header	= Allow	; Раздел 13.7
	\| Content-Base	; Раздел 13.11
Entity-header	\| Content-	; Раздел 13.12
Entity-header	\| Content-Language	; Раздел 13.13
Entity-header	\| Content-Length	; Раздел 13.14
Entity-header	\| Content-Location	; Раздел 13.15
Entity-header	\| Content-MD5	; Раздел 13.16
Entity-header	\| Content-Range	; Раздел 13.17
Entity-header	\| Content-Type	; Раздел 13.18
Entity-header	\| Etag	; Раздел 13.20
Entity-header	\| Expires	; Раздел 13.21
Entity-header	\| Last-Modified	; Раздел 13.29
Entity-header	\| extension-header

extension-header = message-header

Механизм расширения заголовка позволяет определить дополнительные полязаголовка объекта без изменения версии протокола, но эти поля не могут считаться заведомо распознаваемыми получателем. Неузнанные поля заголовка рекомендуется получателю игнорировать и переадресовывать прокси-серверам.

6.2. Тело объекта

Тела объекта (если они имеются), пересылаемые HTTP-запросом или откликом, имеют формат и кодировку, определенную полями заголовка объекта.

entity-body

= *OCTET

Auth-scheme	= token
auth-param	= token "=" quoted-string

Сообщение-отклик 401 (Unauthorized) используется исходным сервером для посылки требования авторизации агенту пользователя. Этот отклик должен включать в себя поле заголовка WWW-Authenticate, содержащее, по крайней мере, одно требование доступа к запрашиваемому ресурсу.

Challenge	= auth-scheme 1SP realm ( "," auth-param )
Realm	= "realm" "=" realm-value
realm-value	= quoted-string

*	равно значению Age: заголовок, полученный кэшем с этим откликом.

* date_value

*	равно значению Date исходного сервера: заголовок

<

/p> * request_time

*	равно местному времени, когда кэш сделал запрос, который явился причиной этого кэшированного отклика

* response_time

*	равно местному времени, когда кэш получил отклик

* now

*	равно текущему (местному) времени

Главная сайта