Информатика программирование : Учебное пособие: Общие сведения о HTML, принципы создания Web-узла
Учебное пособие: Общие сведения о HTML, принципы создания Web-узла
Лекция 1: Общие
сведения о HTML, принципы создания Web-узла
Общие принципы создания Web-узла
Вы решили создать и
разместить в информационном пространстве WWW (World Wide Web, Всемирная паутина) собственный Web-узел. Какие же шаги надо
предпринять, чтобы он был интересен, полезен и, что немаловажно, посещаем.
Первый вопрос, на который необходимо дать четкий ответ: с какой целью создается
Web-узел? От этого зависит многое: стиль
оформления, необходимые для создания и последующего функционирования затраты,
формат представления информации для размещения в Web, инструментарий и требования, предъявляемые к
программному обеспечению Web-сервера
и каналам связи с Internet. Здесь
возможно несколько вариантов. Если вы создаете Web-узел для компании, реализующей какой-то товар, то
основной целью может быть распространение информации о фирме и реклама
продукции, а также организация Web-магазина.
При этом будут решены следующие задачи:
·
изменение имиджа
и поднятие престижа компании;
·
продвижение
торговой марки;
·
доступность
информации о продукции и ценах для клиентов;
·
поддержка
дилерской сети, доступность информации о продукции и ценах для дилеров;
·
прямая продажа
продукции в Internet, организация Web-магазина;
·
доступность
внутренней информации для сотрудников, работающих вне офиса.
Другой
вариант — создание Web-узла
научной или общеобразовательной организации, не занимающейся коммерцией в Internet, а распространяющей информацию. В
этом случае речь пойдет о сборе, переработке и размещении на Web-узле больших массивов данных с
организацией поиска и доступа к ним.
И
последний рассматриваемый вариант — когда вы считаете необходимым разместить в Internet свою личную страницу. Для того,
чтобы правильно ответить на поставленные вопросы, необходимо сформировать
категории пользователей, на которые рассчитан Web-узел. Исходя из их психологии, должна строиться информационная
структура, которая будет привлекать и удерживать клиентов. В дальнейшем все
вопросы о целесообразности каких-либо действий, связанных с Web-узлом, должны рассматриваться в
соответствии с тем, как отреагируют на них посетители, и насколько они будут
способствовать достижению главной цели. После того, как сформулированы цели и
определены категории пользователей, необходимо распределить подготовленную
информацию по Web-документам, продумать связи между
ними и предусмотреть дополнительные навигационные возможности, например,
поисковую систему по содержимому Web-узла.
Типичная
структура Web-узла фирмы
обычно представлена так:
Информация
о компании.
Следует рассказать о целях и деловом облике фирмы, ее истории и т.д. Покажите,
какую выгоду получат клиенты от сотрудничества именно с вами, а не с другими
компаниями.
Информация
о продукции и услугах. Разместите на Web-странице
фотографии или рисунки своей продукции. Опишите ее свойства и преимущества,
приведите примеры использования. Если имеется бумажный каталог продукции, то
можно перенести его структуру и содержание в Web-узел. Это облегчит создание и дальнейшее обновление
электронного варианта каталога. Если планируется прием заказов на продукцию или
услуги через Internet, то нужно разместить здесь бланк
заказа, который будет поступать по электронной почте.
Информационная
поддержка. В этом
разделе публикуется дополнительная техническая информация, часто задаваемые
вопросы, советы по устранению неисправностей и т.п.
Новости. Проинформируйте клиентов о новых
товарах и услугах, предоставляемых фирмой, опубликуйте пресс-релизы и т.п.
Обратная
связь. Сообщите,
как с вами можно связаться, где вы находитесь. Поместите форму для отзыва,
гостевую книгу, адреса электронной почты, на которые клиент может отправить
запрос, и т.п.
При
наполнении Web-узла всегда
нужно помнить два принципа: уникальность и достоверность публикуемых
материалов. Уникальность является первоочередным требованием к содержанию. В WWW уже может существовать немало
страниц с похожими материалами. Ваш Web-узел должен чем-то отличаться от серверов с аналогичной тематикой, хотя
бы для того, чтобы привлечь к себе внимание. Наличие уникальных материалов на
вашей странице увеличит ее посещаемость. Для того, чтобы создать уникальный
информационный ресурс, не обязательно изобретать что-то принципиально новое,
можно по-другому оформить уже существующие ресурсы, но при этом не заставлять
клиента тратить много времени на их поиск. Проверить же ресурсы на уникальность
можно с помощью поисковых серверов. Что касается авторитетности, то все зависит
от того, насколько тщательно вы подберете информацию, проверите ее и будете
своевременно обновлять. При создании Web-узла необходимо помнить, что
составляющие его отдельные документы должны быть объединены общим стилем
оформления и средствами навигации. Единый стиль оформления — один из
показателей, отличающих профессиональный Web-узел от любительского. Благодаря единообразно
сделанным документам пользователи будут отличать ваш Web-узел от других и запомнят его. Это не значит, что
документы должны быть похожи друг на друга как две капли воды, но общая идея,
единый стиль, должны присутствовать непременно.
То же
относится и к средствам навигации по страницам. Не стоит рассчитывать, что
посетитель знает структуру Web-узла
так же хорошо, как вы. Он должен без труда понимать, где он находится сейчас и
как можно попасть в любое другое место. Необходимо предусмотреть возможность
перехода к первому документу, программе поиска или к схеме Web-узла.
Кроме
того, единство стиля позволяет использовать шаблоны — страницы, содержащие
только общие элементы оформления и навигации (без информационного наполнения).
С их помощью можно быстро и эффективно создавать новые страницы и распределять
работу по их созданию между несколькими людьми. При использовании шаблона для
получения готовой страницы достаточно лишь внести в него необходимую
информацию. Последовательность, логичность, постоянство — вот необходимые
качества хорошего Web-узла.
Значительно упростят работу по формированию и изменению стиля вашего Web-узла каскадные таблицы стилей,
появившиеся в HTML 4.0. О некоторых их возможностях
будет рассказано ниже, а полностью им посвящена отдельная глава. После того,
как определены цели, задана структура и собрана текстовая и графическая
информация, необходимо разработать внешний вид Web-узла. Он также зависит от тех целей, которые
необходимо достичь. Спектр возможных решений здесь очень широк: от просмотра
уже существующих страниц и создания подобных, до обращения за помощью к
профессиональным дизайнерам и художникам. В то же время, необходимо помнить о
некоторых уже сложившихся правилах построения Web-документов, из которых состоит Web-узел.
Структура. На сегодня представление о структуре документа
достаточно устоялось. Web-документ
должен содержать в себе следующие разделы: заглавие, название компании,
навигационную панель, собственно содержание, контактную информацию, дату и
время обновления, авторские права и статус документа.
Логотип. Создавая Web-страницу, необходимо позаботиться о том, чтобы название фирмы всегда
присутствовало на экране. Для этого в начале каждого Web-документа обычно помещается красочно оформленный
логотип фирмы. Кроме того, название компании должно присутствовать и в выходных
данных ко всем документам.
Навигационная
панель. Одним из наиболее важных разделов Web-документа является навигационная панель
или панель управления. WWW
завоевала весь мир во многом благодаря тому, что гипертекстовые ссылки
обеспечивают полную связность публикуемых материалов. Но эти же ссылки таят в
себе опасность погружения в полный хаос, когда, пройдя цепочку из трех-четырех
документов, вы уже не сможете вернуться обратно, запутавшись в обилии ссылок.
Ваш Web-узел должен обеспечивать
пользователю ясные и интуитивно понятные навигационные маршруты.
Многочисленные
исследования показали, что посетители Web-серверов очень нетерпеливы и дальше, чем на два уровня документов,
углубляться в содержание сервера не хотят. Поэтому, создавая Web-узел большого объема, следует
предусмотреть промежуточные документы, обычно находящиеся на первом-втором
уровнях, от которых любая информация находится не далее, чем в двух переходах. Навигационная панель вашего Web-узла должна присутствовать в каждом документе. В
первую очередь, она должна включать в себя направляющие ссылки типа "Вперед"-"Назад"
("Следующий"-"Предыдущий"), указывающие на соседние
документы в структуре Web-узла.
Далее от панели управления обязательно должны идти ссылки на все крупные
разделы Web-узла — так называемые разделы
первого уровня. И, наконец, пользователь всегда должен иметь возможность
мгновенно вернуться на главную страницу Web-узла. Помимо ссылок следует указать путь к локальной
поисковой системе и индексу.
Содержание. Прежде всего, следует отметить, что содержание Web-документов должно в полной мере
отвечать всем требованиям, предъявляемым к обычным газетным или журнальным
публикациям: грамматическая и орфографическая корректность, точность и
достоверность предлагаемых материалов, и многое другое. Кроме того, появляется
целый ряд специфических требований, которым должен удовлетворять Web-документ.
Часто
возникает вопрос о размерах документа: какое число страниц является
оптимальным? Ответ на первый взгляд может показаться странным: одна экранная
страница или вообще никаких ограничений. Многочисленные исследования показали,
что пользователи не любят работать с полосами прокрутки браузеров. Больше всего
им нравятся документы, которые размещаются на одной экранной странице. Так и в WWW — вы никоим образом не сможете дать
пользователю больше информации, чем в концентрированном изложении на одной
странице. Если все-таки вы не укладываетесь в эти рамки, создайте еще один
документ. Одна экранная страница оказалась подходящей мерой
представления информации. Если размер документа превышает одну страницу, то в
большинстве случаев он может быть поделен на несколько логических частей,
каждая из которых будет занимать не более одной страницы. Если же логического
деления информации произвести не удается, то необходимо переработать стиль
изложения, а может быть, и сами материалы. Сейчас выработалось единое мнение,
что Web-сервер необходимо строить на основе
одноэкранных документов. Есть только два исключения из этого правила. Оно не
распространяется на статьи, публикуемые в WWW, и второе исключение — анкетные формы, которые,
естественно, нельзя разрывать.
Графика. При разработке Web-страницы нужно очень внимательно выбирать оптимальное
соотношение графических и текстовых материалов. Одна хорошая картинка может
заменить тысячу строк текста, но и загружаться по сети она будет в тысячу раз
дольше. Поэтому графикой нужно пользоваться осторожно. Можно исходить из того,
что графики на странице должно быть чуть меньше, чем хочется Web-мастеру. Пользователям может просто
не хватить терпения, и они закроют документ еще до того, как он полностью
загрузится. Задержка отклика системы вызывает у пользователя раздражение. Все
понимают, как тяжело сейчас обстоят дела с канальной инфраструктурой в Internet. Поэтому время задержки возрастает в
зависимости от времени суток, по разным оценкам до 15-60 секунд. Теперь
представьте, что у клиента только модем на 19200 бит/с. Большего на российских
телефонных линиях достичь очень тяжело. Тогда за минуту, то есть до того, как
клиент потеряет терпение, можно передать только около 170 Кбайт данных.
Следовательно, размер документа не должен превышать этого значения. Следует отметить, что обычно панель управления, логотип и название
фирмы выполняются в виде графических элементов. После создания макета можно
приступить к его реализации с помощью языка HTML и иных средств, предлагаемых современными
технологиями WWW.
Завершив создание Web-узла, необходимо разместить его в Internet. Здесь возможны два варианта: первый
использовать компьютер, который вместе с Web-сервером и Web-узлом находится в вашем офисе и подключается к Internet по выделенной или коммутируемой
линии; второй — воспользоваться для размещения Web-узла услугами специальных организаций.
Рассмотрим второй
вариант. Правильный выбор провайдера, предоставляющего доступ к Web-странице, позволит вашим клиентам с
максимальным удобством получать необходимую информацию. Кроме того, поддержка Web-сервером специальных возможностей
значительно облегчит разработку Web-узла.
На что следует
обратить внимание при выборе провайдера, размещающего ваш Web-узел на своем сервере?
Пропускная
способность каналов. Чтобы вашим посетителям не пришлось слишком долго ждать загрузки
страниц, провайдер должен обладать надежным высокоскоростным соединением
порядка 1-2 Мбит в секунду. Поддержка сервером провайдера SSI (Server Side Includes, вставки на стороне сервера).
Использование SSI позволяет Web-серверу вставлять небольшие объемы динамических
данных непосредственно в пересылаемый пользователю HTML-документ. Запрошенная HTML-страница "просматривается" в поисках
элементов SSI. Обнаружив такой элемент, сервер
вставляет требуемую динамическую информацию. С помощью SSI можно включать один файл в состав другого, исполнять CGI-сценарии и передавать другую
информацию. Необходимо уточнить, какие именно функции SSI поддерживаются на сервере провайдера. Поддержка
сервером провайдера CGI-сценариев. CGI (Common Gateway
Interface, общий шлюзовой интерфейс)
спецификация, позволяющая Web-серверу
выполнять произвольные прикладные программы. В результате работы таких программ
(сценариев, или "скриптов") создаются HTML-документы. С помощью CGI-сценариев могут приниматься данные от пользователя,
они позволяют организовать диалог на Web-страницах, запросы к базам данных и т.д. Создать CGI-сценарий можно с помощью любого
популярного языка программирования: Perl, Basic, C, C++, Pascal и т.п. Поддержка
моментальной перекодировки. К сожалению, для русского языка в Internet при работе на разных платформах (Windows, Mac, Unix и
т.д.) приняты различные кодировки. Чтобы пользователю было легко просматривать
страницы, Web-сервер провайдера должен уметь
автоматически перекодировать документы в зависимости от поступившего запроса. В
противном случае либо содержание вашего Web-узла для некоторых посетителей будет нечитаемым, либо
придется обеспечивать несколько копий Web-узла — по одной на каждую поддерживаемую кодировку. Способ
обновления страниц. Обычно страницы обновляются по протоколу FTP (File Transfer Protocol, протокол передачи файлов).
Некоторые FTP-клиенты позволяют работать с файлами
на компьютере провайдера так же, как с собственным диском, — копировать,
удалять, переименовывать и т.п.
Как правило, возможность
размещения Web-узла провайдер предоставляет своим
пользователям за небольшую плату или бесплатно.
Существуют
службы, которые предоставляют место под Web-узлы бесплатно вместе с адресом электронной почты и
другими услугами. Как правило, условием такого "бесплатного" размещения является выделение
на ваших страницах некоторого места под рекламу. Кроме того, накладываются ограничения
на размер ваших файлов.
История развития HTML
В 1989 году Тим
Бернерс-Ли предложил руководству Европейского Центра ядерных исследований (CERN) проект распределенной
гипертекстовой системы, которую он назвал World Wide Web (WWW),
Всемирная паутина. Первоначально идея системы состояла в том, чтобы при помощи
гипертекстовой навигационной системы объединить все множество информационных
ресурсов CERN в единую информационную систему.
Технология оказалась настолько удачной, что дала толчок к развитию одной из
самых популярных в мире глобальных информационных систем. Практически в
сознании большинства пользователей глобальной компьютерной сети Internet сама эта сеть ассоциируется с тремя
основными информационными технологиями:
·
электронная
почта (e-mail);
·
файловые
архивы FTP;
·
World
Wide Web.
Причем последняя
технология постепенно перемещается на первое место.
Успех технологии World Wide Web определен двумя основными факторами: простотой и
использованием протоколов межсетевого обмена семейства TCP/IP, (Transmission Control Protocol, протокол управления передачей/Internet Protocol, протокол Internet), которые являются основой Internet.
Практически
все пользователи Сети одновременно получили возможность попробовать себя в
качестве создателей и читателей информационных материалов, опубликованных во
Всемирной паутине. Но и популярность самого Internet во многом вызвана появлением World Wide Web, так как это первая сетевая технология, которая предоставила
пользователю простой современный интерфейс для доступа к разнообразным сетевым
ресурсам. Простота и удобство применения привели к росту числа пользователей WWW и привлекли внимание коммерческих
структур. Далее процесс роста числа пользователей стал лавинообразным, и так
продолжается до сих пор.
При этом сама технология
на начальном этапе была чрезвычайно проста. Дело в том, что при разработке
различных компонентов технологии (языка гипертекстовой разметки HTML (HyperText Markup Language, язык разметки гипертекста),
протокола обмена гипертекстовой информацией HTTP, спецификации разработки прикладного программного
обеспечения CGI и др.) предполагалось, что
квалификация авторов информационных ресурсов и их оснащенность средствами
вычислительной техники будут минимальными. Одним из компонентов технологии
создания распределенной гипертекстовой системы World Wide Web стал язык гипертекстовой разметки HTML, разработанный Тимом Бернерсом-Ли на
основе стандарта языка разметки печатных документов — SGML (Standard
Generalised Markup Language, стандартный обобщенный язык
разметки). Дэниел В. Конноли написал для него Document Type Definition — формальное описание синтаксиса HTML в терминах SGML.
Разработчики HTML смогли решить две задачи:
·
предоставить
дизайнерам гипертекстовых баз данных простое средство создания документов;
·
сделать это
средство достаточно мощным, чтобы отразить имевшиеся на тот момент
представления об интерфейсе пользователя гипертекстовых баз данных.
Первая задача была решена
за счет выбора теговой модели описания документа. Такая модель широко
применяется в системах подготовки документов для печати. Примером такой системы
может служить хорошо известный язык разметки научных документов TeX, который был создан Дональдом Кнутом
и предложен Американским математическим обществом, и программы его
интерпретации. Язык НТМL позволяет размечать электронный документ, который
отображается на экране с полиграфическим уровнем оформления; результирующий
документ может содержать самые разнообразные метки, иллюстрации, аудио- и
видеофрагменты и так далее. В состав языка вошли развитые средства для создания
различных уровней заголовков, шрифтовых выделений, различные списки, таблицы и
многое другое. Вторым важным моментом, повлиявшим на судьбу HTML, стало то, что в качестве основы был
выбран обычный текстовый файл. Выбор был сделан под влиянием следующих
факторов:
·
такой файл можно
создать в любом текстовом редакторе на любой аппаратной платформе в среде какой
угодно операционной системы;
·
к моменту
разработки HTML существовал американский стандарт
для разработки сетевых информационных систем — Z39.50, в котором в качестве единицы хранения указывался
простой текстовый файл в кодировке LATIN1, что соответствует US ASCII.
Таким
образом, гипертекстовая база данных в концепции WWW — это набор текстовых файлов, размеченных на языке HTML, который определяет форму
представления информации (разметка) и структуру связей между этими файлами и
другими информационными ресурсами (гипертекстовые ссылки). Гипертекстовые
ссылки, устанавливающие связи между текстовыми документами, постепенно стали
объединять самые различные информационные ресурсы, в том числе звук и видео; в
результате возникло новое понятие — гипермедиа. Такой подход предполагает
наличие еще одного компонента технологии — интерпретатора языка. В World Wide Web функции интерпретатора разделены между Web-сервером гипертекстовой базы данных
и интерфейсом пользователя. Сервер, кроме доступа к документам и обработки гипертекстовых
ссылок, обеспечивает предпроцессорную обработку документов, в то время как
интерфейс пользователя осуществляет интерпретацию конструкций языка, связанных
с представлением информации. Первая версия языка (HTML 1.0) была направлена на представление языка как
такового, где описание его возможностей носило скорее рекомендательный
характер. Вторая версия языка (HTML
2.0) фиксировала практику использования его конструкций. Версия ++ (HTML++) представляла новые возможности,
расширяя набор тегов HTML в
сторону отображения научной информации и таблиц, а также улучшения стиля
компоновки изображений и текста. Версия 3.2 смогла упорядочить все нововведения
и согласовать их с существующей практикой. HTML 3.2 позволяет реализовать использование таблиц, выполнение
кодов языка Java, обтекание графики текстом, а также
отображение верхних и нижних индексов. Сейчас World Wide Web Consortium (W3C) — международная
организация, которая занимается подготовкой и распространением документации на
описание новых версий HTML
уже опубликовала материалы спецификации HTML 4.01. Кроме возможностей разметки текста, включения
мультимедиа и формирования гипертекстовых связей, уже существовавших в
предыдущих версиях HTML, в версию
4.01 включены дополнительные средства работы с мультимедиа, языки
программирования, таблицы стилей, упрощенные средства печати изображений и
документов. Для управления сценариями просмотра страниц Website (гипертекстовой базы данных,
выполненной в технологии World Wide Web) можно использовать языки программирования
этих сценариев, например, JavaScript, Java и VBScript. Усложнение HTML и появление языков программирования
привело к тому, что разработка Web-узлов
стала делом высокопрофессиональным, требующим специализации по направлениям
деятельности и постоянного изучения новых Web-технологий. Но возможности Internet позволяют пользователям, владеющим
основами HTML, создавать и размещать собственные Web-узлы без больших затрат. Именно на таких
пользователей и рассчитан предлагаемый курс.
Принципы гипертекстовой разметки
HTML является описательным языком
разметки документов, в нем используются указатели разметки (теги). Теговая
модель описывает документ как совокупность контейнеров, каждый из которых
начинается и заканчивается тегами, то есть документ НТМL представляет собой не что иное, как обычный АSСII-файл, с добавленными в него управляющими НТМL-кодами (тегами). Поскольку HTML произошел от SGML, в нем разрешено использовать только
три управляющих символа: горизонтальную табуляцию, перевод каретки и перевод
строки. Это облегчает взаимодействие с различными операционными системами. Теги НТМL-документов
в большинстве своем просты и понятны, ибо они образованы с помощью
общеупотребительных слов английского языка, понятных сокращений и обозначений.
НТМL-тег состоит из имени, за которым
может следовать необязательный список атрибутов тега. Текст тега заключается в
угловые скобки ("<"
и ">"). Простейший вариант тега — имя, заключенное в угловые
скобки, например, <HEAD>
или <I>. Для ряда тегов характерно
наличие атрибутов, которые могут иметь конкретные значения, устанавливаемые
автором для изменения функции тега.
Например, при описании
таблицы открывающий тег с атрибутами может выглядеть так:
<TABLE
WIDTH=570 ALIGN=center CELLPADDING=10
CELLSPACING=2 BORDER=16>
Эта запись означает
следующее: таблица шириной 570 пикселов, выравнена по центру, поле между рамкой
и содержимым ячеек 10 пикселов, поле рамки 2 пиксела, ширина бордюра 16
пикселов.
Атрибуты тега следуют за
именем и отделяются друг от друга одним или несколькими знаками табуляции,
пробелами или символами возврата к началу строки. Порядок записи атрибутов в
теге значения не имеет. Значение атрибута, если таковое имеется, следует за
знаком равенства, стоящим после имени атрибута. Если значение атрибута — одно
слово или число, то его можно просто указать после знака равенства, не выделяя
дополнительно. Все остальные значения необходимо заключать в одинарные или
двойные кавычки, особенно если они содержат несколько разделенных пробелами
слов. Длина значения атрибута ограничена 1024 символами. Регистр символов в
именах тегов и атрибутов не учитывается, чего нельзя сказать о значениях
атрибутов. Например, особенно важно использовать нужный регистр при вводе URL (Uniform Resource Locator, унифицированный указатель ресурса) других документов
в качестве значения атрибута HREF.
Чаще
всего элементы разметки HTML
или HTML-контейнеры состоят из начального и
конечного компонентов, между которыми размещаются текст и другие элементы
документа. Имя конечного тега идентично имени начального, но перед именем
конечного тега ставится косая черта (/) (например, для тега стиля шрифта
курсив <I> закрывающая пара представляет
собой </I>, для тега заголовка <ТIТLЕ> закрывающей парой будет </ТIТLЕ>). Конечные
теги никогда не содержат атрибутов. По своему значению теги близки к понятию
скобок "begin/end" в универсальных языках программирования,
которые задают области действия имен локальных переменных и т.п. Теги
определяют область действия правил интерпретации текстовых документов. При использовании вложенных элементов разметки в документе следует
соблюдать особую аккуратность. Вложенные теги нужно закрывать, начиная с
последнего. Некоторые элементы разметки не имеют конечного компонента, поскольку
являются автономными элементами. Например, тег изображения <IMG>, который служит для вставки в
документ графического изображения, конечного компонента не требует. К
автономным элементам разметки также относятся разрыв строки (<BR>), горизонтальная линейка (<HR>) и теги, содержащие такую
информацию о документе, которая не влияет на его отображаемое содержимое,
например, теги <META> и <BASE>. В некоторых
случаях конечные теги в документе можно опускать. Большинство браузеров
устроено так, что при обработке текста документа начальный тег воспринимается
как конечный тег предыдущего. Самый распространенный тег такого типа — тег
абзаца <Р>. Поскольку он используется в документе очень часто, его
обычно ставят только в начале каждого абзаца. Когда один абзац заканчивается,
следующий тег <Р> сигнализирует браузеру о том, что нужно завершить
данный абзац и начать следующий. Большинство авторов тегом конца абзаца не
пользуются. Есть и другие конечные теги, без которых браузеры
отлично работают, например, конечный тег </HTML>. Тем не менее, рекомендуется включать по
возможности больше конечных тегов, чтобы избежать путаницы и ошибок при
воспроизведении документа. Для краткости и образности мы будем
в ряде случаев вместо словосочетания "элемент разметки" применять
термин "контейнер". Общая схема построения контейнера в формате HTML может быть записана в следующем
виде:
"контейнер"=
<"имя
тега" "список атрибутов">
содержание
контейнера
</"имя
тега">
Следует отметить, что в
литературе кроме термина "контейнер"
еще используется и термин "элемент". Следует быть внимательным, чтобы
не путать контейнер (например, BODY)
и тег (BODY), используемый при формировании
контейнера. Кроме тегов, элементами HTML являются CER (Character Entity Reference), они предназначены для
представления специальных символов в документе HTML, которые могут быть неверно обработаны браузером.
Предположим, создается документ HTML,
речь в котором идет об элементах данного языка. Если указать имя тега <BODY> просто в документе, браузер может воспринять его
как непосредственно старт-тег. Для вывода таких символов и используется CER. Например, чтобы
представить символ "<" в документе HTML, нужно заменить его на <, а символ ">" — на >. То есть, если указать в тексте HTML строку <BODY>, она будет выглядеть на экране как
текст <BODY>.
Может
возникнуть вопрос: как быть с символами "</>", "&" и со специальными
символами, типа знака ударения? Можно выводить их, используя соответствующие CER, например для "&" это
будет &, и т. д. Если
посмотреть на структуру любого документа HTML, поскольку каждый из них начинается с амперсанда "&". В отличие от
наименований тегов HTML, наименования
CER чувствительны к регистру символов.
Также наименования CER могут
задаваться не в виде имени, а с помощью трехзначных кодов символов в виде
&#nnn;. Далее в таблице приведены наиболее
часто используемые CER и
соответствующие им числовые коды.
Числовой
код |
Именная
замена |
Символ |
Описание |
" |
" |
" |
Кавычка |
& |
& |
& |
Амперсанд |
< |
< |
< |
Меньше |
> |
> |
> |
Больше |
  |
|
|
Неразрывный пробел |
¡ |
¡ |
¡ |
Перевернутый
восклицательный знак |
¢ |
¢ |
¢ |
Цент |
£ |
£ |
£ |
Фунт |
¤ |
¤ |
¤ |
Валюта |
¥ |
¥ |
¥ |
Йена |
¨ |
¨ |
¨ |
Умляут |
© |
© |
© |
Копирайт |
« |
« |
« |
Левая угловая кавычка |
® |
® |
® |
Зарегистрированная
торговая марка |
± |
± |
± |
Плюс или минус |
» |
» |
» |
Правая угловая кавычка |
Группы тегов НТМL
Все теги НТМL по их назначению и области действия
можно разделить на следующие основные группы:
·
определяющие
структуру документа;
·
оформление блоков
гипертекста (параграфы, списки, таблицы, картинки);
·
гипертекстовые
ссылки и закладки;
·
формы
для организации диалога;
·
вызов
программ.
Структура гипертекстовой
сети задается гипертекстовыми ссылками. Гипертекстовая ссылка — это адрес
другого HTML-документа или информационного
ресурса Internet, который тематически, логически или
каким-либо другим способом связан с документом, в котором ссылка определена. Естественно,
при таких условиях очень важна схема адресации всех имеющихся информационных
ресурсов.
Реальный механизм
интерпретации идентификатора ресурса, опирающийся на URI (Uniform Resource
Identifier, универсальный идентификатор
ресурса), называется URL, и
пользователи WWW имеют дело именно с ним.
Типичным
примером использования такой записи можно считать следующий пример:
Этот
текст содержит:
<A
HREF="http://www.intuit.ru/help/index.html">
гипертекстовую
ссылку</A>
Выглядеть
это будет следующим образом:(открыть)
В
приведенном выше примере тег "A",
который в HTML называют якорем (anchor), использует атрибут HREF, обозначающий гипертекстовую ссылку
(Hypertext Reference), для записи этой ссылки в форме URL. Данная ссылка указывает на документ
с именем "index.html" в каталоге "help" на сервере "www.intuit.ru",
доступ к которому осуществляется по протоколу HTTP. Гипертекстовые ссылки в HTML делятся на два класса: контекстные
гипертекстовые ссылки и общие. Контекстные ссылки вмонтированы в тело
документа, как это было продемонстрировано в предыдущем примере, в то время как
общие ссылки связаны со всем документом в целом и могут использоваться при
просмотре любого фрагмента документа. Оба класса ссылок изначально присутствуют
в стандарте языка, однако первое время наибольшей популярностью пользовались
контекстные ссылки. Эта популярность привела к тому, что механизм использования
общих ссылок практически полностью "атрофировался". В данном примере мы заключили URL в двойные кавычки. На самом деле,
это необязательно. Кавычки (двойные или одинарные) применяются только тогда,
когда внутри значения URL
появляются символы-разделители (пробел, табуляция, неотображаемые символы). Но
такого сорта URL следует всячески избегать. Структура HTML-документа
позволяет задействовать вложенные друг в друга контейнеры. Собственно, сам документ — это
один большой контейнер, который начинается с тега <HTML> и заканчивается тегом </HTML>.
В заключение отметим, что
при подготовке документов HTML
используется идентификатор текста DTD (Document Type Definition, определение типа документа) в
качестве первой строки. Это позволяет браузеру идентифицировать документ как
соответствующий стандарту HTML.
Обычно (но не обязательно) каждый документ HTML начинается со строки типа:
<!DOCTYPE
HTML PUBLIC "-//W3C//DTD HTML 4.0
Transitional//EN">
Здесь содержится
информация о том, что документ соответствует версии HTML 4.0; разработанной W3C; используемый
язык — английский.
|