|
Использование метаданных (HTTP-EQUIV, NAME, REL, REV, BASE) при создании HTML документовА. Аликберов, andreya@citmgu.ru
META-тагиMETA-таги имеют два возможных атрибута
- <META HTTP-EQUIV="имя" CONTENT="содержимое">
META-таги должны находиться в заголовке HTML-документа между <HEAD> и </HEAD> (особенно это важно для документов, использующих фреймы). META-таги с атрибутом HTTP-EQUIV эквивалентны HTTP-заголовкам. Обычно они управляют действиями броузеров и могут быть использованы для совершенствования информации, выдаваемой обычными заголовками. Таги такой формы могут дать такой же эффект, что и HTTP-заголовки, и на некоторых серверах автоматически могут быть переведены в настоящие HTTP-заголовки. HTTP-заголовки описываются в RFC1945 (HTTP/1.0) и RFC2068 (HTTP/1.1). HTTP-заголовки могут быть сгенерированы с помощью CGI-скриптов. Это позволяют сделать серверы Apache и CERN. В других серверах могут использоваться другие механизмы генерирования заголовков. Некоторые генерируемые сервером поля заголовков не могут быть подменены значениями из META-тагов (в частности Date), другие подменяются только при ненормальном статус-коде (<>200). Когда заголовок не понятен, то значение HTTP-заголовка превалирует над значением META-тагов. Expires Источники: HTTP/1.1 (RFC2068) Дата устаревания. Управление кэшированием в HTTP/1.0. В Netscape Navigator это выглядит следующим образом: если указанная дата прошла, то очередной запрос этого документа вызывает повторный сетевой запрос, а не подгрузку документа из кэша. Дата со значением "0" интерпретируется как "сейчас". Такое значение заставляет броузер каждый раз при запросе проверять - изменялся ли этот документ. Это, кстати относится и к прокси-агентам. Поисковые роботы могут либо совсем не индексировать такой документ, либо постоянно "обнюхивать" его. Дата должна быть задана в формате, описываемом в RFC850, <META HTTP-EQUIV="expires" CONTENT="Wed, 26 Feb 1997 08:21:57 GMT"> что эквивалентно HTTP-заголовку Expires: Wed, 26 Feb 1997 08:21:57 GMT Pragma Контроль кэширования для HTTP/1.0. Значением должно быть "no-cache". Очень полезный контейнер, я всегда использую его при выдаче результатов работы любого скрипта. Content-Type Источники: HTTP/1.0 (RFC1045) Указание типа документа. Может быть расширено указанием кодировки страницы (charset). Если же указывать charset в содержании META-тага, то Netscape Navigator выводит такую страницу уже в заданном charset. Однако будьте аккуратны, если текст страницы в кодировке Windows, а значение charset=KOI8-r, то никакими силами пользователь не сможет поменять encoding, чтобы увидеть нормальные слова! <META HTTP-EQUIV="Content-type" CONTENT="text/html; charset=ISO-2022-JP"> Content-language Источники: HTTP/1.0 Указание языка документа. Может использоваться поисковыми машинами при индексировании страниц. Комбинация поля Accept-Language (посылаемого броузером) с содержимым Content-language может быть условием выбора сервером того или иного языка. <META HTTP-EQUIV="Content-language" CONTENT="en-GB"> что эквивалентно HTTP-заголовку В недавно вышедшей спецификации HTML 4.0 появилась другая возможность явного указания языка - <html lang="en"> Content-language: en-GB Язык описывается парой значений (язык-диалект). В примере: Английский-Великобритания Refresh Источники: Netscape Определение задержки в секундах, после которой броузер автоматически обновляет документ. Дополнительная возможность - автоматическая загрузка другого документа. <META HTTP-EQUIV="Refresh" Content="3, URL=http://www.name.com/page.html"> что эквивалентно HTTP-заголовку Refresh: 3; URL=http://www.name.com/page.html В Netscape Navigator это дает такой же эффект, что и нажатие на кнопку Reload. Window-target Источники: Jahn Rentmeister Определяет окно текущей страницы; может быть использован для прекращения появления новых окон броузера при применении фреймовых структур. Действует для многих (но не для всех) броузеров. <META HTTP-EQUIV="Window-target" CONTENT="_top"> что эквивалентно HTTP-заголовку Window-target: _top Ext-cache Источники: Netscape Определяет имя альтернативного кэша для Netscape Navigator <META HTTP-EQUIV="Ext-cache" CONTENT="name=/some/path/index.db; istructions=User Instructions"> PICS-Label Platform-Independant Content rating Scheme. Обычно используется для определения рейтинга "взрослости" (adult) содержания (sex,violence, ...):-)) однако это довольно гибкая схема и может использоваться для других целей. Cache-Control Источники: HTTP/1.1 Определяет действия кэша по отношению к данному документу. Возможные значения:
Vary Источники: HTTP/1.1 Определяет доступные альтернативы для указанных в CONTENT полей HTTP-заголовка. <META HTTP-EQUIV="Vary" CONTENT="Content-language"> что эквивалентно HTTP-заголовку Vary: Content-language Lotus Lotus-редакторы генерируют свои собственные поля Bulletin-Date и Bulletin-Text атрибуты. Bulletin-Text содержит описание документа Атрибут NAMEMETA-таги с атрибутом NAME используются в случаях, когда поля не соотносятся с HTTP-заголовками. Иногда ясность теряется: некоторые агенты могут интерпретировать таг "Keywords" описанный как NAME, другие - как HTTP-EQUIV Robots Источники: Spidering Управление индексацией страницы для поисковых роботов. <META NAME="Robots" CONTENT="NOINDEX,FOLLOW"> Возможные значения:
Подробнее об этом в статье "Несколько слов о работе поисковых роботов" Description Источники: Spidering, Altavista, Infoseek Краткая аннотация содержания документа. Используется поисковыми системами для описания документа. Этот таг сильно полезен в случаях, когда в документе мало текста, когда это управляющий фреймами файл (frameset) или в начале документа используются скрипты. Длина текста до 100 символов. <META NAME="Description" CONTENT="Документ содержит словарь META-тагов"> Подробнее об этом в статье "Несколько слов о работе поисковых роботов" Keywords Источники: Altavista, Infoseek Используется поисковыми системами для индексирования документа. Обычно здесь указываются синонимы к словам в заголовке (title) или альтернативный заголовок. Длина списка до 1000 символов. Не допускается использование одного и того же ключевого слова более 7 раз, поисковые системы просто будут игнорировать это слово. <META NAME="Keywords" CONTENT="таги,тэги,метаданные,список"> Подробнее об этом в статье "Несколько слов о работе поисковых роботов" Document-state Источники: Spidering Управление индексацией страницы для поисковых роботов. Определяет частоту индексации - или один раз индексировать, или реиндексировать документ регулярно. <META NAME="Document-state" CONTENT="Static"> Возможные значения:
Подробнее об этом в статье "Несколько слов о работе поисковых роботов" URL Источники: Spidering Управление индексацией страницы для поисковых роботов. Определяет частоту индексации - или один раз индексировать, или реиндексировать документ регулярно. <META NAME="URL" CONTENT="absolute_url"> Подробнее об этом в статье "Несколько слов о работе поисковых роботов" Author Источники: HTML редакторы Обычно имя автора, формат произвольный. Generator Источники: HTML редакторы Обычно название и версия редактора, с помощью которого создана эта страница. Может быть использована для определения доли рынка, занимаемого тем или иным продуктом. Copyright Источники: HTML редакторы Обычно описание авторских прав на документ в произвольном формате Distribution Возможные значения
Resource-type Текущее состояние данного файла. Важен для поисковых систем, т.е. если его значение document, то поисковая система приступает к его индексированию. Прочие
Помимо перечисленных более или менее стандартных тагов существует еще множество других специализированных, например, для конкретной поисковой машины тагов. Таг LINKТаг LINK предоставляет документу независимый от среды метод определения отношения данного документа к другим документам и ресурсам Сети. Используется с аргументами REL и REV. С помощью тага LINK можно:
<LINK rel=help href="http://www.name.com/help.html"> где http://www.name.com/help.html - страница помощи по данному документу. Атрибуты REL и REV могут также использоваться с тагом A. Таги LINK могут использоваться только в заголовке документа (head) HTML 3.2 REL-таги top, contents, index, glossary, copyright, next, previous, search Некоторые из рекомендованных типов взаимосвязей:
Используется в конструкции LINK для индикации обратного соотношения документов. <LINK rev=help href="http://www.name.com/index.html"> где текущая страница является страницей помощи для документа http://www.name.com/index.html Использование <LINK rev=made href="mailto:document-owner"> в случае использования Lynx вызовет автоматическую отсылку почты по адресу document-owner. Подробнее смотри HTML 3.2 Этот таг определяет для данного документа базовый адрес URL, который затем будет использоваться для переопределения относительных адресов. Таг BASE полезен, если документ может быть скопирован в другое место или запрошен по другому пути с использованием символической ссылки, или редиректа с imagemap, и т.д. Подробнее смотри HTML 3.2 Список литературы |
||||||||||||||||||
With any suggestions or questions please feel free to contact us |