HTML的全称为超文本标记语言,是一种标记语言。它包括一系列标签,通过这些标签可以将网络上的文档格式统一,使分散的Internet资源连接为一个逻辑整体。HTML文本是由HTML命令组成的描述性文本,HTML命令可以说明文字,图形、动画、声音、表格、链接等。 [1]
超文本是一种组织信息的方式,它通过超级链接方法将文本中的文字、图表与其他信息媒体相关联。这些相互关联的信息媒体可能在同一文本中,也可能是其他文件,或是地理位置相距遥远的某台计算机上的文件。这种组织信息方式将分布在不同位置的信息资源用随机方式进行连接,为人们查找,检索信息提供方便。 [11]
HTML是一种基础技术,常与CSS、JavaScript一起被众多网站用于设计网页、网页应用程序以及移动应用程序的用户界面 [12]。网页浏览器可以读取HTML文件,并将其渲染成可视化网页。HTML描述了一个网站的结构语义随着线索的呈现,使之成为一种标记语言而非编程语言。
HTML元素是构建网站的基石。HTML允许嵌入图像与对象,并且可以用于创建交互式表单,它被用来结构化信息——例如标题、段落和列表等等,也可用来在一定程度上描述文档的外观和语义。HTML的语言形式为尖括号包围的HTML元素(如<html>),浏览器使用HTML标签和脚本来诠释网页内容,但不会将它们显示在页面上。
简介
播报编辑
由来
HTML的英文全称是 Hyper Text Markup Language,即超文本标记语言。HTML是由Web的发明者 Tim Berners-Lee和同事 Daniel W. Connolly于1990年创立的一种标记语言,它是标准通用化标记语言SGML的应用。用HTML编写的超文本文档称为HTML文档,它能独立于各种操作系统平台(如UNIX, Windows等)。使用HTML,将所需要表达的信息按某种规则写成HTML文件,通过专用的浏览器来识别,并将这些HTML文件“翻译”成可以识别的信息,即最终呈现的网页。 [2]
自1990年以来,HTML就一直被用作万维网的信息表示语言,使用HTML描述的文件需要通过web浏览器显示出效果。HTML是一种建立网页文件的语言,通过标记式的指令(Tag),将文字,图形、动画、声音、表格、链接、影像等内容显示出来。事实上,每一个HTML文档都是一种静态的网页文件,这个文件里面包含了HTML指令代码,这些指令代码并不是一种程序语言,只是一种排版网页中资料显示位置的标记结构语言,易学易懂,非常简单。HTML的普遍应用就是带来了超文本的技术―通过单击鼠标从一个主题跳转到另一个主题,从一个页面跳转到另一个页面,与世界各地主机的文件链接超文本传输协议规定了浏览器在运行HTML文档时所遵循的规则和进行的操作。HTTP的制定使浏览器在运行超文本时有了统一的规则和标准。 [2]
万维网(world wide web,简称www)上的一个超媒体文档称之为一个页面(外语:page)。作为一个组织或者个人在万维网上放置开始点的页面称为主页(外语:Homepage)或首页,主页中通常包括有指向其他相关页面或其他节点的指针(超级链接),所谓超级链接,就是一种统一资源定位器(Uniform Resource Locator,外语缩写:URL)指针,通过激活(点击)它,可使浏览器方便地获取新的网页。这也是HTML获得广泛应用的最重要的原因之一。在逻辑上将视为一个整体的一系列页面的有机集合称为网站(Website或Site)。超文本标记语言(英文缩写:HTML)是为“网页创建和其它可在网页浏览器中看到的信息”设计的一种标记语言。 [3]
网页的本质就是超文本标记语言,通过结合使用其他的Web技术(如:脚本语言、公共网关接口、组件等),可以创造出功能强大的网页。因而,超文本标记语言是万维网(Web)编程的基础,也就是说万维网是建立在超文本基础之上的。超文本标记语言之所以称为超文本标记语言,是因为文本中包含了所谓“超级链接”点。 [4]
定义
超文本标记语言是标准通用标记语言下的一个应用,也是一种规范,一种标准,它通过标记符号来标记要显示的网页中的各个部分。网页文件本身是一种文本文件,通过在文本文件中添加标记符,可以告诉浏览器如何显示其中的内容(如:文字如何处理,画面如何安排,图片如何显示等)。浏览器按顺序阅读网页文件,然后根据标记符解释和显示其标记的内容,对书写出错的标记将不指出其错误,且不停止其解释执行过程,编制者只能通过显示效果来分析出错原因和出错部位。但需要注意的是,对于不同的浏览器,对同一标记符可能会有不完全相同的解释,因而可能会有不同的显示效果。 [3]
历史
播报编辑
发展
1980年,物理学家蒂姆·伯纳斯-李在欧洲核子研究中心(CERN)在承包工程期间,为使CERN的研究人员使用并共享文档,他提出并创建原型系统ENQUIRE。1989年,伯纳斯-李在一份备忘录中提出一个基于互联网的超文本系统。他规定HTML并在1990年底写出浏览器和服务器软件。同年,伯纳斯-李与CERN的数据系统工程师罗伯特·卡里奥联合为项目申请资助,但未被CERN正式批准。在他的个人笔记中 [13]伯纳斯-李列举“一些使用超文本的领域”,并把百科全书列为首位 [14]。
HTML的首个公开描述出现于一个名为HTML Tags [15]的文件中,由蒂姆·伯纳斯-李于1991年底提及 [16-17]。它描述18个元素,包括HTML初始的、相对简单的设计。除了超链接标签外,其他设计都深受CERN内部一个以标准通用标记语言(SGML)为基础的文件格式SGMLguid的影响。这些元素仍有11个存在于HTML 4中 [18]。
HTML版本
HTML是用来标记Web信息如何展示以及其他特性的一种语法规则,它最初于1989年由CERN的Tim Berners-Lee发明。HTML基于更古老一些的语言SGML定义,并简化了其中的语言元素。这些元素用于告诉浏览器如何在用户的屏幕上展示数据,所以很早就得到各个Web浏览器厂商的支持。 [5]
HTML历史上有如下版本: [5]
③HTML 3.2:1997年1月14日,W3C推荐标准。 [5]
④HTML 4.0:1997年12月18日,W3C推荐标准。 [5]
⑥HTML 5:HTML5是公认的下一代Web语言,极大地提升了Web在富媒体、富内容和富应用等方面的能力,被喻为终将改变移动互联网的重要推手。Internet Explorer 8及以前的版本不支持。 [6]
HTML在Web迅猛发展的过程中起着重要作用,有着重要的地位。但随着网络应用的深入,特别是电子商务的应用,HTML过于简单的缺陷很快凸现出来:HTML不可扩展。HTML不允许应用程序开发者为具体的应用环境定义自定义的标记。HTML只能用于信息显示。HTML可以设置文本和图片显示方式,但没有语义结构,即HTML显示数据是按照布局而非语义的。随着网络应用的发展,各行业对信息有着不同的需求,这些不同类型的信息未必都是以网页的形式显示出来。例如,当通过搜索引擎进行数据搜索时,按照语义而非按照布局来显示数据会具有更多的优点。
XML
XHTML是使用XML 1.0改写自HTML 4.01的独立语言。它不再被作为单独标准开发。
undefined XHTML 1.0 [19], 2000年1月26日作为W3C推荐标准发布。修订版于2002年8月1日发布,它提供与HTML 4.0和4.01相同的三个变化,这些变化被重新在XML中制定。
undefined XHTML 1.1 [20],基于XHTML 1.0 严格版,2001年5月31日 作为W3C推荐标准发布。修订版可使用模块化XHTML(页面存档备份,存于互联网档案馆)的模块,2001年4月10日作为W3C推荐标准发布。
undefined XHTML 2.0为工作草案,但为支持HTML5与XHTML5的工作,此草案被放弃 [21-23]。 XHTML 2.0与XHTML 1.x不兼容,因此更确切的说这是一个XHTML风格的新语言而不是XHTML 1.x的更新。
undefined 在HTML5草案中规定一个XHTML语法,称为“XHTML5.1” [24]。
HTML特点
播报编辑
- 1.
- 2.
- 3.
- 4.通用性:另外,HTML是网络的通用语言,一种简单、通用的全置标记语言。它允许网页制作人建立文本与图片相结合的复杂页面,这些页面可以被网上任何其他人浏览到,无论使用的是什么类型的电脑或浏览器。 [4]
编辑方式
播报编辑
编辑
HTML其实是文本,它需要浏览器的解释,它的编辑器大体可以分为以下几种:
- 1.
- 2.半所见即所得软件,如:FCK-Editer、E-webediter等在线网页编辑器;尤其推荐:Sublime Text代码编辑器(由Jon Skinner开发,Sublime Text2收费但可以无限期试用)。 [7]
- 3.所见即所得软件,使用最广泛的编辑器,完全可以一点不懂HTML的知识就可以做出网页,如:AMAYA(出品单位:万维网联盟);FRONTPAGE(出品单位:微软);Dreamweaver(出品单位Adobe)。Microsoft Visual Studio(出品公司:微软):其中所见即所得软件与半所见即所得的软件相比,开发速度更快,效率更高,且直观的表现更强。任何地方进行修改只需要刷新即可显示。缺点是生成的代码结构复杂,不利于大型网站的多人协作和精准定位等高级功能的实现。 [7]
字符集
除了常见的ASCII字符和汉字,HTML还有许多特殊字符,它们一起构成了HTML字符集。有2种情况需要使用特殊字符,一是网页中有其特殊意义的字符,二是键盘上没有的字符。HTML字符可以用一些代码来表示,代码可以有2种表示方式。即字符代码(命名实体)和数字代码(编号实体)。字符代码以“&”符开始,以分号";"结束,其间是字符名,如®。数字代码也以“&#”符开始,以分号";"结束,其间是编号,如®。 [8]
字符 | 实体名称 | 实体编号 | 描述 | 字符 | 实体名称 | 实体编号 | 描述 |
& | & | & | 与符号 | (空格) | |   | 不间断空格 |
< | < | < | 小于号 | ¬ | ¬ | ¬ | 逻辑非符号 |
> | > | > | 大于号 | µ | µ | µ | 微符号 |
" | " | " | 双引号 | √ | √ | √ | 平方根 |
' | ' | ' | 单引号 | ∑ | ∑ | ∑ | 求和符号 |
€ | € | € | 欧元符号 | ∏ | ∏ | ∏ | 乘积符号 |
¥ | ¥ | ¥ | 日元符号 | ∂ | ∂ | ∂ | 偏导符号 |
£ | £ | £ | 英镑符号 | ∫ | ∫ | ∫ | 积分符号 |
§ | § | § | 段落符号 | ∇ | ∇ | ∇ | 向量微分符号 |
¶ | ¶ | ¶ | 换行符号 | ∝ | ∝ | ∝ | 成比例符号 |
¢ | ¢ | ¢ | 分币符号 | ≈ | ≈ | ≈ | 约等于符号 |
∞ | ∞ | ∞ | 无限符号 | ≠ | ≠ | ≠ | 不等号 |
± | ± | ± | 正负号 | ≤ | ≤ | ≤ | 小于或等于 |
× | × | × | 乘号 | ≥ | ≥ | ≥ | 大于或等于 |
÷ | ÷ | ÷ | 除号 | ⊕ | ⊕ | ⊕ | 直和符号 |
⊆ | ⊆ | ⊆ | 子集等于符号 | ⊗ | ⊗ | ⊗ | 张量积符号 |
⊇ | ⊇ | ⊇ | 超集等于符号 | ∩ | ∩ | ∩ | 交集符号 |
↔ | ↔ | ↔ | 左右箭头 | ∪ | ∪ | ∪ | 并集符号 |
↑ | ↑ | ↑ | 向上箭头 | ∅ | ∅ | ∅ | 空集符号 |
↓ | ↓ | ↓ | 向下箭头 | ∈ | ∈ | ∈ | 属于符号 |
→ | → | → | 向右箭头 | ∉ | ∉ | ∉ | 不属于符号 |
← | ← | ← | 向左箭头 | ∃ | ∃ | ∃ | 存在符号 |
↵ | ↵ | ↵ | 回车箭头符号 | ∀ | ∀ | ∀ | 对所有符号 |
✓ | ✓ | ✓ | 复选标记 | ⊂ | ⊂ | ⊂ | 子集符号 |
✗ | ✗ | ✗ | 错误标记 | ⊃ | ⊃ | ⊃ | 超集符号 |
♠ | ♠ | ♠ | 黑桃符号 | ♂ | ♂ | ♂ | 男性符号 |
♥ | ♥ | ♥ | 红心符号 | ♀ | ♀ | ♀ | 女性符号 |
♦ | ♦ | ♦ | 方块符号 | ☺ | ⌣ | ☺ | 笑脸 |
♣ | ♣ | ♣ | 梅花符号 | ☹ | &sad; | ☹ | 哭脸 |
数据类型
超文本标记语言定义了多种数据类型的元素内容,如脚本数据和样式表的数据,和众多类型的属性值,包括ID、名称、URI、数字、长度单位、语言、媒体描述符、颜色、字符编码、日期和时间等。所有这些数据类型都是专业的字符数据。 [9]
常见实体
显示结果 | 描述 | 实体名称 | 实体编号 |
|---|---|---|---|
空格 | | ||
< | 小于号 | < | < |
> | 大于号 | > | > |
& | 和号 | & | & |
" | 引号 | " | " |
' | 撇号 | ' (IE不支持) | ' |
¢ | 分 | ¢ | ¢ |
£ | 镑 | £ | £ |
¥ | 人民币、日元 | ¥ | ¥ |
€ | 欧元 | € | € |
§ | 小节 | § | § |
© | 版权 | © | © |
® | 注册商标 | ® | ® |
™ | 商标 | ™ | ™ |
× | 乘号 | × | × |
÷ | 除号 | ÷ | ÷ |
整体结构
播报编辑
一个网页对应多个HTML文件,超文本标记语言文件以.htm或.html(外语缩写)为扩展名(其中.htm是因为之前的文件系统只支持最多三位扩展名)。可以使用任何能够生成TXT类型源文件的文本编辑器来产生超文本标记语言文件,只用修改文件后缀即可。标准的超文本标记语言文件都具有一个基本的整体结构,标记一般都是成对出现(部分标记除外例如:<br/> <img/>),即超文本标记语言文件的开头与结尾标志和超文本标记语言的头部与实体两大部分。这些成对出现的标签中,第一个标签是开始标签,第二个标签是结束标签。两个标签之间为元素的内容,有些标签没有内容,为空元素,如<img>有三个双标记符用于页面整体结构的确认。 [10]
部分标记也可以不成对出现,如<p>,但是一般并不赞同这样做。
标记符<html>,说明该文件是用超文本标记语言来描述的,它是文件的开头;而</html>,则表示该文件的结尾,它们是超文本标记语言文件的开始标记和结尾标记。 [10]
头部内容
标记符<html>:说明该文件是用超文本标记语言来描述的,它是文件的开头,而</html>则表示该文件的结尾,它们是超文本标记语言文件的开始标记和结尾标记。 [10]
<head></head>:这2个标记符分别表示头部信息的开始和结尾。头部中包含的标记是页面的标题、序言、说明等内容,它本身不作为内容来显示,但影响网页显示的效果。头部中最常用的标记符是标题标记符和meta标记符,其中标题标记符用于定义网页的标题,它的内容显示在网页窗口的标题栏中,网页标题可被浏览器用做书签和收藏清单。 [10]
以下表格列出了 HTML head 元素:
标签 | 描述 |
|---|---|
<head> | 定义了文档的信息 |
<title> | 定义了文档的标题 |
<base> | 定义了页面链接标签的默认链接地址 |
<link> | 定义了一个文档和外部资源之间的关系 |
<meta> | 定义了HTML文档中的元数据 |
<script> | 定义了客户端的脚本文件 |
<> | 定义了HTML文档的样式文件 |
主体内容
- 标题:总共有6个等级,定义方法如下
<h1></h1>定义一级标题
<h2></h2>定义二级标题
<h3></h3>定义三级标题
<h4></h4>定义四级标题
<h5></h5>定义五级标题
<h6></h6>定义六级标题
以此类推
- 文本
<p></p>定义文本
- 换行符
<br/>换行符
示例: [1]
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Title</title>
</head>
<body>
<h1>这是一级标题</h1>
<h2>这是二级标题</h2>
<h3>这是三级标题</h3>
<h4>这是四级标题</h4>
<h5>这是五级标题</h5>
<h6>这是六级标题</h6>
<p>定义文本</p>
<p>随便字符<br/>《-换行符</p>
</body>
</html>
相关要求
播报编辑
在编辑超文本标记语言文件和使用有关标记符时有一些约定或默认的要求。 [9]
- 1.
- 2.
- 3.
- 4.
- 5.
