HTML5字符编码

字符编码是一种将字节转换为字符的方法。要验证或显示HTML文档,程序必须选择字符编码。HTML5作者通过三种方式设置字符编码:

HTTP内容类型标头

如果您正在编写CGI或类似程序,则可以使用HTTP Content-Type标头设置任何字符编码。

print "Content-Type: text/html; charset=utf-8\r\n";

<meta>元素

您可以将<meta>元素与charset属性一起使用,该属性指定HTML5文档前512个字节内的编码。

<meta charset="UTF-8">

Unicode字节顺序标记(BOM)

字节顺序标记(BOM)由数据流开头的字符代码U + FEFF组成,在这里它可用作定义字节顺序和编码形式的签名,主要是未标记的纯文本文件。