Fe-interview: [html] 第26天 解释下你对GBK和UTF-8的理解?并说说页面上产生乱码的可能原因

Created on 11 May 2019  ·  5Comments  ·  Source: haizlin/fe-interview

第26天 解释下你对GBK和UTF-8的理解?并说说页面上产生乱码的可能原因

html

Most helpful comment

gbk和utf8的理解

我们这里将以最简单最容易理解的方式来描述GBK和UTF8的区别,以及它们分别是什么。

GBK编码:是指中国的中文字符,其它它包含了简体中文与繁体中文字符,另外还有一种字符“gb2312”,这种字符仅能存储简体中文字符。

UTF-8编码:它是一种全国家通过的一种编码,如果你的网站涉及到多个国家的语言,那么建议你选择UTF-8编码。

GBK和UTF8有什么区别?

UTF8编码格式很强大,支持所有国家的语言,正是因为它的强大,才会导致它占用的空间大小要比GBK大,对于网站打开速度而言,也是有一定影响的。

GBK编码格式,它的功能少,仅限于中文字符,当然它所占用的空间大小会随着它的功能而减少,打开网页的速度比较快。

产生乱码的原因

参考:

All 5 comments

gbk和utf8的理解

我们这里将以最简单最容易理解的方式来描述GBK和UTF8的区别,以及它们分别是什么。

GBK编码:是指中国的中文字符,其它它包含了简体中文与繁体中文字符,另外还有一种字符“gb2312”,这种字符仅能存储简体中文字符。

UTF-8编码:它是一种全国家通过的一种编码,如果你的网站涉及到多个国家的语言,那么建议你选择UTF-8编码。

GBK和UTF8有什么区别?

UTF8编码格式很强大,支持所有国家的语言,正是因为它的强大,才会导致它占用的空间大小要比GBK大,对于网站打开速度而言,也是有一定影响的。

GBK编码格式,它的功能少,仅限于中文字符,当然它所占用的空间大小会随着它的功能而减少,打开网页的速度比较快。

产生乱码的原因

参考:

GBK 是中国的中文字符,包含了简体汉字和繁体汉字。而 UTF-8 表示了全球国家通过的一种编码,如果需要做多语言或者国际化的时候,最好采用 UTF-8 来进行编码。

由于 UTF-8 包含了多种语言,也因此其占用的空间会比较大一些。

而网页产生乱码往往是因为编码与解码不匹配造成的。一般我们会在 <meta> 标签中的 content 设置 charset 来决定网页采用的编码。如果引用的文件为其他格式,则会出现无法解释或者解释不对的字符,即乱码问题。

参考文章:乱码是怎样形成的?

  • gbk代表了国内的,不同版本的编码规范,后面数字越大一般对应的范围越大,分别代表了简体字版本,含有繁体版本,含有少数民族字体版本等等,主要在国内,汉文化圈流行。

    • utf系列则适合多语言版本,但是相对应的占用空间的确上升了,是国际组织注意到各国不同的编码版本后推出的国际规范,utf-8出现时间大致在简版GBK之后

    • 网页端的乱码一般是由于源文件的保存编码和声明编码不一致导致的,例如编辑器选择的是utf格式保存,但是声明格式meta..gbk这个样子

GBK代表中文编码
UTF-8代表全球语言通用编码

产生乱码的原因:
meta标签的charset属性的值与 源文件保存的编码不一致

我们这里将以最简单最容易理解的方式来描述GBK和UTF8的区别,以及它们分别是什么。

GBK编码:是指中国的中文字符,其它它包含了简体中文与繁体中文字符,另外还有一种字符“gb2312”,这种字符仅能存储简体中文字符。

UTF-8编码:它是一种全国家通过的一种编码,如果你的网站涉及到多个国家的语言,那么建议你选择UTF-8编码。

Was this page helpful?
0 / 5 - 0 ratings