酷站(www.ku0.com)-致力于为互联网从业者提供动力!

热门关键词:  企业  as  baidu  c4rp3nt3r  美女
酷站

html

旗下栏目: html css xml html5 DW bootstrap Frontpage教程

详解网页编码之GB2312、GBK与UTF-8的区别

来源:互联网搜集 作者:秩名 人气: 发布时间:2019-12-22
本篇文章主要介绍了详解网页编码之GB2312、GBK与UTF-8的区别,对大家的学习或者工作具有一定的参考学习价值,感兴趣的小伙伴们可以参考一下,也感谢大家对酷站(ku0.com)的支持。

首先,我们要明白,GB2312、GBK和UTF-8都是一种字符编码,除此之外,还有好多字符编码。只是对于我们中国人的网站来说,用这三种编码 比较多。简单的说一下,为什么要用编码,在计算机内,储存文本信息用ASC II码,每一个字符对应着唯一的ASCII码。最初计算机是由美国发明的,他们也用的是键盘和上面的字母,所以他们的字符ASCII好解决。但是我们中国 的就不同了,每个汉字要对应唯一的ASCII码。

这样,就出来了国家制定的字符编码标准:GB2312、GBK等。其他国家,其他语言也有他们对应的编码 标准。 GB 就是国标的意思,GB2312和GBK主要用于汉字的编码,而UTF-8是全世界通用的。意思就是说,如果你的网页主要面对使用汉语的中国人的话,使用 GB2312和GBK非常好,文字储存体积要小,有一些优点。如果你的网页要面向世界的话,你再用GB2312和GBK作为网页编码的话,有些电脑上的浏 览器没有这种编码,你的网页汉字内容就会变成无法识别的乱码。

它们通常用在网页的meta标签内,例如:,表示这个页面使用的是GB2312编码。这个信息是给浏览器看的,浏览器会优先考虑使用从网页头部提取出来的编码信息对网页进行解码。当然, 我们也可以强制浏览器使用某种编码解释网页,这样我们就看到了传说中的乱码。

GBK、GB2312等与UTF8之间都必须通过Unicode编码才能相互转换:

GBK、GB2312--Unicode--UTF8
UTF8--Unicode--GBK、GB2312

对于一个网站、论坛来说,如果英文字符较多,则建议使用UTF-8节省空间。不过现在很多论坛的插件一般只支持GBK。

如果是中文的网站 推荐GB2312 GBK有时还是有点问题 为了避免所有乱码问题,应该采用UTF-8,将来要支持国际化也非常方便 UTF-8可以看作是大字符集,它包含了大部分文字的编码。

使用UTF-8的一个好处是其他地区的用户(如香港台湾)无需安装简体中文支持就能正常观看你的文字*而不会出现乱码。*

gb2312是简体中文的码
gbk支持简体中文及繁体中文
big5支持繁体中文
utf-8支持几乎所有字符

中国大陆最常用的就是GBK18030编码,除此之外还有GBK,GB2312,这几个编码的关系是这样的。 最早制定的汉字编码是GB2312,包括6763个汉字和682个其它符号 95年重新修订了编码,命名GBK1.0,共收录了21886个符号。 之后又推出了GBK18030编码,共收录了27484个汉字,同时还收录了藏文、蒙文、维吾尔文等主要的少数民族文字,现在WINDOWS平台必需要支持GBK18030编码。

GB2312编码大约包含6000多汉字(不包括特殊字符),编码范围为第一位b0-f7,第二位编码范围为a1-fe(第一位为cf时,第二位为a1-d3),计算一下汉字个数为6762个汉字。当然还有其他的字符。包括控制键和其他字符大约7573个字符编码 gbk编码是对G B2312编码的扩充,容纳的汉字更多,但仅仅是扩充,没有质的变化。保留了所有G B2312编码,在此基础上进行编码范围的扩充.容纳(包含特殊字符)共22014个字符编码. gb18030编码是在gbk编码基础上的扩充,因为汉字更多,仅仅使用两位编码已经不能 容纳要求的汉字,所以采用了2\4位混和的办法,可以支持更多的汉字编码。并且保留了原有的gbk 2字节编码兼容G B2312和gbk编码的文件。大概容纳55657个编码(包含特殊字符) unicode编码(也就是UTF编码):俗称万国码,致力于使用统一的编码准则表达各国的文字。 为表达更多的文字,utf-8采用2/3混编的方式。目前容纳的汉字范围小于gbk编码。并且以 3字节的方式处理中文,带来了兼容性的问题,原有的gbk,G B2312,gb18030编码文件都不能正常的处理,还有很长的路要走。

gbk和gb2312的区别有哪些

首先大家要了解什么是gbk?什么是gb2312?我们要知道他们都是一种字符编码,当然字符编码还有很多种。

而字符编码我们可以这样理解:

在计算机中存放的都是0和1的二进制值。

8个位对应一个字节,常用16进制来表示。

那么我们如果想要在计算机上看到我们想要的字符显示,而不是各种0和1的数字该怎么实现呢?

这里我们就需要使计算机把其所存储的对应的16进制的数值,转化为对应的字符,包括英文和中文等其他语言的字符,然后输出到屏幕上。

所以编码也就是,定义了一套规则,去指定哪些数值,对应着哪些字符。

那么字符编码,就是定义了一套规则,指定了计算机中存放的这么多值中的哪个值,对应了电脑屏幕显示出来的哪个字母。

综上所述,大家应该都能理解GBK和GB2312是一种字符编码了吧。

下面我们再具体说说他们的区别与相同点:

相同点:

1、GBK和GB2312 都是16位的!

2、它们通常用在网页的meta标签内。

不同点:

1、GBK字符编码支持简体中文和繁体中文!

GBK全称《汉字内码扩展规范》(GBK即“国标”、“扩展”汉语拼音的第一个字母,英文名称:Chinese Internal Code Specification) ,中华人民共和国全国信息技术标准化技术委员会1995年12月1日制订,国家技术监督局标准化司、电子工业部科技与质量监督司1995年12月15日联合以技监标函1995 229号文件的形式,将它确定为技术规范指导性文件。

2、GB2312只支持简体中文!

《信息交换用汉字编码字符集》是由中国国家标准总局1980年发布,1981年5月1日开始实施的一套国家标准,标准号是GB 2312—1980。

GB 2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个;同时,GB 2312收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个全角字符。

如果你的网页主要面对使用汉语的中国人的话,使用 GB2312和GBK非常好,文字储存体积要小,有一些优点。如果你的网页要面向世界的话,你再用GB2312和GBK作为网页编码的话,有些电脑上的浏览器没有这种编码,你的网页汉字内容就会变成无法识别的乱码。 

您可能感兴趣的文章:

原文链接:https://www.jb51.net/web/706993.html

相关文章

  • 详解网页编码之GB2312、GBK与UTF-8的区别

    详解网页编码之GB2312、GBK与UTF-8的区别

    首先,我们要明白,GB2312、GBK和UTF-8都是一种字符编码,除此之外,还有好多字符编码。只是对于我们中国人的网站来说,用这三种编码 比较多。简单的说一下,为什么要用编码,在计算机内,储存文本信息用ASC II码,每一个字符对应着唯一......
    12-22
  • 解决使用html2canvas对有百度地图的Dom元素处理成图片

    解决使用html2canvas对有百度地图的Dom元素处理成图片

    问题1:百度地图应用的是瓦片式图片(地图是一张张图片拼出来的),html2canvas 处理时,遇到非同一域名下的图片,浏览器会显示跨域的报错,也无法用反向代理来解决,因为瓦片图片的域名不确定,无法指定 proxy_pass 解决 :使用百度地图......
    10-14
  • html/css中float浮动的用法示例教程

    html/css中float浮动的用法示例教程

    一、float基础用法示例 1、我们先建两个div盒子,设置高度、宽度和背景颜色; 最开始两个盒子在网页上的位置如下: 然后我们将红色盒子浮动到右边 然后我们会发现红色盒子浮动到了右边,但是蓝色盒子就直接上移到了原先红色盒子的位置。 ......
    09-10
  • html的几种水平垂直居中的方式(基础)总结

    html的几种水平垂直居中的方式(基础)总结

    我们在编写马过程中,想必大家对水平垂直居中的方法了解并不多。所以我给大家总结式的列出几种常用的水平垂直居中的方法。 第一种方法 !--html盒子代码--!--水平垂直居中--div class=Centered1 pd第一种/p/div!-css样式部分-- .Centered1......
    08-24
  • HTML中的if判断用法解析

    HTML中的if判断用法解析

    在django的web开发过程中,编写html时,从后端传入同名列表变量,但是内容格式有所区别,需要分别判断,查阅了很多文章试了好几种方法,格式似乎都不太对(本人没有系统学习过前端,基本都是照葫芦画瓢)后来找到django框架下html的if用......
    08-24
  • HTML实现检测输入已完成功能的方法

    HTML实现检测输入已完成功能的方法

    使用onInput(event)检测是否在输入 使用onporpertychange=onChange(event)检测是否内容发生改变 使用onBlur=finnishInput(event)检测是否失去焦点 可以通过先检测是否在输入,记下状态,如果上次在输入信息,然后失去焦点,则可以判断为......
    04-18
  • main标签的作用介绍

    main标签的作用介绍

    本篇文章介绍main标签的作用。 main标签的作用是什么? main标签规定文档的主要内容,main的主要目的是将ARIA的地标性作用main映射到 HTML中的元素,这可以帮助那些屏幕阅读设备和辅助设备知道页面的主要内容是从哪里开始的。 说明:main......
    02-11
  • 实现HTML页面局部刷新的代码方法

    实现HTML页面局部刷新的代码方法

    本篇文章给大家介绍实现HTML页面局部刷新的代码方法。 事件响应刷新:有请求才会刷新 1、通过JS HTML DOM或jQuery获取HTML元素,通过DOM方法或jQuery方法监听页面事件,获取用户请求; 2、通过Ajax将用户请求提交至服务器,服务器处理后......
    01-06
  • 详解4种html中position属性用法

    详解4种html中position属性用法

    本文给大家介绍4种html中position属性用法。 position的四个属性值: 1.relative 2.absolute 3.fixed 4.static 下面分别讲述这四个属性: div id=parent div id=sub1sub1/div div id=sub2sub2/div/div 1. relative relative属性相对比较......
    10-27
  • HTML实现双11抢劵(设定时间打开抢券的页面)的方法

    HTML实现双11抢劵(设定时间打开抢券的页面)的方法

    本篇文章给大家介绍HTML实现双11抢劵(设定时间打开抢券的页面)的方法 小编就直接给大家贴代码了,具体代码如下所示: !DOCTYPE htmlhtml lang=en xmlns=http://www.w3.org/1999/xhtmlhead meta charset=utf-8 / title/title style type=t......
    08-26

最新更新