- 您的位置:
- 标准下载网 >>
- 标准分类 >>
- 国家标准(GB) >>
- GB 18030-2005 信息技术 中文编码字符集

【国家标准(GB)】 信息技术 中文编码字符集
本网站 发布时间:
2024-07-12 11:42:20
- GB18030-2005
- 现行
标准号:
GB 18030-2005
标准名称:
信息技术 中文编码字符集
标准类别:
国家标准(GB)
标准状态:
现行-
发布日期:
2005-11-08 -
实施日期:
2006-05-01 出版语种:
简体中文下载格式:
.rar.pdf下载大小:
19.08 MB
标准ICS号:
信息技术、办公机械设备>>35.040字符集和信息编码中标分类号:
电子元器件与信息技术>>信息处理技术>>L71编码、字符集、字符识别
替代情况:
替代GB 18030-2000

点击下载
标准简介:
标准下载解压密码:www.bzxz.net
本标准规定了信息技术用的中文图形字符及其二进制编码的十六进制表示。 GB 18030-2005 信息技术 中文编码字符集 GB18030-2005

部分标准内容:
ICS35.040
中华人民共和国国家标准
GB 18030-2005
标准分享网
信息技术
中文编码字符集
Information technology-Chinese coded character set2005-11-08发布
中华人民共和国国家质量监督检验检疫总局中国国家标准化管理委员会
2006-05-01实施
规范性引用文件
术语和定义
总体结构
字符的排列顺序
码位分配
双学节字符表
附录A(规范性附录)
A.1表的内容
A.2表的说期..
附录B(规范性附录)表意文字描述符附录C(规范性附录
附录D(规范性附录)
D. 1 表的内容
D.2表的说明
追加的汉字及部首/构件
四字药字符表
附录E(规范性附录)
部分字符代码的说明
GB18030—2005
GB18030-—2005
本标准的单字节编码部分、双字节编码部分和四字节编码部分的CJK统一汉字扩充A(即0x8139EE39—0x82358738)部分为强制性,本标准代替GB18030-2000&信息技术信息交换用汉字编码字符集基本集的扩充》。本标准与上一版比,增加了编码汉字的数量,并补充规定了我国部分少数民族文字在本标准中的代码位置;本标准重新规定了字符\而”的编码位置:本标准的编码体系结构保持不变。本标准的附录A、附录B、附录C、附录D和附录E是规范性附录。本标准由中华人民共和国信息产业部提出。本标准由中国电子技术标准化研究所归口1。本标准起草单位:信息产业部电子工业标准化研究所,北京大学计算机技术研究所、北大方正集团、北京方正新天地信息网络科技有限责任公司、四通集团公司,中国电子信息产业发展研充院、中科院软件所、长城软件公司、四通利方公司、中软总公司、金山软件公司、联想集团有限公司。本标准主要起草人:陈堃辣、黄疆、胡万进、张建国、陈壮。本标准于2000年首次发布,本次为第次修订。1范园
信息技术中文编码字符集
GB 180302005
本标准作为GB/T2311体系的编码字符标准,规定了信息技术用的中文图形字符及其二进制编码的十六进制表示。
本标准适用于图形字符信息的处理、交换、存储、传输、显现,输人和输出。2规范性引用文样
下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究基否可使用这些文件的最新版本。凡是不注日期的引用文件,其量新版本适用于本标准,GB/T 2311—2000:信息处理 字符代码结构与扩充技术(idtISO/IEC2022:1994)GB2312—1980信息交换用汉字编码字符集基本集GB/T11383—1989信息处理信息交换用八位代码结构和编码规则(idt1S04873,1986)GB12345-1990信息交换用源字编码字符集辅助集GB13000.1一1993信息技术通用多八位编码字符集(UCS)第一部分:体系结构与基本多文种平面(idt IS0/IEC 10646-11993)3原
本标准向下与国家标准GB2312信息处理交换码所对应的内码兼容。本标准在字汇上支持CB13000的全部中、日、韩(CJK)统一汉字(包括CJK统一汉字扩充A、CJK统一汉字扩充B)字符和我国部分少数民族文字的字符。4术语和定义
下列术语和定义适用于本标准。4.1
宇符character
供组织,控制或表示数据用的元素集合中的一个元素。4.2
编码字符 coded character
字符及其编码表示。
李汇 repertoire
用缔缩码字符集表示的一个指定的字符集食,4. 4
保留区reserved zone
本标准中留作未来国家标准规定的区域,5字汇
本标唯收录的字符以单学节、双节或四字节编码。1
GB 18030—2005
5. 1单手节部分
本标准中,单字节的部分收录了GB/T11383—1989的0x00到0x7F全部128个字符。5.2双字节部分
本标准中.双字节的部分收录内容如下:GB13000.1-.1993的全部CIK统一汉字字符。见附录A。GB13000.1—1993的CTK兼容区中的21个汉字。见附录A。GRB13000.1—1993中收崇而GB2312未收录的我国台湾地区使用的图形字符139个。见附录A,GB13000.1·1993收录的其他字符31个。见附录A。GR 2312—1980 中的非汉字符号。见附录 AGB12345—1990的竖排标点符号19个。见附录AGB2312一1980未收录的10个小写罗马数字。见附录A。GB2312—1980未收录的带音调的汉语拼音字母5个以及α和g。见附录A。汉字数字\O”。见附录A。
表意文学描述符13个。见附录A和附录B。对GB13000.1—1993增补的没字和部首/构件80个。见附录A和附录C。双字节编码的欧元符号。见附录A。5.3四字节部分,
本标准的四字节的部分,收录了上述双字节字符之外的,GB 13000 的 CIK统一没字扩充 A,CJK统一汉字扩充和已经在GB13000中编码的我国少数民族文字的字符。见附录D。6总体结构
本标准中、采用单字节、双字节或四字节对字符编码。本标准中的任何一个宁节均由八位二进制位串组成,任何一个八位的值均由0x00至xFF的十六进制记数法表示。本标准中,凡数字前标有0x的表示采用十六进制,未标有0x的表示采用十进制。单字节部分来用GB/T11383—1989的编码结构与规则使用0x00至0x7F码位。双字节部分采用两个八位二进制位串表示一个学符.其首字节码位从0x81至0xFE,尾字节码位分别是0x40至0x7E0x80至0xFE。
四字节部分采用GB/11383—1989未采用的0x30到x39作为对双字节编码扩充的后缀。这样扩充的四字节编码,其范围为0x81308130到0xFE39FF39。四学节字符的第一个字节编码范国为0x81至0xFE,第二个字节编码范围为0x30至0x39,第三个字节编码范囤为0x81至0xFE,第四个字节编码范围为x30 至 0x39。即,
0x81308130至0x81308139;
0x81308230至0x81308239
0x81301-E30至0x8130FF39
0x81318139至0x81318139
0x81311E30至0x8131FF89;
0x82308130至0x82308139,
0x8230FE30至0x8230FE39,
0xFE308130至0xFE308139+
DxFE39FE30至0xFE39FE39
总体结构见表1及图1。
字节数
单字节
第一字节
双字节
四字节
0x81~0xFE
第一字节
0x81~-DxFE
曾字书
第二字节
第一,二学节
字符的排列灏序
表 1 码位范围分配图
0x00-0x7F
第二字节
0x40~0x7E,
0x80-0xFE
第二学节
0x30--0x39
甩字节下载标准就来标准下载网
-0×7E:0x80
第三学节
第三字节
0x81~0xFE
单字节塘构
第四字节
0x30~~0x39
致宇节结构
共1250组
第三半
第回半节
第三,园字节
总体结构围
7、1单字节部分字符的排列序
第四字节
四学节总体
GB18030—2005
码位数目
128个码位
23940个码位
15876个码位
本标准中单字节部分所有字符按照GB/T11383—1989中相应字符的顺序排列,见图2。3
GB18030--2005
7.2双字节部分字符的排列顺序
本标准双字节部分的字符排列顺序见附录A。7.3四字节部分字符的排列顺序
自0x81308130至0x8439FE39共50400个码位,对应本标准双字节部分未包括的所有GB13000基本多文种平面的字符,按照 GB 13000 基本多文种平面相应字符的题序排列,剩余码位保留,自0x85308130至0xB539FE39共12600个码位,为本标准的保留区,留待未来字符扩展使用。自0x86308130至0x8F39FE39共126000个码位,为本标准的保留区,留待未来汉字字符扩展使用。
自0x90308130至0xE339FE39共1058400个码位,用于对应GB13000的16个辅助平面,字符排列顺序完全遵照GB13000的16个辅勘平面的相应码位顺序依次排列,剩余码位保留。自0xE4308130至0xFC39FE39共315000个码位,为本标准的保留区,留待未来标准扩展使用。自0xFD308130至0xFE39FE39共25200个码位,为用户自定义区。见附录
8码位分配
8、1单字节部分的码位分配
本标准中,单字节部分的码位分配见GB/T11383·-1989。见图2。bao
64b3b62b
图2单字节区码位图
8.2双字节部分的码位分配
GB 18030—2005
本标准中,双字节部分的码位安排分为0x8140至0xFE7E和0x8180至0xFEFE两部分,共23940个码位。见图3及表2。
着宇书
0xA8-0xA9
双客节S区:
Ox7E0x80
本字书3区:6080#位
欢字款用户区3.672码位
双字书4区:8160码位
888888888811888888888888888
888885#字区219083
西形特号区(10362
双字书1区:846码位
双字书用户区1.564码货
欢字2区:6768码放
双学书用户区2:655务位
旧户自定义区(1894)总北:23940个号位留3双字节部分编码空间结构图
表2双字节部分的码位安排
符号区
汉字区
用户自
定义区
双学节
效字节
双字节
双字节
双字节
双字节用
户区1
双字节用
户区2
双学节用
户区3
码位范围
首字节0xAl~~0xA9
昆字节 0xA1~0xFE
首字节 0xA8~0xA9
尾字节0元10~0x7E种0x80~0xA0
首字节0元B0~0元F7
尾字节 0x41~0xFE
首字节0x81-0xA0
届节0x40~0x7E和0x80~0xFE
首字节0xAA-0xFE
尾字节0x40~0×7E和0x80~0xA0
首字节 0xAA~0xAF
尾字节0xA1~0xFE
肯字节 0xFB~0xFE
尾字节0xA1~0xFE
首宇节0xA10xA7
尾字节0x40~0x7E和0x80~0xA0
妈位数
字符数
字符类型
图形符号
图形符号
GB18030—2005
8.3西字节部分的位分配
本标准的四字节部分收录「汉字稚一部分我国少数民族文字,码位分配见表3。表 3中没有指明的姻字节码位分配见7.3条。
码位范固
0x813181320x81319934
0x8430BA32-~0x8430FE35
0x84318730-0x84319530
0x8132E834--0x8132FD31
0x8134D238--0x8134E337
0x8134F474~-Dx8134F830
0x823598330x82369435
0x81339D36-0x8133B635
0x8139A9330x8139B734
0x8237CF33~0x8336BE36
0x8139EE39-0x82358738
0x95328236-0x9835F336
码位数
四字节部分的码位安排
字符类型
维吾尔、哈萨克、柯尔克兹文
维吾尔、哈萨克、柯尔克兹文
维吾尔、哈萨克、柯尔克兹文
蒙古文包括满文,托忒文、竭们文和阿礼喱秘文德宏傣文
朝鲜文字母
朗鲜文兼容字母
朝鲜女音节
CIK统-汉字扩充 A
CJK统--孜字扩充 B
A.1表的内容
附录A
(规范性附录)
双字节字符表
本表给出木标准效字书部分的字符的全部GB13000.1代码及其相应字形。A.2表的说明
示例如下:
第一节
第二字节高位
第二字节低位
双字节3区
GB 13000.1字形
GB 13000.1 代码
GB18030—2005
GB 180302005
248元
20元g
222月
双字节1区
203月
3心85
双字节1区
E775 E776
30B元
039元
GB 18030—2005
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。
中华人民共和国国家标准
GB 18030-2005
标准分享网
信息技术
中文编码字符集
Information technology-Chinese coded character set2005-11-08发布
中华人民共和国国家质量监督检验检疫总局中国国家标准化管理委员会
2006-05-01实施
规范性引用文件
术语和定义
总体结构
字符的排列顺序
码位分配
双学节字符表
附录A(规范性附录)
A.1表的内容
A.2表的说期..
附录B(规范性附录)表意文字描述符附录C(规范性附录
附录D(规范性附录)
D. 1 表的内容
D.2表的说明
追加的汉字及部首/构件
四字药字符表
附录E(规范性附录)
部分字符代码的说明
GB18030—2005
GB18030-—2005
本标准的单字节编码部分、双字节编码部分和四字节编码部分的CJK统一汉字扩充A(即0x8139EE39—0x82358738)部分为强制性,本标准代替GB18030-2000&信息技术信息交换用汉字编码字符集基本集的扩充》。本标准与上一版比,增加了编码汉字的数量,并补充规定了我国部分少数民族文字在本标准中的代码位置;本标准重新规定了字符\而”的编码位置:本标准的编码体系结构保持不变。本标准的附录A、附录B、附录C、附录D和附录E是规范性附录。本标准由中华人民共和国信息产业部提出。本标准由中国电子技术标准化研究所归口1。本标准起草单位:信息产业部电子工业标准化研究所,北京大学计算机技术研究所、北大方正集团、北京方正新天地信息网络科技有限责任公司、四通集团公司,中国电子信息产业发展研充院、中科院软件所、长城软件公司、四通利方公司、中软总公司、金山软件公司、联想集团有限公司。本标准主要起草人:陈堃辣、黄疆、胡万进、张建国、陈壮。本标准于2000年首次发布,本次为第次修订。1范园
信息技术中文编码字符集
GB 180302005
本标准作为GB/T2311体系的编码字符标准,规定了信息技术用的中文图形字符及其二进制编码的十六进制表示。
本标准适用于图形字符信息的处理、交换、存储、传输、显现,输人和输出。2规范性引用文样
下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究基否可使用这些文件的最新版本。凡是不注日期的引用文件,其量新版本适用于本标准,GB/T 2311—2000:信息处理 字符代码结构与扩充技术(idtISO/IEC2022:1994)GB2312—1980信息交换用汉字编码字符集基本集GB/T11383—1989信息处理信息交换用八位代码结构和编码规则(idt1S04873,1986)GB12345-1990信息交换用源字编码字符集辅助集GB13000.1一1993信息技术通用多八位编码字符集(UCS)第一部分:体系结构与基本多文种平面(idt IS0/IEC 10646-11993)3原
本标准向下与国家标准GB2312信息处理交换码所对应的内码兼容。本标准在字汇上支持CB13000的全部中、日、韩(CJK)统一汉字(包括CJK统一汉字扩充A、CJK统一汉字扩充B)字符和我国部分少数民族文字的字符。4术语和定义
下列术语和定义适用于本标准。4.1
宇符character
供组织,控制或表示数据用的元素集合中的一个元素。4.2
编码字符 coded character
字符及其编码表示。
李汇 repertoire
用缔缩码字符集表示的一个指定的字符集食,4. 4
保留区reserved zone
本标准中留作未来国家标准规定的区域,5字汇
本标唯收录的字符以单学节、双节或四字节编码。1
GB 18030—2005
5. 1单手节部分
本标准中,单字节的部分收录了GB/T11383—1989的0x00到0x7F全部128个字符。5.2双字节部分
本标准中.双字节的部分收录内容如下:GB13000.1-.1993的全部CIK统一汉字字符。见附录A。GB13000.1—1993的CTK兼容区中的21个汉字。见附录A。GRB13000.1—1993中收崇而GB2312未收录的我国台湾地区使用的图形字符139个。见附录A,GB13000.1·1993收录的其他字符31个。见附录A。GR 2312—1980 中的非汉字符号。见附录 AGB12345—1990的竖排标点符号19个。见附录AGB2312一1980未收录的10个小写罗马数字。见附录A。GB2312—1980未收录的带音调的汉语拼音字母5个以及α和g。见附录A。汉字数字\O”。见附录A。
表意文学描述符13个。见附录A和附录B。对GB13000.1—1993增补的没字和部首/构件80个。见附录A和附录C。双字节编码的欧元符号。见附录A。5.3四字节部分,
本标准的四字节的部分,收录了上述双字节字符之外的,GB 13000 的 CIK统一没字扩充 A,CJK统一汉字扩充和已经在GB13000中编码的我国少数民族文字的字符。见附录D。6总体结构
本标准中、采用单字节、双字节或四字节对字符编码。本标准中的任何一个宁节均由八位二进制位串组成,任何一个八位的值均由0x00至xFF的十六进制记数法表示。本标准中,凡数字前标有0x的表示采用十六进制,未标有0x的表示采用十进制。单字节部分来用GB/T11383—1989的编码结构与规则使用0x00至0x7F码位。双字节部分采用两个八位二进制位串表示一个学符.其首字节码位从0x81至0xFE,尾字节码位分别是0x40至0x7E0x80至0xFE。
四字节部分采用GB/11383—1989未采用的0x30到x39作为对双字节编码扩充的后缀。这样扩充的四字节编码,其范围为0x81308130到0xFE39FF39。四学节字符的第一个字节编码范国为0x81至0xFE,第二个字节编码范围为0x30至0x39,第三个字节编码范囤为0x81至0xFE,第四个字节编码范围为x30 至 0x39。即,
0x81308130至0x81308139;
0x81308230至0x81308239
0x81301-E30至0x8130FF39
0x81318139至0x81318139
0x81311E30至0x8131FF89;
0x82308130至0x82308139,
0x8230FE30至0x8230FE39,
0xFE308130至0xFE308139+
DxFE39FE30至0xFE39FE39
总体结构见表1及图1。
字节数
单字节
第一字节
双字节
四字节
0x81~0xFE
第一字节
0x81~-DxFE
曾字书
第二字节
第一,二学节
字符的排列灏序
表 1 码位范围分配图
0x00-0x7F
第二字节
0x40~0x7E,
0x80-0xFE
第二学节
0x30--0x39
甩字节下载标准就来标准下载网
-0×7E:0x80
第三学节
第三字节
0x81~0xFE
单字节塘构
第四字节
0x30~~0x39
致宇节结构
共1250组
第三半
第回半节
第三,园字节
总体结构围
7、1单字节部分字符的排列序
第四字节
四学节总体
GB18030—2005
码位数目
128个码位
23940个码位
15876个码位
本标准中单字节部分所有字符按照GB/T11383—1989中相应字符的顺序排列,见图2。3
GB18030--2005
7.2双字节部分字符的排列顺序
本标准双字节部分的字符排列顺序见附录A。7.3四字节部分字符的排列顺序
自0x81308130至0x8439FE39共50400个码位,对应本标准双字节部分未包括的所有GB13000基本多文种平面的字符,按照 GB 13000 基本多文种平面相应字符的题序排列,剩余码位保留,自0x85308130至0xB539FE39共12600个码位,为本标准的保留区,留待未来字符扩展使用。自0x86308130至0x8F39FE39共126000个码位,为本标准的保留区,留待未来汉字字符扩展使用。
自0x90308130至0xE339FE39共1058400个码位,用于对应GB13000的16个辅助平面,字符排列顺序完全遵照GB13000的16个辅勘平面的相应码位顺序依次排列,剩余码位保留。自0xE4308130至0xFC39FE39共315000个码位,为本标准的保留区,留待未来标准扩展使用。自0xFD308130至0xFE39FE39共25200个码位,为用户自定义区。见附录
8码位分配
8、1单字节部分的码位分配
本标准中,单字节部分的码位分配见GB/T11383·-1989。见图2。bao
64b3b62b
图2单字节区码位图
8.2双字节部分的码位分配
GB 18030—2005
本标准中,双字节部分的码位安排分为0x8140至0xFE7E和0x8180至0xFEFE两部分,共23940个码位。见图3及表2。
着宇书
0xA8-0xA9
双客节S区:
Ox7E0x80
本字书3区:6080#位
欢字款用户区3.672码位
双字书4区:8160码位
888888888811888888888888888
888885#字区219083
西形特号区(10362
双字书1区:846码位
双字书用户区1.564码货
欢字2区:6768码放
双学书用户区2:655务位
旧户自定义区(1894)总北:23940个号位留3双字节部分编码空间结构图
表2双字节部分的码位安排
符号区
汉字区
用户自
定义区
双学节
效字节
双字节
双字节
双字节
双字节用
户区1
双字节用
户区2
双学节用
户区3
码位范围
首字节0xAl~~0xA9
昆字节 0xA1~0xFE
首字节 0xA8~0xA9
尾字节0元10~0x7E种0x80~0xA0
首字节0元B0~0元F7
尾字节 0x41~0xFE
首字节0x81-0xA0
届节0x40~0x7E和0x80~0xFE
首字节0xAA-0xFE
尾字节0x40~0×7E和0x80~0xA0
首字节 0xAA~0xAF
尾字节0xA1~0xFE
肯字节 0xFB~0xFE
尾字节0xA1~0xFE
首宇节0xA10xA7
尾字节0x40~0x7E和0x80~0xA0
妈位数
字符数
字符类型
图形符号
图形符号
GB18030—2005
8.3西字节部分的位分配
本标准的四字节部分收录「汉字稚一部分我国少数民族文字,码位分配见表3。表 3中没有指明的姻字节码位分配见7.3条。
码位范固
0x813181320x81319934
0x8430BA32-~0x8430FE35
0x84318730-0x84319530
0x8132E834--0x8132FD31
0x8134D238--0x8134E337
0x8134F474~-Dx8134F830
0x823598330x82369435
0x81339D36-0x8133B635
0x8139A9330x8139B734
0x8237CF33~0x8336BE36
0x8139EE39-0x82358738
0x95328236-0x9835F336
码位数
四字节部分的码位安排
字符类型
维吾尔、哈萨克、柯尔克兹文
维吾尔、哈萨克、柯尔克兹文
维吾尔、哈萨克、柯尔克兹文
蒙古文包括满文,托忒文、竭们文和阿礼喱秘文德宏傣文
朝鲜文字母
朗鲜文兼容字母
朝鲜女音节
CIK统-汉字扩充 A
CJK统--孜字扩充 B
A.1表的内容
附录A
(规范性附录)
双字节字符表
本表给出木标准效字书部分的字符的全部GB13000.1代码及其相应字形。A.2表的说明
示例如下:
第一节
第二字节高位
第二字节低位
双字节3区
GB 13000.1字形
GB 13000.1 代码
GB18030—2005
GB 180302005
248元
20元g
222月
双字节1区
203月
3心85
双字节1区
E775 E776
30B元
039元
GB 18030—2005
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。

标准图片预览:





- 热门标准
- 国家标准(GB)标准计划
- GB/T39648-2020 纺织品 色牢度试验 数字图像技术评级
- GB40050-2021 网络关键设备安全通用要求
- GB/T25811-2010 染料试验用标准漂白涤纶布
- GB/T2910.16-2024 纺织品 定量化学分析 第16部分:聚丙烯纤维与某些其他纤维的混合物(二甲苯法)
- GB/T529-2008 硫化橡胶或热塑性橡胶撕裂强度的测定(裤形、直角形和新月形试样)
- GB/T43423-2023 空间数据与信息传输系统 深空光通信编码与同步
- GB/T26863-2022 火电站监控系统术语
- GB/T36434-2018 复杂机械手表机心万年历和打簧机构零部件的名称
- GB/T30966.6-2022 风力发电机组 风力发电场监控系统通信 第6部分:状态监测的逻辑节点类和数据类
- GB/T23639-2009 节能耐腐蚀钢制电缆桥架
- GB/T24204-2009 高炉炉料用铁矿石 低温还原粉化率的测定 动态试验法
- GB/T5009.68-2003 食品容器内壁过氯乙烯涂料卫生标准的分析方法
- GB/T23315-2009 粘扣带
- GB/T29529-2013 泵的噪声测量与评价方法
- GB50030-2013 氧气站设计规范
请牢记:“bzxz.net”即是“标准下载”四个汉字汉语拼音首字母与国际顶级域名“.net”的组合。 ©2009 标准下载网 www.bzxz.net 本站邮件:[email protected]
网站备案号:湘ICP备2023016450号-1
网站备案号:湘ICP备2023016450号-1