- 您的位置:
- 标准下载网 >>
- 标准分类 >>
- 国家标准(GB) >>
- GB/T 17961-2000 印刷体汉字识别系统要求与测试方法

【国家标准(GB)】 印刷体汉字识别系统要求与测试方法
本网站 发布时间:
2024-08-02 16:26:35
- GB/T17961-2000
- 现行
标准号:
GB/T 17961-2000
标准名称:
印刷体汉字识别系统要求与测试方法
标准类别:
国家标准(GB)
标准状态:
现行-
发布日期:
2000-01-03 -
实施日期:
2000-08-01 出版语种:
简体中文下载格式:
.rar.pdf下载大小:
173.24 KB
标准ICS号:
信息技术、办公机械设备>>信息技术应用>>35.240.20信息技术在办公中的应用中标分类号:
电子元器件与信息技术>>计算机>>L67计算机应用

点击下载
标准简介:
标准下载解压密码:www.bzxz.net
本标准规定了印刷体汉字识别系统的功能、技术要求和测试方法。本标准适用于印刷体汉字识别系统,也适用于其他有关系统。 GB/T 17961-2000 印刷体汉字识别系统要求与测试方法 GB/T17961-2000

部分标准内容:
ICS.35.240.20
中华人民共和国国家标准
GB/T17961—2000
印刷体汉字识别系统要求与测试方法Requirements and test methods for identifysystem of printed Chinese character2000-01-03发布
2000-08-01实施
国家质量技术监督局发布
GB/T17961—2000
本标准是非键盘输入标准,它规定印刷体汉字识别系统的功能、技术要求、测试方法,该标准的制定和实施将正确引导印刷体汉字识别系统的研制与开发。本标准的附录A是提示的附录。
本标准由中华人民共和国信息产业部提出。本标准由中国电子技术标准化研究所归口。本标准起草单位:“八六三”计算机智能主题专家组。本标准主要起草人:顾小凤、丁晓青、刘迎建、钱跃良。1范围
中华人民共和国国家标准
印刷体汉字识别系统要求与测试方法Requirements and test methods for identifysystem of printed Chinese character本标准规定了印刷体汉字识别系统的功能、技术要求和测试方法。本标准适用于印刷体汉字识别系统,也适用于其他有关系统。2引用标准
GB/T17961—2000
下列标准所包含的条文,通过在本标准中引用而构成为本标准的条文。本标准出版时,所示版本均为有效。所有标准都会被修订,使用本标准的各方应探讨使用下列标准最新版本的可能性。GB2312—1980信息交换用汉字编码字符集基本集GB/T7589—1987信息交换用汉字编码字符集第二辅助集GB/T7590一1987信息交换用汉字编码字符集第四辅助集GB/T12345—1990
信息交换用汉字编码字符集辅助集GB13000.1一1993信息技术通用多八位编码字符集(UCS)第1部分:体系结构(idtISO/IEC10646.4:1993)
GB13131—1991
信息交换用汉字编码字符集第三辅助集GB13132—1991
第五辅助集
信息交换用汉字编码字符集
3系统功能
3.1基本功能
3.1.1预处理
将普通纸媒体文本在自动或人工干预下通过光学输入设备将印刷信息转换成适合识别的灰度(含二值)图像。
3.1.2识别
将上述图像所包括的印刷符号转换为GB2312、GB/T7589、GB/T7590、GB/T12345、GB13000.1、GB13131和GB13132所规定的编码信息。3.2扩展功能
3.2.1版面分析
应将版面自动分成块,并正确标明每个块的属性,对文字块还需标明各块之间连接关系的逻辑序号。
表格识别
应能正确识别表格线,并可将表格和文字建立对应关系。国家质量技术监督局2000-01-03批准2000-08-01实施
4要求
4.1识别率
GB/T17961—2000
对于正式出版物及打印质量与其相当的打印文件的识别率应大于95%。4.2误识率
对于正式出版物及打印质量与其相当的打印文件的误识率应小于2%。4.3识别速度
使用6.3版本,识别速度应大于10字/秒。5测试方法
5.1测试样张
测试时参照采用附录A给出的测试样张,在实际测试时,有关测试机构可依据样张的字体,字号和版面布局随机提供多种测试样张,测试样张至少应包含103个印刷符号。5.2识别率,误识率测试
5.2.1测试设备
应采用通用操作系统及与其相适应的微型数字电子计算机。5.2.2测试样张
测试样张采用5.1规定的样张。
5.2.3测试结果
识别率测试结果按式(1)计算:
识别率=(C/N)×100%
式中:C一一测试样张中被正确识别的印刷符号数;N—测试样张中印刷符号总数。
误识率测试结果按式(2)计算:
误识率=(E/N)×100%
测试样张中被错误识别的印刷符号数;式中.E
N——测试样张中印刷符号总数。测试结果应符合4.1和4.2的要求。5.3识别速度测试
5.3.1测试设备
采用5.2.1规定的测试设备。
5.3.2测试样张
测试样张采用5.1规定的样张。
5.3.3测试结果
识别速度测试结果按式(3)计算:识别速度=N/T
式中:N——测试样张中印刷符号总数;T
一识别系统从开始读取测试数据至将识别结果记录到媒体上所用的时间。识别速度应符合4.3的要求。
(2)
(3)
客中作
兰陵美酒郁金香,
玉碗盛来琥珀光。
但使主人能醉客,
不知何处是他乡。
人生在世
中间小谢又清代
杯销愁愁更
刀断水水更
上青天揽明
怀逸兴壮
GB/T17961—2000
附录A
(提示的附录)
测试样张
兰溪樟歌
戴叔伦
凉月如眉挂柳湾,
越中山色镜中看。
兰溪三日桃花雨,
半夜鲤鱼来上滩。
宣州谢楼伐别校书叔云
我去者”
风万里送秋
日之日多烦
我心者”
日之日不可
将进酒
君不见黄河之水天上来,
奔流到海不复回。
君不见高堂明镜悲白发,
朝如青丝暮成雪。
人生得意须尽欢,
莫使金樽空对月。
天生我材必有用,
千金散尽还复来。
烹羊宰牛且为乐,
会须一饮三百杯。
岑夫子,丹丘生,
将进酒,君莫停。www.bzxz.net
与君歌一曲,
国破山河在,
城春草木深。
感时花溅泪,
恨别鸟惊心。
烽火连三月,
家书抵万金。
白头搔更短,
浑欲不胜簪。
请君为我倾耳听。
钟鼓馕玉不足贵,
但愿长醉不复醒。
古来圣贤皆寂寞,
惟有饮者留其名。
陈王昔时宴平乐,
斗酒十千恣欢。
主人何为言少钱,
径须沽取对君酌。
五花马,千金裘,
呼儿将出换美酒,
与尔同销万古愁。
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。
中华人民共和国国家标准
GB/T17961—2000
印刷体汉字识别系统要求与测试方法Requirements and test methods for identifysystem of printed Chinese character2000-01-03发布
2000-08-01实施
国家质量技术监督局发布
GB/T17961—2000
本标准是非键盘输入标准,它规定印刷体汉字识别系统的功能、技术要求、测试方法,该标准的制定和实施将正确引导印刷体汉字识别系统的研制与开发。本标准的附录A是提示的附录。
本标准由中华人民共和国信息产业部提出。本标准由中国电子技术标准化研究所归口。本标准起草单位:“八六三”计算机智能主题专家组。本标准主要起草人:顾小凤、丁晓青、刘迎建、钱跃良。1范围
中华人民共和国国家标准
印刷体汉字识别系统要求与测试方法Requirements and test methods for identifysystem of printed Chinese character本标准规定了印刷体汉字识别系统的功能、技术要求和测试方法。本标准适用于印刷体汉字识别系统,也适用于其他有关系统。2引用标准
GB/T17961—2000
下列标准所包含的条文,通过在本标准中引用而构成为本标准的条文。本标准出版时,所示版本均为有效。所有标准都会被修订,使用本标准的各方应探讨使用下列标准最新版本的可能性。GB2312—1980信息交换用汉字编码字符集基本集GB/T7589—1987信息交换用汉字编码字符集第二辅助集GB/T7590一1987信息交换用汉字编码字符集第四辅助集GB/T12345—1990
信息交换用汉字编码字符集辅助集GB13000.1一1993信息技术通用多八位编码字符集(UCS)第1部分:体系结构(idtISO/IEC10646.4:1993)
GB13131—1991
信息交换用汉字编码字符集第三辅助集GB13132—1991
第五辅助集
信息交换用汉字编码字符集
3系统功能
3.1基本功能
3.1.1预处理
将普通纸媒体文本在自动或人工干预下通过光学输入设备将印刷信息转换成适合识别的灰度(含二值)图像。
3.1.2识别
将上述图像所包括的印刷符号转换为GB2312、GB/T7589、GB/T7590、GB/T12345、GB13000.1、GB13131和GB13132所规定的编码信息。3.2扩展功能
3.2.1版面分析
应将版面自动分成块,并正确标明每个块的属性,对文字块还需标明各块之间连接关系的逻辑序号。
表格识别
应能正确识别表格线,并可将表格和文字建立对应关系。国家质量技术监督局2000-01-03批准2000-08-01实施
4要求
4.1识别率
GB/T17961—2000
对于正式出版物及打印质量与其相当的打印文件的识别率应大于95%。4.2误识率
对于正式出版物及打印质量与其相当的打印文件的误识率应小于2%。4.3识别速度
使用6.3版本,识别速度应大于10字/秒。5测试方法
5.1测试样张
测试时参照采用附录A给出的测试样张,在实际测试时,有关测试机构可依据样张的字体,字号和版面布局随机提供多种测试样张,测试样张至少应包含103个印刷符号。5.2识别率,误识率测试
5.2.1测试设备
应采用通用操作系统及与其相适应的微型数字电子计算机。5.2.2测试样张
测试样张采用5.1规定的样张。
5.2.3测试结果
识别率测试结果按式(1)计算:
识别率=(C/N)×100%
式中:C一一测试样张中被正确识别的印刷符号数;N—测试样张中印刷符号总数。
误识率测试结果按式(2)计算:
误识率=(E/N)×100%
测试样张中被错误识别的印刷符号数;式中.E
N——测试样张中印刷符号总数。测试结果应符合4.1和4.2的要求。5.3识别速度测试
5.3.1测试设备
采用5.2.1规定的测试设备。
5.3.2测试样张
测试样张采用5.1规定的样张。
5.3.3测试结果
识别速度测试结果按式(3)计算:识别速度=N/T
式中:N——测试样张中印刷符号总数;T
一识别系统从开始读取测试数据至将识别结果记录到媒体上所用的时间。识别速度应符合4.3的要求。
(2)
(3)
客中作
兰陵美酒郁金香,
玉碗盛来琥珀光。
但使主人能醉客,
不知何处是他乡。
人生在世
中间小谢又清代
杯销愁愁更
刀断水水更
上青天揽明
怀逸兴壮
GB/T17961—2000
附录A
(提示的附录)
测试样张
兰溪樟歌
戴叔伦
凉月如眉挂柳湾,
越中山色镜中看。
兰溪三日桃花雨,
半夜鲤鱼来上滩。
宣州谢楼伐别校书叔云
我去者”
风万里送秋
日之日多烦
我心者”
日之日不可
将进酒
君不见黄河之水天上来,
奔流到海不复回。
君不见高堂明镜悲白发,
朝如青丝暮成雪。
人生得意须尽欢,
莫使金樽空对月。
天生我材必有用,
千金散尽还复来。
烹羊宰牛且为乐,
会须一饮三百杯。
岑夫子,丹丘生,
将进酒,君莫停。www.bzxz.net
与君歌一曲,
国破山河在,
城春草木深。
感时花溅泪,
恨别鸟惊心。
烽火连三月,
家书抵万金。
白头搔更短,
浑欲不胜簪。
请君为我倾耳听。
钟鼓馕玉不足贵,
但愿长醉不复醒。
古来圣贤皆寂寞,
惟有饮者留其名。
陈王昔时宴平乐,
斗酒十千恣欢。
主人何为言少钱,
径须沽取对君酌。
五花马,千金裘,
呼儿将出换美酒,
与尔同销万古愁。
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。

标准图片预览:





- 热门标准
- 国家标准(GB)标准计划
- GB/T39648-2020 纺织品 色牢度试验 数字图像技术评级
- GB/T25811-2010 染料试验用标准漂白涤纶布
- GB/T2910.16-2024 纺织品 定量化学分析 第16部分:聚丙烯纤维与某些其他纤维的混合物(二甲苯法)
- GB/T529-2008 硫化橡胶或热塑性橡胶撕裂强度的测定(裤形、直角形和新月形试样)
- GB/T43423-2023 空间数据与信息传输系统 深空光通信编码与同步
- GB/T26863-2022 火电站监控系统术语
- GB/T36434-2018 复杂机械手表机心万年历和打簧机构零部件的名称
- GB/T30966.6-2022 风力发电机组 风力发电场监控系统通信 第6部分:状态监测的逻辑节点类和数据类
- GB/T23639-2009 节能耐腐蚀钢制电缆桥架
- GB/T24204-2009 高炉炉料用铁矿石 低温还原粉化率的测定 动态试验法
- GB/T5009.68-2003 食品容器内壁过氯乙烯涂料卫生标准的分析方法
- GB/T23315-2009 粘扣带
- GB/T29529-2013 泵的噪声测量与评价方法
- GB50030-2013 氧气站设计规范
- GB/T32113-2015 口腔护理产品中氯酸盐的测定离子色谱法
请牢记:“bzxz.net”即是“标准下载”四个汉字汉语拼音首字母与国际顶级域名“.net”的组合。 ©2009 标准下载网 www.bzxz.net 本站邮件:[email protected]
网站备案号:湘ICP备2023016450号-1
网站备案号:湘ICP备2023016450号-1