您好,欢迎来到标准下载网!

【国家标准(GB)】 联机手写汉写识别技术要求要求与测试规程

本网站 发布时间: 2024-11-05 14:43:51
  • GB/T18790-2002
  • 现行

基本信息

  • 标准号:

    GB/T 18790-2002

  • 标准名称:

    联机手写汉写识别技术要求要求与测试规程

  • 标准类别:

    国家标准(GB)

  • 标准状态:

    现行
  • 发布日期:

    2002-07-01
  • 实施日期:

    2002-01-02
  • 出版语种:

    简体中文
  • 下载格式:

    .rar.pdf
  • 下载大小:

    2.12 MB

标准分类号

关联标准

出版信息

  • 出版社:

    中国标准出版社
  • 书号:

    155066.1-19086
  • 页数:

    平装16开, 页数:8, 字数:14千字
  • 标准价格:

    10.0 元
  • 出版日期:

    2002-01-02

其他信息

  • 首发日期:

    2002-07-18
  • 复审日期:

    2004-10-14
  • 起草人:

    刘迎建、王立建、张立清、刘长松、钮兴显、王宝艾
  • 起草单位:

    中国电子技术标准化研究所
  • 归口单位:

    全国信息技术标准化技术委员会
  • 提出单位:

    中华人民共和国信息产业部
  • 发布部门:

    中华人民共和国国家质量监督检验检疫总局
  • 主管部门:

    国家标准化管理委员会
  • 相关标签:

    识别 技术 测试 规程
标准简介标准简介/下载

点击下载

标准简介:

标准下载解压密码:www.bzxz.net

本标准规定了联机手写汉字识别系统的汉字识别技术要求和测试规程。本标准适用于微型计算机、手持式信息处理设备和数字化电器配置的联机手写汉字识别系统。 GB/T 18790-2002 联机手写汉写识别技术要求要求与测试规程 GB/T18790-2002

标准内容标准内容

部分标准内容:

ICS35.240.30
中华人民共和国国家标准
GB/T18790—2002
联机手写汉字识别技术要求
与测试规程
Requirements and test procedure ofon-line handwriting Chinese ideogram recognition2002-07-18发布
中华人民共和国
国家质量监督检验检疫总局
2002-12-01实施
GB/T18790—2002
本标准规定了联机手写汉字识别系统的汉字识别技术要求、测试规程。该标准的制定和实施将规范联机手写汉字识别系统的研究、开发和应用。本标准的附录A和附录B是标准的附录,附录C是提示的附录。本标准由中华人民共和国信息产业部提出。本标准由中国电子技术标准化研究所归口。本标准起草单位:中国电子技术标准化研究所、北京汉王科技有限公司、清华大学电子工程系。本标准主要起草人:刘迎建、王立建、张立清、刘长松、钮兴昱、王宝艾。1范围
中华人民共和国国家标准
联机手写汉字识别技术要求与测试规程Requirements and test procedure ofon-line handwriting Chinese ideogram recognition1.1本标准规定了联机手写汉字识别系统的汉字识别技术要求和测试规程。GB/T18790—2002
1.2本标准适用于微型计算机、手持式信息处理设备和数字化电器配置的联机手写汉字识别系统。2引用标准
下列标准所包含的条文,通过在本标准中引用而构成为本标准的条文。本标准出版时,所有版本均为有效。所有标准都会被修订,使用本标准的各方应探讨使用下列标准最新版本的可能性。GB2312-1980信息交换用汉字编码字符集基本集GB12345一1990信息交换用汉字编码字符集辅助集GB13000.1一1993信息技术通用多八位编码字符集(UCS)第1部分:体系结构(idtISO/IEC10646:1993)
GB18030--2000信息技术信息交换用汉字编码字符集基本集的扩充3定义
本标准采用下列定义。
3.1联机手写数据采集设备on-linehandwritingdata capturedevice是指鼠标、手写板、触摸屏等具备实时地将人们书写的汉字及字符轨迹转换成坐标点序列、形成电子数据的设备。
3.2联机手写汉字识别系统on-linehandwritingChineseideogramrecognitionsystem是指使用微型计算机或具有计算能力的系统,对联机手写电子数据采集设备采集的手写电子数据进行处理与辨识,获得相应的标准内码的系统。3.3样本sample
一个完整的、由联机手写电子数据采集设备采集的、符合第4章中的汉字或字符的电子数据称为一个样本。
3.4样本文件samplefile
是指由多个样本按附录B数据格式组成的文件,称为样本文件。3.5样本库libraryofsamplefile多个同类型样本文件组成的文件集合称为样本库。识别字符集的范围
联机手写汉字识别系统识别的最小字符集应是GB2312中全部汉字字符(包括偏旁部首)以及附录A中的非汉字字符。字符扩展时,联机手写汉字识别系统应识别GB12345,或GB18030,或GB中华人民共和国国家质盘监督检验检疫总局2002-07-18批准2002-12-01实施
13000.1字符集中的全部汉字。
5识别技术要求
5.1识别率
5.1.1对工整样本库的识别要求
GB/T18790-2002
a)对GB2312中所有汉字的识别率应大于94%b)对附录A中的非汉字字符的识别率应大于80%;c)若厂商声明支持GB12345,或GB13000.1,或GB18030字符集,则以上字符集的识别率应大于85%。
d)对任何字符集而言,单字识别率应大于50%。5.1.2对乱笔顺样本库的识别要求对乱笔顺样本库,识别率应大于60%。5.2识别速度
在测试软件运行的平台上,识别速度应优于1.5s/字。6测试规程
6.1标准测试样本库的建立
a)出信息处理产品标准符合性检测中心分别用压力式手写板、电磁感应手写板等设备各采集由一定数量的人、在工整书写提示下自然书写的汉字样本,经整理后,建成标准测试样本库;b)标准测试样本库中包括两部分样本,其中一部分是工整书写的样本,称为工整样本库;少部分是人工方式处理的、打乱了笔划顺序的工整样本,称为乱笔顺样本库。6.2由信息处理产品标准符合性检测中心提供标准测试样本文件的数据格式及结果文件格式,并提供至少个样本文件,供参测单位调试测试程序。6.3参测单位向标准符合性测试机构提交联机手写汉字识别技术的测试软件,由信息处理产品标准符合性检测中心测试,并提供测试结果。非微型计算机平台上的参测单位,除测试软件外,还应提供能完成测试工作的运行平台。6.4测试结果计算
6.4.1识别速度
识别速度测试结果按下式计算:识别速度一T/N
式中:N—测试样本库中样本总数;T一一识别系统从开始读取测试数据至将识别结果记录到媒体上所用的时间。6.4.2识别率
识别率测试结果按下式计算:
识别率=CN/NN
式中:NN—样本库中样本总数;CN-经统计第一选识别结果正确的样本数。6.4.3单字识别率
单字识别率测试结果按下式计算:单字识别率=CS/NS
式中:NS-样本库中某一汉字的样本总数;CS一一经统计第一选识别结果正确的该汉字样本数。2
GB/T 18790-2002
附录AbZxz.net
(标准的附录)
联机手写汉字识别系统的识别字符集的非汉字字符集联机手写汉字识别系统至少识别如下非汉字字符:A1数字:
0123456789
A2大写英文字符:
ABCDEFGHIJKLMNOPQRSTUVWXYZ
A3小写英文字符:
abcdefghijklmnopqrstuvwxyz
A4标点符号:
!\,:,?、。'().
<>《》#$%&*+.=>@-→~
A5手势(箭头代表书写方向,括号内为该手势的内码):空格(0x0020):
回车(0x000D)
回删(0x0008):
删除(0x001e):
附录B
(标准的附录)
标准测试样本文件格式
本附录规定了标准测试样本库中的样本文件的扩展名和文件格式。本附录对于提供和使用联机手写汉字识别系统的各方提出共同遵守的约定。B1标准测试样本文件的扩展名
标准测试样本文件的扩展名统-为“.POT”。B2标准测试样本文件格式
文件格式:标准测试样本文件中存放的是连续的POT数据块;无其他额外的格式信息。POT数据块定义:每个POT数据块中包含一个手写汉字的字型采样数据和内码等信息,详见下表。
2DWORD
数据块长度,以字节(BYTE)为单位,假设为n本数据块所代表的汉字内码,例如“啊”。Ox0000bOal
手写样本的总笔划数,假设为N
10WORD
i+1WORD
n-7WORD
n-5 WORD
n-3WORD
n1WORD
GB/T18790—2002
第一笔的第一个点的X方向坐标值第一笔的第一个点的Y方向坐标值OxFFFF,第一笔的结束标志
0x0000,第一笔的结束标志
OxFFFF,第N笔的结束标志
0x0000,第N笔的结束标志
0xFFFF,本字的结束标志
0xFFFF,本字的结束标志
其中:
1WORD=2BYTE(低字节在前,高字节在后),例如:0x1234,在文件中的字节排列顺序为34H,12H;
1DWORD=2WORD(低字在前,高字在后),例如:0x12345678,在文件中的字节排列顺序为78H,56H,34H,12H。
附录C
(提示的附录)
联机手写汉字识别系统程序接口规范本附录定义了基于标准C语言的联机手写汉字识别程序接口规范。本附录对于提供和使用联机手写汉字识别系统的各方提出共同遵守的约定。C1API文本细则
全部接口函数共10个,分列如下:C1.1 char * OLGetBrand(void)说明:获得识别程序的提供厂商和版本说明。返回值:
成功,返回一个字符串指针,最多1024个字符;否则,返回0。
C1.2DWORDOLGetVersion(void)
说明:获取识别程序版本号。
返回值:
成功,返回识别程序版本号,高字为主版本号,低字为子版本号;否则,返回0。
C1.3 char * OLGet Date(void)说明:获取识别程序的提交时间。返回值:
成功,返回一个字符串指针,其中时间以\yyyy-mm-dd”形式提供;否则,返回0。
C1.4 int OLInit(void)
说明:本函数用来初始化识别程序,装入识别字典。返回值:
成功,返回-个非零值;
否则,返回0。
C1.5 int OLClose(void)
说明:本函数用来释放识别字典。返回值:
成功,返回非零;
否则,返回0。
参见OLInit
GB/T18790—2002
C1. 6 DWORD OLSetRange(DWORD range)说明:本函数用来设置识别字符集的范围。参数:
range:指定的识别范围。定义如下:bito:小写英文
bitl:大写英文
bit2:数字
bit3:常用标点8个,包括:,。、?!\:bit4:扩展标点,包括:\()《·>《》bit5:常用符号,包括:±¥#.=/>$一%+<*@&bit6:扩展符号,包括:~《~[!bit7:手势4个,包括:空格(0x0020)、回车(0x000d)、回删(0x0008)、删除(0x0010)bit8:偏旁部首
bit9;GB2312一级国标简体汉字
bit10:GB2312二级国标简体汉字bit11:GBK3区中的汉字
bit12:GBK4区中的汉字
bit13以上:保留
返回值:
成功,返回旧的识别范围;
否则,返回0。
参见:OLRecognize,OLGetRange
C1.7 DWORD OLGetRange(void)
说明:本函数用来读取识别字符集的范围。返回值:
成功,返回当前的识别范围,参见OLSetRange否则,返回0。
参见:OLSetRange
C1.8intOLSetCandidateNum(int num)说明:本函数用来设置识别候选字的数量。参数:
num:设置识别候选字的数量,缺省值为10,最大值为20。返回值:
成功,返回旧的候选字的数量;否则,返回0。
GB/T18790--2002
参见:OLGetCandidateNum,OLRecognizeC1. 9 int OLGetCandidateNum(void)说明:本函数用来读取识别候选字的数量。返回值:
成功,返回当前的候选字的数量,参见OLSetCandidateNum;否则,返回0。
参见:OLSetCandidateNum
C1.10intOLRecognize(WORD*lpTrace,WORD*lpResult)说明:本函数用来识别输人的笔迹。参数:
lpTrace:输入的笔迹数据指针,其空间由应用程序申请,数据类型为WORD(2byte),格式如下:
(x0,yo)(xl,y1)...(0xfff,o)...(0xfff,0)...(0xfff,0xffff)·笔划结束标志
·字结束标志
lpResult:存放识别结果的数据指针,其空间由应用程序申请,不应少于由OLSetCandidateNum设字的候选字个数*6;识别程序将识别结果及可信度得分填入其中。每个结果占2~4个字节(参见GB18030);半角字符和手势结果均为两字节,其高位均为0。全部识别结果之后是每个结果的可信度得分,每个得分表示为1个WORD,按照识别结果排列的顺序排列。例如,共有4个识别结果:“啊阿可何”,可信度得分分别为:100,90,80,70;那么,lpResult中的排列顺序就是:啊,阿,可,何,100,90,80,70。返回值:
成功,返回识别结果的个数;
拒识,返回0。
参见:OLSetRange,OLSetCandidateNum备注:
1WORD=2BYTE可定义为#defineWORDunsigned short int。1DWORD=2WORD。可定义为#defineDWORDunsignedint(32位系统)或#defineDWORDunsignedlongint(16位系统)。6
GB/T18790-2002
中华人民共和
国家标准
联机手写汉字识别技术要求与测试规程GB/T18790—2002
中国标准出版社出版
北京复兴门外三里河北街16号
邮政编码:100045
电话:6852394668517548
中国标准出版社秦皇岛印刷厂印刷新华书店北京发行所发行各地新华书店经售*
开本880×12301/16
印张3/4
字数14千字
反2002年12月第一次印刷
2002年12月第一版
印数1-1500
书号:155066·1-19086
网址www.bzcbs.com
科目631-474
版权专有
侵权必究
举报电话:(010)68533533
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。
标准图片预览标准图片预览

标准图片预览:






  • 热门标准
  • 国家标准(GB)标准计划
设为首页 - 收藏本站 - - 返回顶部
请牢记:“bzxz.net”即是“标准下载”四个汉字汉语拼音首字母与国际顶级域名“.net”的组合。 ©2009 标准下载网 www.bzxz.net 本站邮件:bzxznet@163.com
网站备案号:湘ICP备2023016450号-1