您好,欢迎来到标准下载网!

【电子行业标准(SJ)】 计算机用普通话语音库规范

本网站 发布时间: 2024-07-14 12:10:28
  • SJ/T11143-1997
  • 现行

基本信息

  • 标准号:

    SJ/T 11143-1997

  • 标准名称:

    计算机用普通话语音库规范

  • 标准类别:

    电子行业标准(SJ)

  • 标准状态:

    现行
  • 发布日期:

    1997-09-03
  • 实施日期:

    1998-01-01
  • 出版语种:

    简体中文
  • 下载格式:

    .rar.pdf
  • 下载大小:

    1.22 MB

标准分类号

  • 标准ICS号:

    信息技术、办公机械设备>>信息技术应用>>35.240.30信息技术在信息、文献和出
  • 中标分类号:

    矿业>>矿业综合>>D01技术管理

关联标准

出版信息

  • 出版社:

    电子工业部标准化研究
  • 页数:

    32页
  • 标准价格:

    30.0 元
  • 出版日期:

    1998-01-01

其他信息

  • 起草人:

    蔡莲红、赵世霞
  • 起草单位:

    清华大学、中国电子信息产业集团公司
  • 归口单位:

    电子工业部标准化研究所
  • 发布部门:

    中华人民共和国电子工业部
标准简介标准简介/下载

点击下载

标准简介:

标准下载解压密码:www.bzxz.net

本标准规定了计算机用普通话语音库原则,字与音的对应关系原则,以满足语音处理和语音合成的需要。它对汉语信息处理以及各种汉语信息处理系统之间的兼容性起到规范化作用。本标准主要适用于中文信息处理的语音处理系统,另外对语音研究、语音评测也具有指导作用。 SJ/T 11143-1997 计算机用普通话语音库规范 SJ/T11143-1997

标准内容标准内容

部分标准内容:

ICS35.240.30
备案号:718—1997
中华人民共和国电子行业标准
SJ/T11143-1997
计算机用普通话语音库规范
Speech database specification of putonghua for computer1997-09-03发布
1998-01-01实施
中华人民共和国电子工业部
YYKAONKAca
1范围
1.1主题内容
1.2适用范围
2引用标准
3定义
普通话音节集
5普通话轻声词规范
6普通话儿化词规范
7双音节词语声调组合
8普通话常用词语、例句和短文..9语音数据库规范
附录A(提示的附录)
附录B(提示的附录)
附录C(提示的附录)
附录D(提示的附录)
附录E(提示的附录)
普通话轻声调示例
普通话儿化词示例
双音节词语声调组合示例
普通话常用词语示例
普通话例句和短文示例
YYKAONrKACa
本标准依据GB/T13715—92<信息处理用现代汉语分词规范),并参照商务印书馆出版的1996年修订本《现代汉语词典),规定了计算机用普通话语音库的规范。本标准中提示的附录,还包括普通话语音库的下列内容:a)普通话轻声词示例;
b)普通话儿化词示例;
c)双音节词语声调组合示例;
d)普通话常用词语示例
e)普通话例句和短文示例
本标准的附录A到E都是提示的附录。本标准由电子工业部标准化研究所归口本标准起草单位:清华大学、中国电子信息产业集团公司。本标准主要起草人:蔡莲红、赵世霞。YKAONrKAa
1范围
中华人民共和国电子行业标准
计算机用普通话语音库规范
Speechdatabasespecificationofputonghua for computer1.1主题内容
SJ/T11143-1997
本标准规定了计管用普通话语音库原则、字与音的对应关系原则,以满足语音处理和语音合成的需要。它汉语信息处理以及各种汉语信息处理系统之间的兼容性起到规范化作用。
1.2适用范围
本标准主要适用于中文信息处理的语音处理系统,另外对语音研究、语音评测也具有指导作用。
2引用标准
下列标准所包含的条文,通过在本标准中引用而构成本标准的条文。本标准出版时,所示版本均为有效。所有标准都会被修订,使用本标准的各方应探讨使用下列标准最新版本的可能性。
GB12200.1—90
汉语信息处理词汇
GB/T12200.2—94汉语信息处理词汇3定义
01部分:基本术语
02部分:汉语和汉字
本标准采用GB12200.1和GB/T12200.2中定义的下列术语:3.1汉语语音信息处理Chinesespeechinformationprocessing利用计算机系统、汉语*语音的编码技术和汉语语音数字信号处理技术,实现汉语语音输入、输出、理解、翻译、语音和文字相互转换以及语音信息通信等信息处理功能。3.2普通话Putonghua
现代汉民族共同语。它是规范化的现代汉语。以北京语音为标准音,以北方话为基础方言,以典范的现代白话文著作为语法规范。3.3汉语拼音(方案)schemeoftheChinesephoneticalphabetpinyin给汉字注音和拼写汉语*普通话*语音的方案。方案采用26个拉丁字母,有声母表和韵母表及拼写规则,对声调符号和隔音符号的标记也有规定。3.4声母initial
汉语音节的起始部分。汉语普通话的声母可分为6大类:塞音、擦音、塞擦音、鼻音、边音、零声母。
中华人民共和国电子工业部1997-09-03批准YKAONrKAcas
1998-01-01实施
3.5零声母zeroinitial
SJ/T11143-1997
汉语直接以元音开始的音节无声母,称为零声母。3.6韵母final
汉语音节中除声母以外的部分。汉语善通话的韵母包括单韵母、复韵母、鼻韵母三类。3.7轻声[音]
neutralized
汉语音节中一种念成又轻又短的调子。3.8儿化
retroflexed
汉语音节中给韵母加上一种卷舌动作(即“儿”)的音色。3.9声调
一个音节内相对音高及其变化,又称字调。3.10变调
tonesandhi
语流音变中声调发生变化的现象。3.11调类
tqne category
一种语言或方言中声调的类别。例:普通话中有阴平、阳平、上声、去声四个词类。3.12(声)调(符)号tonemark标记声调的符号。
例:普通话中阴平调号为,阳平调号,上声调号为,去声调号为。3.13词级affrix
附着在词根上表示附加意义的词素,主要有前缀,后缀。3.14语素morpheme
最小的音义结合的语言单位。
3.15双音(节)词disyllabicword含两个音节的词。
例:毛巾(mgojin)、手绢儿(shoujuanr)3.16常用词highfrequencyword
使用频率较高的词。
3.17句子sentence
前后有停顿,并且带有一定的语调表示相对完整的意义的语言单位。3.18句型sentencepattern
根据句法构造划分出来的句子类型。4普通话音节集
普通话的音节集是按照汉语拼音字母的顺序,根据《现代汉语词典)上列出的拼音音节,选择常用字与读音相对应。本标准中每个音节只按普通话的阴平、阳平、上声、去声(即一声、二声、三声、四声)四个调类自左向右依次排列,不出现的留空,排列如下(对没有四个基本声调,只有轻声读音的,也留了空位。考虑到语音合成时各种发音的需要,把有些方言字也列了出来,并用黑字表示。
YKAONrKAcas
阿啊啊啊
八拨把爸
杯北倍
哺酸补不
糙曹草操
插查权岔
车扯撤
抽仇丑臭
chuang窗庆闯创
村存付寸
都读堵度
阿额恶饿
发乏法
丰缝讽奉
香噶嘎尬
哥革葛个
嗨孩海害
轰红哄订
欢环缓换
机急几计
阶杰姐介
居局举巨
哭苦库
亏葵倪溃
篮懒烂
棱冷虏
擦疗了料
峦卵乱
衰癌矮爱
斑白摆败
奔本笨
别癌别
拆柴醋痤
郴陈衬
出除楚处
搓痤挫错
SJ/T11143—1997
崩甬绷蹦
猜才彩菜
拽缠产颤
称成惩秤
低敌底弟
端短断
误误误读
帆凡反犯
该改盖
姑古固
憨含喊汉
痕很恨
喉吼厚
荒黄恍晃
家夹甲价
哪狼朗浪
哩离礼历
隆龙垄弄
春唇囊
搭答打大
方防访放
甘赶赣
根限良亘
乎湖虎户
灰回毁汇
尖减见
京井镜
康扛抗
捞劳老涝
拎林漂客
楼楼篓漏
轮轮论论
帮榜棒
逼鼻比必
兵丙病
餐残惨灿
昌常场唱
吃持尺斥
撬膳端
飞肥匪费
锅国果过
蒿豪好耗
拉晃喇腊
联脸练
灵领令
噜炉鲁路
萝裸落
YKAONrKAcas
凹熬妖奥
包保报
剥博跛簸
超潮炒秒
冲虫宠
川船嘴串
吡瓷此次
催璀翠
兜抖斗
多夺朵堕
儿尔二
分坟粉奋
夫服府父
高稿告
关管惯
铪蛤哈哈
喝和赫
豁活火货
交嚼角叫
究九旧
科壳渴客
抠口扣
框狂态况
播雷垒类
良两亮
溜流柳六
驴旅律
妈麻马骂
棉免面
那拿哪纳
妮尼你逆
奴努怒
攀盘判
烹朋摔碰
拼贫品聘
期齐起气
切茄且窃
区渠取去
喂瓣壤让
生蝇省剩
胎台哒太
瑞团疃象
先贤显现
星形醒姓
薛学雪血
要摇咬药
埋买麦
没美妹
喵苗秒妙
摸磨抹末
年捻念
凝拧宁
噢哦唆哦
乓旁榜胖
批匹区辟
掐指卡恰
亲勤寝沁
圈全犬劝
饶扰绕
羲范锐
烧勺少绍
师时使事
虽随髓碎
摊谈坦探
听停挺挺
推颜腿退
湾完晚方
窝我卧
香详响象
耶爷也业
拥鸣永用
晕云允运
遣凿早造
SJ/T11143-1997
蛮满慢
晖谋某
国男难
妞牛纽
抛袍跑炮
篇便遍骗
坡婆回破
千钱浅欠
清情请庆
缺瘤确
桑嗓丧
沙啥傻煞
奢舌舍社
收熟手售
shuang双
孙损溪
汤唐躺烫
踢提体替
通同统痛
吞屯氽褪
汪王往望
乌无五务
消淆小笑
修朽秀
压牙哑亚
衣移以意
优由有又
匝杂咋
蒙盟猛梦
模母木
胚培配
飘飘漂票
枪强抢跑
人忍认
如乳入
骚嫂臊
书赎署树
谁水睡
掏逃讨套
天田舔
偷头斜透
托驼妥拓
微围传位
西习洗细
歇鞋写泄
需徐许续
咽研眼验
因银引印
淤鱼与育免费标准下载网bzxz
灾载在
YKAONrKAcas
猫毛卯帽
咪迷米密
明酪命
嗯嗯嗯
挠脑闹
嗯嗯嗯
捏茶聂
拍牌迫派
喷盆喷
警苯婺
扑葡普铺
敲桥巧窍
丘求模
仁酒萨
身神审甚
苏俗速
他塔竭
挑条窕跳
突图吐兔
挖娃瓦袜
温文稳问
瞎峡夏
心谭化信
宣旋选绚
央阳养样
英营影硬
渊员远院
招着找照
知值只制
拽蹭拽
钻纂钴
5普通话轻声词规范
5.1概述
扎闸炸胶
遮哲者浙
SJ/T11143-1997
摘宅窄债
周轴帚宙
zhuang庄
尊推拨
真诊镇
朱竹主住
邹走奏
作咋左坐
zhang章
租族组
本标准以语音信号处理应用为目的,根据普通话的读音规则和特点,规定轻声词读音规则。用字下边带“,”作为轻声字的单位标记。5.2具体说明
轻声作为一种语音现象,体现在词语和句子中,因此轻声音节的读音不能独立存在。固定轻声的单音节助词、语气词也不例外,它们的实际轻声调值也要依靠前一个音节的声调来确定。普通话的轻声还与词义有关,如“兄弟”和“兄弟“的含义不同。本标准按照构词分类分别叙述了在构词上通常读作轻声的音节或语索。5.3名词
5.3.1叠音名词的后一个音节应读作轻声。例如:姑姑
5.3.2表示称谓名词的后一个音节读作轻声。例如:大爷先生
5.3.3某些常用双音节单纯词的后一个音节,常读作轻声。例如:篱爸
5.3.4某些名词性后级读作轻声。例如:子——桌子
头——石头
巴——尾巴
们—人们
5.4动词
5.4.1单音动词重叠式的后一个音节常读作轻声。例如:写写
5.4.2某些可兼作象声词的动词的后一个音节常读作轻声(作象声词时不读作轻声)。例如:吧嗒
5.4.3动补式合成词VAC的中问一个语素A(不、得)常读作轻声。例如:不了不起
得——说得来
肯不背
靠得住
禁不住
来得及
5.4.4动补式合成词V不得\,\V一V\作为补充成分的后两个音节常读作轻声。例如:不得——舍不得
—V—禁—套
顾不得
试一试
怪不得
听一听
YYKAoNKAcas
SJ/T11143-1997
5.4.5动补式双音合成动词的后一个语素(得、来、去)常读作轻声。例如:得—晓得
来一起来
去—出去
5.4.6某些趋向动词(“出来”、“回来”、“过来”、“进来”、“回去”、“过去”、“下去”、“进去”等用作趋向动词时)常读作轻声。例如:出来——我看出来
回去跑回去,
5.5助词
找回来
过去——跳过去
过来一走过来
下去推下去
5.5.1结构助词“的”、“地”、“似的”读作轻声。例如:幸福的
迅速地
飞似的
5.5.2时态助词“了”、“着”、“过”、“来着”读作轻声。例如:来了
5.6语气助词
他用来着
进来一一闯进来
进去——挤进去
语气词“啊”、“呀”、“哇”、“哪”、“吧”、“呢”、“吗”、“啦”、“呗”“喽”等读作轻声。例如:是啊来呀
5.7方位词
吃吧书呢在家吗毕业啦知道呗水开喽在一定结构中表示方位的上”、“下”、“里”、“边”等常读作轻声。例如:墙上
5.8代词
屋子里
部分代词、副词后级常读作轻声。例如:我们
5.9部分重叠式动词、形容词的第二个音节常读作轻声。例如:大大喇′
慢慢腾腾
骂骂喇喇
哭哭啼蹄
5.10部分四音节词语的衬字,常读作轻声。例如:花不棱登
劈里啪啦
6普通话儿化词规范
6.1概述
本标准以语音信号处理为应用目的,根据普通话的读音规则和特点,规定了儿化词的读音规则。用字下边带“,”作为儿化词的单位标记。6.1.1使用稳定的必该的儿化词。例如:猴儿
包千儿
笔杆儿
拔火罐儿
好样儿的
男孩儿
好玩儿
6.1.2儿化单音词的主要派生词,为必读的儿化词。例如:点儿:
千儿:
差点儿
鱼千儿
快点儿
豆腐干儿
雨点儿
葡萄干儿
YKAONrKAcas
馅儿:
眼儿:
馅儿饼
扣眼儿
6.2具体说明
肉陷儿
窟隆眼儿
SJ/T11143-1997
什锦馅儿
红眼儿病
普通话有一些词(主要是名词)带着辅助成分“儿”尾,构成了儿化词。在读音时“儿”与前面一个音节的读音融合在一起,构成了儿化音节。本标准按照语法结构分别叙述了儿化词在普通话里所起的修辞或表示语法功能的积极作用。
6.2.1儿化可用来表示一定附加意义或语义色彩。6.2.1.1表示喜欢心情。例如:
鲜花儿花篮儿
山歌儿
6.2.1.2表示温和态度。例如:
您慢慢儿走!
说说贴心的话儿。
女孩儿
油画儿
6.2.2可用来形容细、小、轻、微的性质和形状。例如:小鸡儿门缝儿
竹棍儿
红头绳儿
一会儿
6.2.3在某些场合下,也可用来表达轻蔑的意思。例如:八十来斤儿,还不动吗?
这件事儿还办不了吗?
6.2.4可用来确定名词词性。例如:盖“盖儿”
用“罩儿”罩
打了一个“滚儿”
没“准儿”
千“活儿”
有一个很尖的“尖儿”
高高的“个儿\(身材)
6.2.5可用来区别词义。例如:
一点儿(少量,不是“一点”、“两点”。)一块儿(一同,不是“一块”、“两块”。)画“画儿”
半天儿(一个上午或下午,不是“半天,很久的时间。)笑话儿(可笑的故事,不是“笑话”动词,耻笑。)说闲话儿(闲谈,不是“说闲话”一一讽、埋怨)6.2.6可用来区分同音词。例如:拉链儿(拉锁,不是“拉练”一一行军、野营、锻炼)开火儿(打仗,不是“开伙”一一食堂伙食,开始吃饭)儿化韵音变规则:儿化音变的基本性质是使一个音节的主要元音带上卷舌色彩,儿化韵的音变条件取决于韵腹元音是否便于发生卷舌动作。韵母中除e(读),er(儿)外,都可以儿化,韵母儿化后,读音发生了变化,为叙述方便,按韵母末尾音节的变化分类。6.3.1韵腹或韵尾是a、o、e、u(不包括韵尾为i,n,ng的韵母)时加卷舌动作。例如:原韵
儿化韵
一香儿
衣架儿
牙刷儿
rYKAoNrKAcas
上哪儿
豆芽儿
鲜花儿
SJ/T11143-1997
[iaur]
[iour]
山坡儿
干活儿
小车儿
小碟儿
木概儿
牛特儿
符号儿
布料儿
钮扣儿
短袖儿
韵尾是i,n的,去掉韵尾,在主要元音上加卷舌动作。例如:原
儿化韵
鞋带儿
一块儿
肥皂沫儿
走火儿
山歌儿
半截儿
菜谱儿
红包儿
小鸟儿
小猴儿
打球儿
小孩儿
椅子背儿
麦穗儿
床单儿
针尖儿
小船儿
花卷儿
老本儿
花纹儿
用劲儿
红裙儿
6.3.3用作单韵母的元音i,ü后面加上卷舌元音[er]。例如:原韵
儿化韵
舌尖元音i-用[or]替换。例如:原韵
儿化韵
小米儿
金鱼儿
墨水儿
花篮儿
一点儿
好玩儿
圆圆儿
后门儿
飞轮儿
脚印儿
小鸡儿
有趣儿
棋子儿
铁丝儿
树枝儿
舌根鼻音韵母儿化时,除去掉韵尾一ng以外,主要元音鼻化。例如:原韵
儿化韵
菜帮儿
唱腔儿
天窗儿
麻绳儿
rYKAorKAa
没事儿
偏方儿
瓜秧儿
借光儿
石凳儿
7双音节词语声调组合
SJ/T11143—1997
电影儿
酒盅儿
小熊儿
打铃儿
袖简儿
汉语声调同音长、音强等都有关系,但主要是音节的音高类型的区别。调值是用来表示声调实际的高低、升降、曲直、长短的形式,也就是声调的实际读法。普通话的调值有四种,按照传统习惯,称为阴平、阳平、上声、去声。(即一声、二声、三声、四声,用符号“、、、”表示)。不同的声调组合在一起,前后音相互影响,其声调与单独发音有别,有时产生变调。在汉语词汇中,双音节词语所占比例较高。因此,附录C中给出了双音节词语的例子,其选词包括四种声调的十六种组合,每种声调组合选取了24个词。表示如下:
8普通话常用词语、例句和短文
在连续语流中,各音节的发音与单独发音有别。而词语是语言的基本单位,本标准列举了一些常用词语和例句。词语的选词原则是以尽量少的材料反映出普通话的常见语音现象。附录D中选取了常用的双音节词语、三音节词语、四音节词语。附录E中选取了普通话例句和短文。
9语音数据库规范
本规范考虑到语音信号处理的需要,根据普通话读音的特点,推荐了普通话音数据库的设计原则。
对语音的研究,需要从大量的语音数据中,发现文中与语音的对应关系;研究语音基元在语流中的变化;研究语境对发音的影响等。因此,建立一个规范的、科学合理的语音数据库是一项最基础和最重要的工作。
9.1语音数据库结构设计
对于汉语来说,音节是常用的语音基元。首先应对音节数据库进行细致规范的设计。汉语的音节由声母和韵母组成。汉语是声调语言,声调具有语言区别功能。而且,汉语音节在语流中会发生变调、音变以及同化、异化、强化、弱化、儿化。因此,在音节数据库的设计中,必须反映音节的这些特点。因此,建议用一个三维数组A来检索音节数据库:A=lajl
YYKAONrKAcas
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。
标准图片预览标准图片预览

标准图片预览:






  • 热门标准
  • 电子行业标准(SJ)标准计划
设为首页 - 收藏本站 - - 返回顶部
请牢记:“bzxz.net”即是“标准下载”四个汉字汉语拼音首字母与国际顶级域名“.net”的组合。 ©2009 标准下载网 www.bzxz.net 本站邮件:[email protected]
网站备案号:湘ICP备2023016450号-1