智能语音及人工智能技术简介

智能语音及人工智能技术简介

ID:37263729

大小:6.01 MB

页数:77页

时间:2019-05-20

智能语音及人工智能技术简介_第1页
智能语音及人工智能技术简介_第2页
智能语音及人工智能技术简介_第3页
智能语音及人工智能技术简介_第4页
智能语音及人工智能技术简介_第5页
资源描述:

《智能语音及人工智能技术简介》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、智能语音及人工智能技术简介内容提要一、智能语音及人工智能简介二、智能语音技术原理及进展三、讯飞超脑的全新技术布局我们这个时代的关键词•移动互联网和穿戴式语音交互设备时代的到来我们这个时代的关键词•大数据、云计算、个性化数据中心、云存储、多机同步随时在线、随时在网个性化的广告、新闻、服务、主页,机器不断适应你我们这个时代的关键词•人机交互变革、自然交互、语音交互5月25日,科大讯飞携手京东发布了首款支持语音交互的智能云音箱——DingDong我们这个时代的关键词•人工智能成为新一代研究热点–美国和欧洲将“大脑图谱”设定为继“人类基因图谱”之后最重要的信息生物跨界研究项目,在将来的10年内将

2、给与数十亿美金的持续支持–国际IT产业巨头相继推出实用化的人工智能系统奥巴马政府推动“大脑活动图谱计划”欧盟“人类大脑项目”Watson智能答题系统谷歌无人驾驶汽车科大讯飞的历史使命为了少年儿童的快乐成长、开心学习为了中华民族的信息安全和文化传播为了人类之间、人机之间的信息沟通无障碍7讯飞核心技术布局语音交互声纹语种语音听写关键词检索安全人脸图像语音转写教育学习声学前端语音合成唱歌评测语音评测音乐多语种音乐搜索手写图文机器翻译自然语言清华实验室哈工大实验室语音交互教育学习讯飞核心技术创新之路认知智能NLP2014~识别2011~评测2005~合成2002~1999~我们的荣誉语音合成:

3、国际英文合成评测比赛九连冠语音识别BC2007:奔驰通用宝马全球中文语音技术测试全获BC2008第一100%100%80%80%声纹识别60%:国际NIST声纹评测连续获得60%国际前三40%40%APJCHEQFJKVCLOEHTR测试时间语种识别:国际NIST语种识别最混淆方言对测试测试任务测试数据规模冠军前三名机构BC2009BC2010包括多种麦克风及电话100%科大讯飞、新加坡100%语音评测80%名:业界唯一通过国家语委鉴定达到实用80%不同方言对测试结果排名3000人,10万测试2008年录音,同信道和交叉信代表机构60%IIR、意大利60%40%对40%次道组合测试P1

4、P2P3MTVBRGNLQP4P5P6P7P8loquendoP9口语翻译SIHCDERPM:ISWLT国际口语翻译评测大赛冠军1新增大声说话和耳语测总分相关度科大讯飞1113112115000人,61万测试总分平均误差科大讯飞、斯坦福2010年200.987麻省理工学院林BC2011BC20123250.99国家科技进步奖2试:语音领域唯一获得232222123对两次国家科技进步奖2.382.382.42.432.452.45研究院、SVIST2.472.52.522.520.985100%肯实验室100%2.51.9880%0.97980%220150.9860%0.978捷克布尔诺科

5、技0.9770.9770.97760%科大讯飞、捷克布重点测试带噪电话语音0.9760.9760.9760.9750.9752000人,188万测试1.52012年40%40%尔诺大学、新加坡0.9753GEHKLBCMDFJI大学&法国科场景333133332科大讯飞对ACIFBGDHJKE115科大讯飞学研究中心BLEU100.970.5IIRBLEU0.965010日本德国KIT5机器分NICT5机器分评分员7评分员2评分员1评分员6评分员5评分员4评分员8评分员9评分员3评分员1评分员7评分员2评分员6评分员8评分员5评分员4评分员9评分员3评分员10评分员1000中到英翻译英到中翻译

6、内容提要一、智能语音及人工智能简介二、智能语音技术的基本原理三、讯飞超脑的全新技术布局提示•以下介绍内容相对较多智能语音及模式识别技术原理,内容较为连贯,请集中精力听,因为:–这些都是作为讯飞人应该知道的基本技术原理–如果是研发人员:理解你将要做的工作在整个技术框架中的位置,具备全局视角–如果是产品人员:可以更好理解和应用核心技术,成为懂技术的伯乐和鲁班–如果是市场人员:可以对外介绍讯飞的技术实力,成为外行眼中的内行注:为了易懂,有些形象化说法表述在学术上不是非常严谨因时间原因,本报告较少提及这些核心技术的应用情况12什么是语音语音识别技术语音合成技术13什么是语音•语音:–人类发音器官发

7、出的声音–是声音的一种–包括说话、歌唱等形式•语音产生于约二十万年前•但人类能听到的历史不过128年,(1877年:爱迪生发明留声机)•计算机、声卡=>语音的计算机处理技术语音产生机理元音发音器官形状汉语辅音音素发音方式(口型及送气等)决定了我们所发的音发音方式(口型及送气等)决定了我们所发的音语音进入计算机:波形和语谱图元音a辅音ch语谱图:能量在不同频率上e)茶共振峰:能量聚集的频带,取决于口

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。