浅谈数学在信息领域的应用价值

浅谈数学在信息领域的应用价值

ID:22027041

大小:87.57 KB

页数:5页

时间:2018-10-26

浅谈数学在信息领域的应用价值_第1页
浅谈数学在信息领域的应用价值_第2页
浅谈数学在信息领域的应用价值_第3页
浅谈数学在信息领域的应用价值_第4页
浅谈数学在信息领域的应用价值_第5页
资源描述:

《浅谈数学在信息领域的应用价值》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、浅谈数学在信息领域的应用价值——在语言处理上的作用如题所言,本文主要讲述的便是数学在信息领域中的应用价值,但即使是这样,泛泛而谈整个信息领域,还不如抓住其中一点来进行阐述,表达下我对数学在信息领域汇中的价值的理解及看法。语言是人类进行沟通和交流的最主要方式之一,相信所有人都明白和一个说话有障碍的人进行沟通时的困难。随着科学技术的发展及世界一体化进程的稳步前行,语言交流的方式也不再局限于面对面、口对口的交流,更多的沟通工具被广泛应用于生活生产实际当中;而不同国籍之间的人、不同肤色之间的人进行对话也不再变得那么稀奇。在这样的情况下,问题就自然暴

2、露了:利用沟通工具和不同的语言进行交流的时候,如何保证信息的正确性,或荠确切的说,如何根据获得的信息来推测说话者想要表达的意思呢?数学模型是一种人类用来解决生产生活中的实际问题而模拟进行的一种方法,能够通过数据、实物、公式等方式来模拟或者解释各个领域的问题,其应用范围之广,能力之强,越来越得到科学家和数学研究者们的青睐,著名的円心说以及地心说,就是在大大小小几十个圆的模型上建立起来的。而对于以上的语言处理问题,利用数学模型,也将该问题进行丫解释。首先我们将问题进行梳理一番:两个人进行交流,一个人根据所收到的信息去猜测说话人要表达的意思。这个

3、过程就好像是在信道当中,根据接收到的信号去分析理解发送端信源所包含的信息。用通信系统的典型土里进行分析:信息源91s2S3....接收结信道o1o2o3其中Sl,s2,s3...表示信息源发出的信号,02,03...是接受器接收到的信号。而我们所要做的,就是根据接收到的信号02,03...还原出发送的伯号Si,S2,S3.••0这个过程用科学的术语来定义,就是所谓的“语音识别”。那么究竞该如何根据接收端所得到的信息来推测信息源即说话者所想耍表达的信息呢?在上文中已经提到,数学模型在解决这个问题的过程中又再次发挥了其巨大的作用。用“隐含马尔町

4、夫模型”(HiddenMarkovModel)来解决对于这些问题,被认为是实现快速精确的语音识别系统的最成功的方法。对于以上问题,当我们观测到语音信号o2,o3...时,我们要根据这组信号推测出发送的句子Sl,s2,s3。显然,我们应该在所有可能的句子中找最有可能性的一个。用数学语言来描述,就是在已知Ol,02,的情况下,求使得条件概率:P(Si»S29S3...0(,O2,O3...)达到最大值的那个句子S2,S3...0上面的概率并不容易直接求出,利用贝叶斯公式,我们有P(Si,S2>S3...Oi,O2,O3...)=P(Si,S2,

5、S3...;Oi,O2,O3...)/P(0i,O2,O3...)而P(s,,s2,s3...;obo2,o3...)=P(obo2,o3...Isi,s2,s3.••)*P(sj,S2,S3...)因此,可以得到:P(Si,S2,S3...IOi,02,0:i...)=P(ob02,03...ISi,s2,s3...)*P(s”S29S3...)/P(Oi,O2,O3...)其中的P(ob02,03...)可以得到,作为常数项忽略。而P(oh02,03....ISi,S2,S3...)表示某句话S,,S2,S3...被读成0,,02,03

6、...的可能性,而P(sbs2,s3...)表示字串Sps2,s3...本身能够成为一个合乎情理的句子的可能性,所以这个公式的意义是用发送信号为Sl,S3...这个信息列被读成01,03...的可能性乘以Sl,s2,s3...本身可以成为一个句子的可能性,得出概率。当然,要建立这样的模型,需要做如下的假设:①、s:,s2,s3...是一个马尔可夫链,也就是说,Si只由决定);②、第i时刻的接收信号Oi只由发送信号Si决定(又称为独立输出假设,即P(Ch,02,03...Is,,s2,s3....)=P(ojsi)*P(02

7、S2)*P(O3

8、

9、s3).••。于是,我们便可以利用算法Viterbi找出上面式子的最大值,进而找出要识别的句子Sl,s2,s3...。上面所述的模型即隐含马尔可夫模型。之所以用“隐含”这个词,是因为状态&,S2,s3...是无法直接观测到的。此方法是由上世纪70年代的贾里尼克建立的,利用隐含马尔可夫模型来解决语言处理问题,语咅识别的错误率相比人工锊能和模式匹配等方法降低丫2倍(从30%到10%)。而李开复在利用隐含马尔可夫模型的框架之下,成功地开发了世界上第一个大词汇量连续语音识别系统Sphinx。马尔可夫链的另一个应用便是拓展之后形成了贝叶斯网络。一般

10、的马尔可夫链只是描述了一种状态序列,它的每个状态值都由前而有限个状态决定。而现实屮,往往事物之间的关系错综复杂,并不能够用一条链来反映问题。举个通俗的例子,心血管疾病和它的导致原

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。