小型英语影视语料库的建设与应用研究

小型英语影视语料库的建设与应用研究

ID:9154164

大小:67.00 KB

页数:6页

时间:2018-04-19

小型英语影视语料库的建设与应用研究_第1页
小型英语影视语料库的建设与应用研究_第2页
小型英语影视语料库的建设与应用研究_第3页
小型英语影视语料库的建设与应用研究_第4页
小型英语影视语料库的建设与应用研究_第5页
资源描述:

《小型英语影视语料库的建设与应用研究》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、小型英语影视语料库的建设与应用研究周江萌文内介绍了小型英语影视语料库的建设,伍括其设计原则、建设方式以及语料库构成等,继而对其在英语教学方面的应用进行了简要分析。该小型语料库可为英语屮的单词释义、门语教学与翻译教学方面提供一种新的教学手段,以补充传统教学方式的不足,以期在一定程度上改善英语教学效果。关键词:小型语料库;英语影视;英语教学;周江萌,男,助教,,主要研究方向为语料库语言学。收稿曰期:2017-06-15基金:西藏民族大学校内科研项目“小型英语影视多模态语料库的逑设与应用研究”(项目编号16MYQ06)的阶段性研究成果R

2、eceived:2017-06-151概述近年来,语料库的研宄愈见流行。无论是将其作为一种研宄方法-语料库技术,或是作为一种独立的语言学理论-语料库语言学,W内外涉及此的研宄分析都很多。其中最为基础的是语料库的建设。语料库就其内容主题可分为通用语料库和专门用途语料库。代表性的通用语料库有英国国家语料库(BritishNationalCorpus,BNC),美国国家语料库(AmericanNationalCorpus,ANC)等。专门用途语料库则有学术英语语料库中的多学科学术期刊论文语料库和M1CASE学术口语语料库,也有香港理工大

3、学的HKCSE口语语料库等(黄大网,秦羿,徐赛颖,2010)o语料库在很长一段吋间内单指以电子文本形式为存储媒介的语料库,随着技术的发展,逐渐出现丫其他多种存储形式,包括音频,视频等。比如一些单模态的语音语料库与视频语料库等。也随之出现了将各种存储形式混合为一起的多模态语料库。多模态语料库是指把文字语料、音频语料和静、动态图像语料进行集成处理,用户可以通过多模态方式进行检索、统计等操作的语料库(顾曰国,2013)。多模态语料库的建设始于20世纪末,国外己建成了一些多模态语料库,比如欧洲多国于2008年共同建成的SAC0DEYL多模

4、态教学语料库,即世界上首个将数据驱动学>J付诸实践的多语种多模态语料库。我国国内的多模态语料库建设则有顾曰国教授所建的现场即席话语多模态语料库,此外还有李文屮教授的多媒体语料库开发系统以及刘芹和潘鸣威建立的多模态口语语料库。随着研宄领域的深入,大容量的通用语料库在一些特定情况下无法满足一些研究需要,如语言习得、语用语体等,研宄者建立自己的专用语料库则成为一种必然需求。因此,通用语料库与专用语料库共存是一种必然趋势。(何中清,彭宣维,2011)。小型英语影视语料库在内容上属于专门用途语料库,其存储与检索形式则符合多模态语料库的特征。

5、小型英语影视语料库的建设可以辅助教师的课堂英语教学,提高学生的英语学习兴趣;对于影视多模态语料库的分析研宄,则可以对影视英语的语言风格进行文木与音视频的多重观察与分析,一定程度上简易此类相关研究的难度。2设计小型英语影视语料库的设计原则有以下几个方面的考虑。其一,小型化,这里是指其存储容量适中,方便教师个人以小型移动硬盘甚至大容量U盘的方式随身携带;同时要求其能以离线方式检索,检索程序易于安装,适用于教室多媒体平台及教师个人电脑上的系统版本,操作易用性也较为重要。其二,其语料内容需为英语影视剧,这包括英语的电影、电视剧、纪录片等各

6、类形式,易于获取。其三,语料视频与文本内容需经过筛选,以适合课堂教学。除此之外,所选的视频的题材与主题也需耍有一定的广度与深度,文本内容需要达到一定数量,以实现库中需具备一定的单词量,这样才能更好地辅助课堂教学。3建设3.1语料收集语料库建设过程中,收集了适合于英语教学的英美影视剧与纪录片(时长总计190小时),同时附带收集了与其相对应的字幕文件(经统计为122万词)。3.2语料处理将收集后的视频文件与其字幕文件名进行了处理,以实现视频文件与字幕文本文件的匹配对应,方便以后的程序软件进行检索。在此之前还对文件名的命名做出统一编码规

7、定,同时对字幕文木文件进行一定的清洁处理。文件名的匹配处理使用了PowerGREP软件,以实现对于文件名的批处理,并做到统一的规范。其屮,少部分的字幕文件由于时间轴与视频文件不对应,还使用丫TimeMachine软件进行调整。当一部分的字幕与视频出现无法对应的情况时,则直接将其进行了删除。3.3检索程序编写根据视频文件与文本文件的匹配对应情况,结合文本文件的A部结构,编写了相应的检索程序。程序使用了Python语言编写,借助了PyGTK实现程序的阁形界面化,所关联的视频播放软件使用了KMPlayer播放器。3.4语料成库利用编写好

8、的程序文件对建设好的语料库进行随机的检索,以发现其中存在的一些问题,对程序文件做进一步的修改,同时也对语料库进行了完善。经过最终修改后,该小型语料库的库容约为121万词,18万句,181小时,由301个视频与和匹配的字幕文本文件(使用AntCone

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。