paraconc正则表达式检索.doc

paraconc正则表达式检索.doc

ID:51691754

大小:513.50 KB

页数:3页

时间:2020-03-15

paraconc正则表达式检索.doc_第1页
paraconc正则表达式检索.doc_第2页
paraconc正则表达式检索.doc_第3页
资源描述:

《paraconc正则表达式检索.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、PARACONCParaconc的使用;特殊软件的使用对于翻译而言,使用PARACONC软件可以提供更多的翻译信息。现在使用的PARACONC软件可以同时呈现一个原文和三个译文,并能提供词频和词性方面的对比信息。这些信息以窗口形式呈现出来,专家译文、优秀学生译文和质量较差的译文在词频和词性上可能会有不同的表现。我们还以上一节的三种译文为例说明这种对比的可能性。使用Paraconc可以在翻译课堂上做三件事情:一是呈现句子层面的平行译文;二是提供词频对比数据;三是提供词性频数对比数据。Paraconc检索带附码的语料:Paraconc高级检索为附码语料的检索提供工具。只要在TagSetti

2、ngsSpecialTag中定义好TagsFormat,就可以使用&查询,&是附码标记。这时,可以在advancedSearch中选择TagSearch,然后在对话框中输入&v,便可以检索到所有的汉语动词。如果以POS为线索检索词丛,就可以使用下面的形式:&r&u&n。得到下面的检索结果:Paraconc中正则表达式的使用:实际词定界b,只在词前标记即可,W为空格,w为任意词。这样,如果想检索a*lof这样的短语,就可以写成baWbw+WbofW。如果是有词性标记或者其他标记的语料库时,要根据语料库中实际排列的状况写出正则表达式。如,要检索a_AT1s加任意1个词加

3、of_IOs这样带有POS的结构,可以使用下面的正则表达式:ba_[A-Za-z0-9]+Wbw+_[A-Za-z0-9]+Wbof_[A-Za-z0-9]+W检索到:隐藏标记(Supress)后重新排列,就得到:同样,如果是搜索a与of间有1-3个词跨距的表达形式,就可以使用下面表达式检索。ba_[A-Z0-9]+W(bw+_[A-Z0-9]+W){1,3}of_[A-Z0-9]+b如果不限制,只要有任意词即可,就可使用下面的表达式:ba_[A-Z0-9]+W(bw+_[A-Z0-9]+W){1,}of_[A-Z0-9]+b当然,使用Paraco

4、nc检索汉语时,和英语有所不同。汉语检索一般要将w替换为[x00-xff],否则只能检索到音节词。如使用正则表达式检索汉语译文中两个词构成的词串,使用下面的正则表达式:(b[^x00-xff]+_[A-Za-z0-9]+W){2}检索到下面的索引:

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。