欢迎来到天天文库
浏览记录
ID:51691754
大小:513.50 KB
页数:3页
时间:2020-03-15
《paraconc正则表达式检索.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、PARACONCParaconc的使用;特殊软件的使用对于翻译而言,使用PARACONC软件可以提供更多的翻译信息。现在使用的PARACONC软件可以同时呈现一个原文和三个译文,并能提供词频和词性方面的对比信息。这些信息以窗口形式呈现出来,专家译文、优秀学生译文和质量较差的译文在词频和词性上可能会有不同的表现。我们还以上一节的三种译文为例说明这种对比的可能性。使用Paraconc可以在翻译课堂上做三件事情:一是呈现句子层面的平行译文;二是提供词频对比数据;三是提供词性频数对比数据。Paraconc检索带附码的语料:Paraconc高级检索为附码语料的检索提供工具。只要在TagSetti
2、ngsSpecialTag中定义好TagsFormat,就可以使用&查询,&是附码标记。这时,可以在advancedSearch中选择TagSearch,然后在对话框中输入&v,便可以检索到所有的汉语动词。如果以POS为线索检索词丛,就可以使用下面的形式:&r&u&n。得到下面的检索结果:Paraconc中正则表达式的使用:实际词定界b,只在词前标记即可,W为空格,w为任意词。这样,如果想检索a*lof这样的短语,就可以写成baWbw+WbofW。如果是有词性标记或者其他标记的语料库时,要根据语料库中实际排列的状况写出正则表达式。如,要检索a_AT1s加任意1个词加
3、of_IOs这样带有POS的结构,可以使用下面的正则表达式:ba_[A-Za-z0-9]+Wbw+_[A-Za-z0-9]+Wbof_[A-Za-z0-9]+W检索到:隐藏标记(Supress)后重新排列,就得到:同样,如果是搜索a与of间有1-3个词跨距的表达形式,就可以使用下面表达式检索。ba_[A-Z0-9]+W(bw+_[A-Z0-9]+W){1,3}of_[A-Z0-9]+b如果不限制,只要有任意词即可,就可使用下面的表达式:ba_[A-Z0-9]+W(bw+_[A-Z0-9]+W){1,}of_[A-Z0-9]+b当然,使用Paraco
4、nc检索汉语时,和英语有所不同。汉语检索一般要将w替换为[x00-xff],否则只能检索到音节词。如使用正则表达式检索汉语译文中两个词构成的词串,使用下面的正则表达式:(b[^x00-xff]+_[A-Za-z0-9]+W){2}检索到下面的索引:
此文档下载收益归作者所有