pinkyoyo0403
首先你要明确,需要建立的是单语语料库还是双语语料库。1、建立单语语料库比较简单,只需要准备好相关语料(古代汉语/现代汉语/英文/其他语言),将语料导入AntConc软件进行检索即可。知乎上有大神的帖子写过具体方法:建立你自己的专属英语语料库,妈妈再也不担心你的写作啦2、建立双语语料库,你需要先准备双语对照(如中英对照)的原文和译文,进入Tmxmall在线对齐页面,将语料导入进行句级对齐,再导出为tmx格式,即为自己的双语语料库,可以用于后续的学习和研究。
思念你的情意
首先要明确建立的是单语语料库还是双语语料库,因为用到的建库软件和方法不一样,单语语料库的建立过程相对简单一些。
1、单语语料库
(1)准备单语语料,将语料都转换成TXT格式,建议按一定规律给各个文档命名
(2)下载并安装AntConC软件,界面如下
(3)将准备好的文档全部导入软件,然后就可以在AntConc里检索语料了。具体使用方法可以自行百度。
2、双语语料库
(1)语料准备
准备英汉对照的双语文档。可以是两个文档,其中一个英文,一个中文;也可以是英中上下对照或左右对照的单文档。无论是双文档还是单文档,都要注意原文与译文需要严格对照,这是后续软件识别的重要基础。
(2)语料对齐
业内有几种主流的语料对齐工具,我个人用的最多的是Tmxmall在线对齐。
例如,英中文档的对齐效果如下,将对齐好的文档导出,存为tmx格式。
(3)在trados等CAT工具中新建翻译记忆库,把之前保存好的tmx文件导入即可。
附:关于原语料来源,一是自己翻译积累,二是权威网站获取,优质的原语料是优质语料库的前提。如果觉得自己做语料库耗时间,也可以到Tmxmall语料商城上看看别人上传的各类语料库,和其他译员交易已经建好的语料库。
叶子飞扬
1. 多做翻译,之后把翻译对齐(可以用Tmxmall做在线对齐,比较简单),对齐后的文件便是tmx语料库格式
2. 自己到网上下载相关语料,然后做对齐,制作tmx双语文件
3. 倘若公司以前有做过的翻译语料,直接可以用Tmxmall做对齐,复用以前的翻译
4. 用TMROBOT管理语料,防止语料太乱以及语料丢失
Tmxmall对齐方式是先基于段落对齐,然后再细化为句对齐,很好的提高了工作效率及准确。
优质英语培训问答知识库