• 回答数

    6

  • 浏览数

    227

伊泽瑞言
首页 > 英语培训 > 英语语料库的制作

6个回答 默认排序
  • 默认排序
  • 按时间排序

pinkyoyo0403

已采纳

首先你要明确,需要建立的是单语语料库还是双语语料库。1、建立单语语料库比较简单,只需要准备好相关语料(古代汉语/现代汉语/英文/其他语言),将语料导入AntConc软件进行检索即可。知乎上有大神的帖子写过具体方法:建立你自己的专属英语语料库,妈妈再也不担心你的写作啦2、建立双语语料库,你需要先准备双语对照(如中英对照)的原文和译文,进入Tmxmall在线对齐页面,将语料导入进行句级对齐,再导出为tmx格式,即为自己的双语语料库,可以用于后续的学习和研究。

英语语料库的制作

256 评论(15)

思念你的情意

首先要明确建立的是单语语料库还是双语语料库,因为用到的建库软件和方法不一样,单语语料库的建立过程相对简单一些。

1、单语语料库

(1)准备单语语料,将语料都转换成TXT格式,建议按一定规律给各个文档命名

(2)下载并安装AntConC软件,界面如下

(3)将准备好的文档全部导入软件,然后就可以在AntConc里检索语料了。具体使用方法可以自行百度。

2、双语语料库

(1)语料准备

准备英汉对照的双语文档。可以是两个文档,其中一个英文,一个中文;也可以是英中上下对照或左右对照的单文档。无论是双文档还是单文档,都要注意原文与译文需要严格对照,这是后续软件识别的重要基础。

(2)语料对齐

业内有几种主流的语料对齐工具,我个人用的最多的是Tmxmall在线对齐。

例如,英中文档的对齐效果如下,将对齐好的文档导出,存为tmx格式。

(3)在trados等CAT工具中新建翻译记忆库,把之前保存好的tmx文件导入即可。

附:关于原语料来源,一是自己翻译积累,二是权威网站获取,优质的原语料是优质语料库的前提。如果觉得自己做语料库耗时间,也可以到Tmxmall语料商城上看看别人上传的各类语料库,和其他译员交易已经建好的语料库。

263 评论(12)

叶子飞扬

1. 多做翻译,之后把翻译对齐(可以用Tmxmall做在线对齐,比较简单),对齐后的文件便是tmx语料库格式

2. 自己到网上下载相关语料,然后做对齐,制作tmx双语文件

3. 倘若公司以前有做过的翻译语料,直接可以用Tmxmall做对齐,复用以前的翻译

4. 用TMROBOT管理语料,防止语料太乱以及语料丢失

Tmxmall对齐方式是先基于段落对齐,然后再细化为句对齐,很好的提高了工作效率及准确。

170 评论(12)

M15981511985

要的东西很多,首先你要有材料,然后你要有仓库,而且还要有地方,有时间,有人力有物力都是需要的,最主要的还是需要金钱

162 评论(10)

mfiongfiong

组建一个语料库需要很多条件,必须得知道你的组织上面的语料库有合格者,工商执照了,你哥哥证件。

254 评论(8)

好难瘦小姐

仅一个文本肯定是不够的,要有很多文本,而为了保证文本的真实性(不能自己凭空捏造),所以做科学研究的时候就需要建立在语料库的基础上,所以说是基于语料库的研究。比如,我研究一个作家的语言风格,我就要建立在他创作出来的文本之上;我要研究汉语的一些语言现象,一般就要建立在平衡语料库之上,研究其他语言同样。语料库一般都会有人创建的,不需要自己做。

156 评论(10)

相关问答