gangyaya037
1.英国国家语料库(BNC)网站地址:英国国家语料库(British National Corpus)是目前世界上非常有代表性的当代英语语料库之一,由英国牛津出版社、朗文出版公司、牛津大学计算机服务中心、兰卡斯特大学英语计算机中心以及大英图书馆等联合开发建立。以来源广泛的书面语和口语为样本,呈现了20世纪后期以来的英式英语。其中词容量超过一亿,书面语占90%,口语占10%。BNC包含了各个年龄段、各个社会阶层的语言,覆盖英国语言的方方面面。整个语料库包含4054篇文本取样,每篇抽样文本的长度不超过45000词。2.美国当代英语语料库(COCA)网站地址:美国当代英语语料库,简称COCA,是目前最大的免费英语语料库,它由包含 5.2 亿词的文本构成,这些文本由口语、小说、流行杂志、报纸以及学术文章五种不同的文体构成。从 1990 年至 2015 年间语料库以每年增加两千万词的速度进行扩充,以保证语料库内容的时效性。因此,美国当代英语语料库被认为是用来观察美国英语当前发展变化的最合适的英语语料库。3.美国国家语料库(ANC)网站地址:美国国家语料库(American National Corpus)记录了20世纪90年代以来,2200万美式英语的口语和书面语词汇。它是目前规模最大的关于美式英语使用现状的语料库,也极大地促进了语料库语言学的发展。4.柯林斯英语语料库(BOE)网站地址:柯林斯语料库为目前世界三大著名语料库之一,该语料库(The Bank of English)为英国伯明翰大学与Harper Collins出版社合作建立的COBUILD语料库的一部分,目前固定在4.5亿词的规模,可以在线检索。柯林斯英语语料库是从20世纪80年代开始在John Sinclair教授指导下建立的,主要应用与词典编撰的一个大规模语料库。目前Haper Collins出版社已根据该语料库编撰出版了多本非常有影响的英语词典。
爱尔兰咖啡啊
关于语料库的三点基本认识:语料库中存放的是在语言的实际使用中真实出现过的语言材料;语料库是以电子计算机为载体承载语言知识的基础资源;真实语料需要经过加工(分析和处理),才能成为有用的资源;定义语料库名词(corpus,复数corpora)指经科学取样和加工的大规模电子文本库。借助计算机分析工具,研究者可开展相关的语言理论及应用研究。corpusn. (pl. corpora)refers to a large collection of well-sampled and processed electronictexts, on which language studies, theoretical or applied, can be conducted withthe aid of computer tools.语料库是语料库语言学研究的基础资源,也是经验主义语言研究方法的主要资源。应用于词典编纂,语言教学,传统语言研究,自然语言处理中基于统计或实例的研究等方面。分类语料库有多种类型,确定类型的主要依据是它的研究目的和用途,这一点往往能够体现在语料采集的原则和方式上。有人曾经把语料库分成四种类型:⑴异质的(Heterogeneous):没有特定的语料收集原则,广泛收集并原样存储各种语料;⑵同质的(Homogeneous):只收集同一类内容的语料;⑶系统的(Systematic):根据预先确定的原则和比例收集语料,使语料具有平衡性和系统性,能够代表某一范围内的语言事实;⑷专用的(Specialized):只收集用于某一特定用途的语料。除此之外,按照语料的语种,语料库也可以分成单语的(Monolingual)、双语的(Bilingual)和多语的(Multilingual)。按照语料的采集单位,语料库又可以分为语篇的、语句的、短语的。双语和多语语料库按照语料的组织形式,还可以分为平行(对齐)语料库和比较语料库,前者的语料构成译文关系,多用于机器翻译、双语词典编撰等应用领域,后者将表述同样内容的不同语言文本收集到一起,多用于语言对比研究。已经累积了大量各种类型的语料库,如:葡萄牙语种树库、面向文本分类研究的中英文新闻分类语料库、路透社文本分类训练语料库、中文文本分类语料库、大开放字幕库OpenSubtitles的多语言平行语料数据(OpenSubtitles Corpus)、《圣经》双语语料库("Bible" bilingual corpus)、Short messages service(SMS) corpus(短消息服务(SMS)语料)等。特征语料库有三点特征⒈语料库中存放的是在语言的实际使用中真实出现过的语言材料,因此例句库通常不应算作语料库;⒉语料库是承载语言知识的基础资源,但并不等于语言知识;⒊真实语料需要经过加工(分析和处理),才能成为有用的资源。语料库的发展经历了前期(计算机发明以前),第一代语料库,第二代语料库,到第三代语料库
小狮子女王
Corpus Linguistics语料库语言学(Corpus Linguistics)就是一门与语料库直接有关的语言学科。但是语料库语言学与其它各种加修饰语的语言学科不同:别的语言学科基本上都是研究有关领域...语料库语言学(Corpus Linguistics)就是一门与语料库直接有关的语言学科。但是语料库语言学与其它各种加修饰语的语言学科不同:别的语言学科基本上都是研究有关领域与语言之间的关系,例如,社会语言学研究的是社会与语言的关系,心理语言学研究的是人的心理活动与语言之间的关系。而语料库语言学则不同,它只是以语料库为手段来研究语言。语料库是载有语言信息的大量语言资料的集合。语料库中的语料可以是为了特定目的而收集的语言资料(如对讲母语的发音合作人的采访记录,也可以是某一特定范围的书面材料,如中古英语语料),也可以是为了一般语言研究的目的而收集的语言资料(如自然会话的转写资料和报刊杂志书籍的文字资料)。
吸管狂魔
教学是教师的教和学生的学所组成的一种人类特有的人才培养活动。通过这种活动,教师有目的、有计划、有组织地引导学生学习和掌握文化科学知识和技能,促进学生素质提高,使他们成为社会所需要的人。下面是我精心整理的浅析语料库在外语教学中的应用,欢迎阅读,希望大家能够喜欢。