语言分析工具语言分析工具语料库(corpus,复数为corpora)一词来源于拉丁语,本意为body。一般情况下,语料库往往指的是一个“电子文本集”(a collection of texts stored in an electronic database)。真正意义上,语料库是一个按照一定的采样标准采集而来的、能够代表一种语言或者某语言的一种变体或文类的电子文本集。以一个语料库为数据源(data source)进行的研究可以看作是对该语料库所代表语肓、语言变体或文类的研究,研究所得到的结论可以推广到整个语言、语言变体或文类。语料库语料库语料库(corpus)是语言材料的仓库,是计算机进行语言检索、比较、分析等处理的重要基础。(张普1999)语言学名词审定委员会2011年推出的语言学名词中,对语料库的定义、作用及应用领域的阐述为:(语料库是)为语言研究和应用而收集的,在计算机中存储的语言材料,由自然出现的书面语或口语的样本汇集而成,用来代表特定的语言或语言变体。经过科学选材和标注,具有适当规模的语科库能够反映和记录语言的实际使用恃况。通过语科库能够观察和把握语言事实,分析和研究语言系