语料库,顾名思义,就是存有大量文本素材的资料库。随着计算机技术的普及和进步,大数据下的数据库促使语料库资源更加完善。语料库研究法自二十一世纪以来,就广泛运用在文学、教育和传播领域的研究,也是现在国内外相关学术领域中最热门的研究方法。我将在这篇文章中,快速的让你了解语料库研究法。什么是语料库研究? 语料库研究就是,通过已有的语料库或自己建立的语料库,对库中的文本进行分析。通过多种方法,进一步得出文本背后所涉及的面向、角度、观点、态度或框架。当前国内外的语料库分析法研究趋势主要分成两个部分:1、利用语料库,研究语言运用的不同面相。也就是用这样的方法,分析出文本中所讨论的角度。2、基于语料库反映的语言事实, 检测、批判现有语言理论或提出新观点。与第一点不同,这里更注重的是对文字、词频上的使用进行研究。 西方国家的语料库分析法主要涉及文学类作品的文体分析,可以追溯到1981年的Leech和 Short。直到20世纪90年代开始,Wyne、Shore、Culpeper等人运用语料库分析法,从对文学类作品的研究,转到对非文学类的尝试。而中国的语料库分析法主要应用于对译者风格、文学作品、学术语篇摘要和新闻报导及其他领域。 为方便理解,以学者丁晓所写的一篇《语料库AntConc软件对<推拿>的分析研究》举例,其中有运用语料库AntCone中“Word List”这一工具,罗列出小说《推拿》中出现频率在前54位的词,并以此来分析文本内容。 《推拿》中出现频率在前54位的词 通过对此表频率前54位的人称代词的观察,可以清楚地看到,“他”出现1514次,“她”出现1118次,分别位于第8和第10位;而“你”出 现702词,位于第19位;“我”出现515次,位于第33位;“他们”出现409次,位于第40位。因此可以通过此数据简要得知,在《推拿》这篇小说中主要运用的第三人称来叙述,且男性代词的使用要远远超过女性代词的使用。 总之,这一研究方法最早是被用来研究文学类作品的,随后经过不断尝试后,开始进入教育学和传播学。补充一下,目前中国已有的语料库更多是语言类语料库,比较知名的中文语料库包含北京大学中国语言学研究中心和现代汉语平衡语料库,而国外知名的语料库则包含BNC (British National)、BOE(the Bank of English)、ANC(American National Corpus)。如何运用语料库分析?语料库分析法中最常用的三种分析是:词频统计分析(frequency list)、并置词分析(collocation)、共词句分析(concordance)。1、词频统计分析(frequency list):是对文献正文中重要词汇出现的次数进行统计与分析,是文本挖掘的重要手段。基本原理是通过词出现频次多少的变化,来确定热点及其变化趋势。因此被作为语料库分析的基底,研究者可以通过词频统计,了解热点词汇和变化趋势,也利于归纳和比较,是语料库能够提供的最重要的数据类型。2、并置词分析(collocation):利用T-score 检测共同出现的词汇,或研究某一样本分布平均数和整体分布平均数间的差异性,以此来了解多个词汇中的相关性。3、共词句分析(concordance):透过将词汇所存在的语句并陈显示其前后文情况,试着共同出现得到词句带有什么隐喻和立场。因此也是观察字汇在文本中的中心脉络,也能通过这样试着探寻词汇背后话语者的传播意图。4、关键词脉络索引分析:关键词脉络索引是将检索的词汇为中心点,将此词汇之左右若干词汇并陈,以显示此词汇之上下文脉络。这用来研究,文本背后所体现的意识形态。举例说明资料 简单举例,我们对2月21日人民网新闻头条《“走,咱们回家。
”—首批滞留“钻石公主”号邮轮香港居民乘包机返回》进行语料分析。 经过分析后发现,这篇报道共有492个词汇,其中出现最多的词汇是「香港」(n=21),其次是「包机」、「游轮」。进一步得出,这篇报道的消息来源和受访者都是权威人士(政府、专业人士),较少民众的角度。其次,「有力」、「孤岛」这样的词汇很容易引起阅读者的情绪感受。最后,当然啦,人民网是我们的第一媒体,这样的话语方式是它特有的,也因此有些特殊职能。 语料库数据要多、量要大,以保证分析的准确性及合理性,以上只是我的简单运用,试着让你理解,语料库分析究竟是在做什么。语料库研究方法的评价 语料库研究法作为互联网大数据下的产物,算是一个新颖的研究方法,所涉及的领域也很广泛。在职场中,也有很多网络公司、广告公司利用这样的方式,去了解用户的体验和评价。从研究者角度而言,这样的研究方法其实相对容易上手,只要学会如何使用工具即可。其根本比较费神的两点是:1、前期自建语料库会比较辛苦;2、需要对议题有深入的了解,才能总结出话语背后的意识形态或社会因素。 常用的研究工具有,日本早稻田大学研发的AntConc、英国利物浦大学开发的WordSmith和台湾大学开发的CORPRO。下一章中,我将更具体的与你分享,如何使用研究工具。
0 评论