怎么利用语料库做古代汉语语法化研究?

如题所述

词语转类在各种语言现象中普遍存在。它指的是不经过任何词形变化直接用于其它词性的词。现代汉语中的名转动词现象一直是语言学家关注的焦点。回顾以往的研究可以发现,研究者们主要从结构主义语言学、转换生产语言学、认知语言学和功能语言学等不同的理论出发,对名转动词现象做出了不同程度的描写和解释,他们的研究对更好地理解这一语言现象有重要意义。语言的转变处于一个持续变化的连续系统,而非一成不变的封闭系统。名词彻底转换为动词要经过活用和兼类两个阶段才能成功完成。活用具有临时性,是偶然出现的用法,词典不会对其活用词性加以标注;而兼类具有稳定性,词典上会对其新词性加以标注。以往研究多侧重于不同理论对名转动词现象的解释,对转换过程中处于活用和兼类这两个不同阶段的词语的使用特点则研究较少。为弥补该不足,本文将借助《现代汉语词典》(第五版和第六版)以及北大汉语语料库(CCL)在以下方面做出有益尝试。第一,搜集第五版现代汉语词典中名转动词的活用词;第二,借助第六版现代汉语词典找出这些词中哪些已经变为兼类词;第三,对仍是活用词的和已经变为兼类的这两类词在北大汉语语料库中的语料进行比较和研究,通过定性和定量分析,对它们被用作动词的频率、分布以及语料来源进行比较,结果发现兼类被用作动词的平均频率大约是活用被用作动词的平均频率的十倍,而活用和兼类被用作动词的频率在不同的文本体裁中也呈现不同的特点。最后,本文借助认知语言学中的凸显理论和转喻对名转动词的活用和兼类做进一步比较,发现活用词的动词意义并不稳定,只适用于一些特定语境,而兼类词的动词意义比较固定,已成为中心词义的一部分。

温馨提示:答案为网友推荐,仅供参考
第1个回答  2017-12-11

要学会用手册哦……CCL语料库使用说明没跑过古汉的库,跑过现汉和英语的;也没用过北大的库,现汉用的是教育部和Sketch Engine,英语用的是COCA。所以以下说明适用于所有语料库但仅供参考。看了一下北大的库,然后对比了一下教育部的库(语料库在线),感觉是这样的:两个库的容量差不多,就上手来说,教育部的库看起来漂亮比较好上手,但是北大库的高级功能更多一些。你可以两个搭配着用(比如说以教育部的库作为筛选表,以北大库作为语料核心源),但是我建议不要混用,因为我看了一眼来源,感觉二者语料来源重叠还是挺多的。语料库本身就是以数据为主的,所以要做好经常读词条的准备。两个库都提供了词频表你可以先看一下你想查的词的词频,做好心理准备。古汉语的范围太广了,从周到清(北大库好像还包括早期民国),所以首先要筛取你所需要的时间段,上古、中古还是近代汉语,或者说具体是在什么体裁里等到确定以后,再进行筛选。做长期研究的话,建议直接开始对着手册用高级搜索,要不从普通搜索到高级搜索的转换过程还是有点辛苦的。如果你只有一个确定的词,并不知道自己要具体研究什么语法现象,那么先在给定范围里(时间、体裁)搜索一个词,抽出500条基础样本下载到本地,然后归纳一下这500条里出现了什么样的现象。就拿手册里给的“明清时代‘所以’的用法”来查吧,用给定词然后加上给定范围,能查出来将近八千条,然后先下载500条给出一个大致的分析来。如果你想查确定的语法现象,比如说“者……也”,那么可以用组合要求,具体的搜索办法可以参照手册。在这500条整理结束之后,如果你想扩展到全库的搜索,那么就可以直接上网页分析。网页分析的时候要注意使用左排序和右排序,这是帮你把前紧接着的字和后紧接着的字归纳在一起,如果你想查一个词前面或者后面比较喜欢跟着什么样的词的话,左排序和右排序会非常有帮助。方便上手的功能和基本需要注意的事项就是这些,剩下的就是题主自己需要研究的事情了,我也帮不上什么忙了。

本回答被网友采纳
第2个回答  2017-12-11

我们通常的经验是可以用3个数或坐标去描述空间中的一点的位置。譬如人们可以说屋子里的一点是离开一堵墙7英尺(1英尺03048米)离开另一堵墙3英尺并且比地面高5英尺。人们也可以用一定的纬度、经度和海拔来指定该点。人们可以自由地选用任何三个合适的坐标虽然它们只在有限的范围内有效。人们不是按照在伦敦皮卡迪里圆环以北和以西多少英里以及高于海平面多少英尺来指明月亮的位当代语言学已经进入了一个科学与技术的互补时代,信息处理水平成为衡量国家现代化水平的重要标志之一。知识世界的载体是语符系统,信息处理的根本对象是语言信息处理。与计算机的出现使得语言符号有可能成为数据处理对象相似,神经科学实验仪器设备的应用,使得在大脑神经层面探讨语言机制成为可能。这些无疑都引导语言研究走向科技化,“语言科技新思维”应运而生。所谓“语言科学”包括理论语言学、描写语言学、历史语言学、应用语言学等分支学科,所谓“语言技术”指语言研究的现代技术手段,包括语言信息处理、语音实验分析,以及语言的神经、心理和行为实验分析的技术手段等。就语言信息处理而言,又可以分为语料库研制技术、知识库研制技术、知识挖掘和抽取技术、句法信息处理技术、词汇信息处理技术、语音信息处理技术、语义信息处理技术、语用信息处理技术等。

相似回答