汉语实词的功能构成及其语体差异.pdf
《汉语实词的功能构成及其语体差异.pdf》由会员分享,可在线阅读,更多相关《汉语实词的功能构成及其语体差异.pdf(6页珍藏版)》请在咨信网上搜索。
1、渤海大学学报二二三年第三期渤海大学引言现代汉语实词具有多功能性,词类和句法成分之间没有一一对应的关系,自从朱德熙(1985)提出这一观点以来1,这已成为语法学界的共识。既然汉语词类和句法成分之间不是一一对应的,那么它们之间有没有选择倾向,这种倾向有无语体差异?词类与句法成分之间有无选择倾向应从两个方面来看:一是每个词类充当不同句法成分的比例,即词类的功能构成;二是每种句法成分由不同词类充当的比例,即句法成分的词类构成。这两类数据在逻辑上没有关系。关于这两个问题,莫彭龄、单青(1985)统计了名词、动词、形容词充当六大类句法成分的频率2;贺阳(1996)统计了性质形容词的句法功能构成3;郭锐(2
2、002)(以下简称郭文)则全面统计了这两方面的数据4。这几项统计都是人工手动进行的,统计的材料规模小、类型少淤。在自然语言处理技术日益发达的今天,这两个问题可以利用大规模句法标注语料库的材料重新研究(实际结果并不完全相同)。限于篇幅,本文只研究第一个问题。我们选择 10 种常见语体的材料于,用哈工大社会计算与信息检索研究中心研制的自然语言处理开放工具 LTP(语言技术平台)盂进行依存句法关系标注,并结合其自动分词和词性标注功能,制作了一个涵盖不同语体的依存句法标注语料库。在此基础上,分别统计 10 种实词(包括拟声词)在上述 10 种材料中充当各种句法成分的比例,总结各类实词句法功能的构成倾向
3、及语体差异,以此验证实际语篇中实词多功能性的强弱。一、统计说明LTP 标注的依存句法关系共 13 种:主谓、动宾、间接宾语、前置宾语、兼语、定中、状中、动补、并列、介宾、左附加(如连词结构)、右附加(的、了、们等结构)、独立结构和核心。与直接成分分析法不同,LTP 把两两相对的句法关系标在中心词上,而不是整个直接成分。如 SBV 主谓、ADV 状中、ATT 定中、VOB 述宾:(1)“骆驼”只是个外号 (骆驼/n,是/v,SBV)只/d,是/v,ADV 个/q,外号/n,ATT (是/v,外号/n,VOB)我们把组成每对句法关系的两个成分分开统计,核心成分不统计(已有其他功能)。实际统计的句法
4、成分有 20 个:主语和谓语、述宾述语和宾语、前宾述语和前置宾语、间宾述语和间接宾语、兼语述语和兼语、定语和定语中心语、状语和状语中心语、述补述语和补语、介词和宾收稿日期:2023-02-20基金项目:天津市社科规划项目“特征测量方法在语体研究中的运用”阶段性成果(项目编号:TJYY20-006)作者简介:郭昭军(1974),男,博士,南开大学文学院副教授,硕士研究生导师,从事现代汉语词汇、语法计算研究。汉语实词的功能构成及其语体差异郭昭军关金子(南开大学 文学院,天津 300071)摘要:语法学界普遍认为现代汉语实词具有多功能性,词类与句法成分之间不是一一对应的。然而,根据对包含不同语体材料
5、的依存句法标注语料库的统计,我们发现:(1)实际语篇中汉语实词的多功能性并不强,大多数实词只表现出一两个(主要)功能;(2)汉语实词的功能构成(不同功能所占的比例)在不同语体中存在差异,这种差异不仅仅是口语与书面语的对立,而且比例高的功能其语体差异不一定大。根据词类的这种功能构成模式,运用机器学习中的分类算法,可以自动判断出一个词语的词类归属。关键词:词类;句法功能;比例;语体差异中图分类号:H031文献标识码:A文章编号:1672-8254(2023)03-0089-06渤海大学学报二二三年第三期渤海大学089089渤海大学学报哲学社会科学版渤海大学语、左附加左和右附加右。LTP 对上述 1
6、3 种句法关系的标注是各自独立的,因此这些成分的统计数据也相互独立、互不影响。为便于与句法成分的传统分类对应,我们把所有述语合并计为“述语”,把所有宾语和兼语合并计为“宾语”。最终选择 7 种句法功能进行统计分析:主语、谓语、述语、宾语、定语、状语和补语等榆。在具体统计时,以 LTP 依存句法分析结果为准,即例(1)中右边中的内容,不考虑具体词语,只按其词类进行计算。如例(1),名词句法功能 3 个(主语、定心和宾语),所以名词的功能构成为:主语 50%、宾语 50%(定心不计);同理,动词的功能构成为:谓语 50%、述语 50%(状心不计),副词为状语 100%,量词为定语 100%。需要指
7、出的是,统计词类的功能比例时,被除数(总和)既不能是词型总数,也不能是词例总数,必须是句法功能总数,因为一个词语可以同时充当多种句法成分。此外,不同词类的句法功能构成之间是没有逻辑关系的。因此,不能用一个词类某种功能的频率高低,来解释另一个词类某种功能频率的高低。二、各类实词的统计数据及其分析(一)名词广义名词除了普通名词外,还包括专有名词、时间名词、处所名词和方位名词等。先看普通名词的功能构成(百分比,下同)及其语体差异(标准差虞,下同)。一般认为,名词的主要功能是做主语或宾语。从上表(见表 1)看,实际语篇中名词有一半左右的功能是做宾语,其次是做定语或主语,而且在非文学语篇中定语的比例超过
8、了主语愚。在这三种功能中,定语功能的语体差异最大。名词做定语在剧本这种口语体中所占比例最低,在新闻和法规这种比较正式的语体中所占比例最高,后者是前者三倍左右。正如郭文所说,这跟两类语体句子的长短有关4(270-293),正式语体的句子一般比较长,修饰语更多,尤其是定语。再看普通名词与其他名词小类的功能构成的差异,下表(见表 2)是不分语体的总体数据。表 1普通名词的功能构成及其语体差异功能剧本小说故事纪实新闻操作散文学术法规政论总体标准差主语25.024.427.521.917.519.923.321.416.619.623.43.2宾语57.551.452.545.339.446.849.2
9、44.643.245.948.74.9定语13.321.116.930.039.929.824.431.338.232.625.08.3合计95.897.096.997.196.896.496.997.398.098.197.00.7注:功能构成为百分比,语体差异为标准差。从表 2 看,名词各个小类的功能构成各不相同。人名超过一半的功能是做主语,其次是做定语。人名是专有名词,是有定的,更倾向于做话题。地名和机构名 60%的功能是做定语。与普通名词主要做宾语不同,三类专有名词很少做宾语,这与专有名词是有定的有关。时间词最主要功能是做状语,其次是做定语。普通名词主要做动词的宾语,极少做介词宾语。处
10、所词和方位词则主要做介词宾语,极少做动词的宾语。(二)动词一般认为,动词最主要的功能是做谓语。不过从下表(见表 3)看,实际语篇中动词 45%的功能是做述语,谓语只占 25%左右。而且,LTP 所标注的谓语不限于动词单独做谓语5,即使这样,表 2名词小类的功能构成差异功能普通名词人名地名机构名时间词处所词方位词主语23.451.710.828.12.210.54.8动词宾语39.211.615.34.74.410.94.7介词宾语9.55.311.47.27.936.742.7宾语合计48.716.926.711.912.447.647.3定语25.030.261.459.631.124.31
11、9.9状语2.20.80.90.153.817.226.4合计99.399.699.899.799.499.798.5注:功能构成为百分比。渤海大学学报哲学社会科学版渤海大学090090渤海大学学报二二三年第三期渤海大学动词做谓语的比例也仍然不高。动词做主宾语的比例很低,尤其是做主语的比例更低。动词做补语的比例也很低,虽然补语是谓词的独有功能。动词做定语的比例也很低,尤其是剧本中;法规中动词做定语的比例最高,后者是前者的12 倍多。这说明正式语体中定语成分比口语更多样化。(三)形容词表 3动词的功能构成及其语体差异功能剧本小说故事纪实新闻操作散文学术法规政论总体标准差主语1.71.31.12.
12、02.41.52.22.63.33.01.70.7谓语28.024.825.221.717.911.322.121.515.619.123.54.7述语45.344.244.843.842.356.344.240.535.441.843.75.0宾语9.710.09.810.713.84.911.112.912.713.810.62.8定语2.04.94.310.215.38.76.711.024.810.27.26.2状语6.86.26.15.65.15.67.27.27.78.66.31.0补语4.66.36.74.32.39.24.22.90.32.55.22.4合计98.197.698
13、.198.399.097.497.898.599.898.898.10.7注:功能构成为百分比,语体差异为标准差。从上表(见表 4)看,形容词主要功能是做定语,其次是做谓语或状语。不过除剧本外,形容词做谓语的实际比例很低。这与学界的研究是一致的。传统观念认为,汉语形容词也可以做主宾语,实际上这个比例很低,尤其是做主语。除操作语体外,形容词做补语的比例很低,这两点与动词类似。由此可见,补语并不是汉语谓词的主要功能。形容词的语体差异主要体现在剧本、新闻和法规等在谓语或定语上的对立,口语谓语比例越高,书面语定语比例就越高,这与郭文的统计一致。这种差异与两种语体的句子的长短密切相关。(四)状态词从下表
14、(见表 5)看,状态词 70%的功能是做表 4形容词的功能构成及其语体差异功能剧本小说故事纪实新闻操作散文学术法规政论总体标准差主语1.91.91.42.21.31.63.42.73.52.22.00.7谓语31.320.322.818.911.119.517.915.09.712.919.56.0述语4.34.54.22.51.01.44.42.00.32.43.51.5宾语15.614.511.712.17.29.318.415.09.615.613.43.3定语23.335.129.340.649.636.037.744.854.045.137.08.8状语11.613.619.716.
15、523.67.412.016.221.816.116.04.7补语11.69.610.77.06.024.75.83.71.15.58.36.2合计99.699.599.799.799.999.999.599.410099.899.60.2注:功能构成为百分比,语体差异为标准差。表 5状态词的功能构成及其语体差异功能剧本小说故事纪实新闻操作散文学术法规政论总体标准差谓语17.116.014.519.222.227.512.714.723.37.316.15.5宾语8.65.14.05.04.821.07.29.80.09.35.25.3定语21.437.021.743.248.335.242.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 汉语 实词 功能 构成 及其 语体 差异
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。