国际汉语教学中的性质状态类基层词库建设研究
摘要 | 第3-6页 |
ABSTRACT | 第6-9页 |
绪论 | 第24-43页 |
第一节 研究背景概述 | 第24-31页 |
一、研究缘起 | 第24-26页 |
二、研究内容 | 第26-28页 |
三、研究方法及具体方案 | 第28-29页 |
四、主要观点及创新之处 | 第29-30页 |
五、重点难点 | 第30-31页 |
第二节 研究相关动态及主要内容 | 第31-43页 |
一、词表的研制 | 第31-34页 |
二、基本层次范畴理论及应用的研究 | 第34-39页 |
(一) 基本原理层面 | 第34页 |
(二) 基本层次范畴与其他词汇学范畴的关系 | 第34-35页 |
(三) 基本层次范畴的特征 | 第35-36页 |
(四) 基层词的提取 | 第36-38页 |
(五) 基本层次范畴的应用 | 第38-39页 |
三、本人前期已做的实证性研究 | 第39-43页 |
(一) 基层词提取方法 | 第40-41页 |
(二) 基层词的语言学特性 | 第41页 |
(三) 基层词在国际汉语教学中的优势 | 第41-43页 |
第二章 性质状态类基层词的提取 | 第43-83页 |
第一节 基层词提取面临的问题 | 第43-44页 |
第二节 相对词频定位法 | 第44-48页 |
一、相对词频定位法的基本思想 | 第44-46页 |
(一) 区分“绝对词频”和“相对词频” | 第44页 |
(二) 词义范畴间的不平衡性使“绝对词频”失效 | 第44-45页 |
(三) 以“相对词频”反映认知本质 | 第45-46页 |
二、相对词频定位法的技术路线 | 第46-47页 |
三、相对词频定位法评测 | 第47-48页 |
第三节 定位性质状态类基层词的数据准备 | 第48-66页 |
一、提取性质状态类词汇在大规模语料中的词频数据 | 第48-56页 |
(一) 选择义类词典,明确考察对象 | 第48-49页 |
(二) 建立大规模文本语料库 | 第49-50页 |
(三) 依据词形提取词频数据 | 第50页 |
(四) 明确性质状态类基层词涵盖的词性 | 第50-53页 |
(五) 数据修整 | 第53-56页 |
1. 合并同形词频 | 第53-54页 |
2. 做出全部性质状态类词频表 | 第54页 |
3. 查找因同时属不同义类而重复计算词频和的词 | 第54-55页 |
4. 对分属不同义类的词进行词频修正 | 第55-56页 |
5. 将空值更新为“0” | 第56页 |
二、性质状态类词汇的数据特征描写 | 第56-66页 |
(一) 二级范畴 | 第56-57页 |
(二) 三级范畴 | 第57-60页 |
(三) 四级范畴 | 第60-63页 |
(四) 五级范畴 | 第63-66页 |
第四节 定位性质状态类准基层词 | 第66-74页 |
一、搜索同名次级范畴,定位部分准基层词 | 第66-70页 |
(一) 明确从上到下第一个出现完形的层级 | 第66-67页 |
(二) 检索同名次级(五级)范畴 | 第67-68页 |
(三) 定位同名次级(五级)范畴中的最大词频 | 第68-69页 |
(四) 定位同名次级(五级)范畴中的最高频词 | 第69-70页 |
二、搜索最高频次级范畴,定位剩余准基层词 | 第70-72页 |
(一) 定位无同名次级范畴的四级范畴 | 第71-72页 |
(二) 定位最高频次级(五级)范畴 | 第72页 |
(三) 定位最高频次级(五级)范畴中的最高频词 | 第72页 |
三、准基层词初筛结果 | 第72-74页 |
第五节 异常值分析和属性验证 | 第74-81页 |
一、异常值分析 | 第74-80页 |
二、属性验证 | 第80-81页 |
第六节 性质状态类基层词提取结果 | 第81-83页 |
第三章 性质状态类基层词的分级 | 第83-111页 |
第一节 基层词分级的技术路线 | 第83-84页 |
第二节 语用承载量(PL) | 第84-95页 |
一、性质状态类词汇的能产性 | 第85-88页 |
(一) 形式能产性 | 第85-87页 |
(二) 实际能产性 | 第87-88页 |
二、性质状态类基层词的能产性 | 第88-89页 |
三、性质状态类词汇的语用承载量 | 第89-92页 |
(一) 语用承载量与单词频排名差 | 第90-91页 |
(二) 平均语用承载量(APL) | 第91-92页 |
(三) 单词频-语用承载量指数(TFPLR) | 第92页 |
四、性质状态类基层词的语用承载量 | 第92-95页 |
第三节 逆文本频率指数(IDF) | 第95-100页 |
一、逆文本频率指数在基层词分级中的应用 | 第95-96页 |
二、文本分类语料库的构建 | 第96-97页 |
三、基层词逆文本频率指数的计算 | 第97-100页 |
第四节 综合分级指标(SCI) | 第100-108页 |
一、综合分级指标中的变量 | 第100-101页 |
二、综合分级指标的计算公式 | 第101-102页 |
三、数据平滑 | 第102-103页 |
四、综合分级指标的计算结果 | 第103-106页 |
五、基层词的认知函数 | 第106-108页 |
第五节 性质状态类基层词分级结果 | 第108-111页 |
第四章 性质状态类基层词的特征 | 第111-157页 |
第一节 词长与结构类型 | 第111-119页 |
一、词长 | 第111-114页 |
(一) 基层词与非基层词对比 | 第111-112页 |
(二) 基层词与全部词汇对比 | 第112-113页 |
(三) 基层词不同级别间对比 | 第113-114页 |
二、结构类型 | 第114-118页 |
(一) 基层词的结构类型 | 第114-116页 |
(二) 基层词不同级别间结构类型对比 | 第116-118页 |
三、小结 | 第118-119页 |
(一) 词长特征 | 第118页 |
(二) 结构类型特征 | 第118-119页 |
第二节 自信息量与熵 | 第119-127页 |
一、自信息量 | 第119-124页 |
(一) 基层词与非基层词对比 | 第119-122页 |
(二) 基层词与全部词汇对比 | 第122-123页 |
(三) 不同级别基层词对比 | 第123-124页 |
二、熵 | 第124-126页 |
三、小结 | 第126-127页 |
(一) 自信息量特征 | 第126页 |
(二) 熵的特征 | 第126-127页 |
第三节 语用搭配 | 第127-134页 |
一、词汇语用搭配库的建立 | 第127-128页 |
二、提取基层词的语用搭配数据 | 第128-131页 |
(一) 数据修正 | 第128-129页 |
(二) 基层词在前/在后搭配词种数对比 | 第129-130页 |
(三) 基层词在前/在后搭配总次数对比 | 第130-131页 |
三、基于PageRank的基层词语用搭配价值验证 | 第131-134页 |
四、小结 | 第134页 |
第四节 习得顺序 | 第134-149页 |
一、习得顺序研究的出发点和思路 | 第134-135页 |
二、小学生作文语料库的建立 | 第135-142页 |
(一) 选定爬取的目标网站 | 第136-137页 |
(二) 在网络爬虫工具中对目标网站进行相应配置 | 第137-138页 |
(三) 对爬取结果去除网页标签 | 第138-142页 |
(四) 语料分词及入库 | 第142页 |
三、基层词习得顺序数据的提取 | 第142-144页 |
四、基层词习得顺序的数据分析 | 第144-148页 |
(一) 掌握先后分析 | 第144-147页 |
(二) 使用趋势分析 | 第147-148页 |
五、小结 | 第148-149页 |
第五节 词汇源流 | 第149-157页 |
一、词汇源流研究的出发点和思路 | 第149页 |
二、性质状态类词汇历时语用语料库的建立 | 第149-152页 |
(一) 以性质状态类词汇为纲爬取语料 | 第150-151页 |
(二) 调整数据结构并入库 | 第151-152页 |
三、基层词历时语用数据的提取与分析 | 第152-156页 |
(一) 发源先后分析 | 第152-154页 |
(二) 使用趋势分析 | 第154-156页 |
四、小结 | 第156-157页 |
第五章 总结与展望 | 第157-161页 |
第一节 研究总结 | 第157-158页 |
第二节 应用展望 | 第158-161页 |
一、汉语词汇教学 | 第158页 |
二、工具书编纂 | 第158-159页 |
三、教材编写及语言测试 | 第159-160页 |
四、语言学基础研究 | 第160-161页 |
参考文献 | 第161-169页 |
附录 | 第169-221页 |
致谢 | 第221-223页 |
攻读学位期间发表的学术论文目录 | 第223页 |