| 摘要 | 第1-7页 |
| Abstract | 第7-12页 |
| 第一章 绪论 | 第12-22页 |
| ·本文动因 | 第12-14页 |
| ·本文对固定短语的界定 | 第14-16页 |
| ·研究目标 | 第16页 |
| ·研究内容和研究重点 | 第16-18页 |
| ·本研究的意义 | 第18-20页 |
| ·本研究方法在中文信息处理领域的意义 | 第18页 |
| ·本研究方法在语言资源监测领域的意义 | 第18-19页 |
| ·本研究方法在汉语语言学领域的意义 | 第19页 |
| ·本研究方法在词典编纂领域的意义 | 第19-20页 |
| ·本研究方法在对外汉语教学领域的意义 | 第20页 |
| ·本研究方法在舆情分析领域的意义 | 第20页 |
| ·研究特色 | 第20-22页 |
| 第二章 短语提取相关研究综述 | 第22-33页 |
| ·国内语言学界对固定短语的定义和研究方法 | 第22-23页 |
| ·国内语言学界对固定短语的定义 | 第22页 |
| ·语言学界对固定短语的研究方法和手段 | 第22-23页 |
| ·信息处理界对短语的研究综述 | 第23-28页 |
| ·国内外关于短语识别的基本方法 | 第23-24页 |
| ·术语提取基本方法和技术 | 第24-25页 |
| ·国内对于短语研究所做的重要的工作 | 第25-27页 |
| ·搭配的度量指标——搭配强度、搭配离散度、搭配尖峰 | 第27-28页 |
| ·国外短语提取的最新进展 | 第28-33页 |
| ·多字词表达的定义 | 第28-29页 |
| ·多字词表达一般概述 | 第29页 |
| ·多字词表达的复杂特性 | 第29-31页 |
| ·多字词表达的提取 | 第31页 |
| ·多字词表达研究的代表性工作 | 第31-33页 |
| 第三章 固定短语提取的基础平台 | 第33-40页 |
| ·基础数据资源——DCC语料库 | 第33-36页 |
| ·语料库和语料库语言学 | 第33-34页 |
| ·动态知识更新理论与动态流通语料库 | 第34-35页 |
| ·基于动态流通语料库的主要研究 | 第35-36页 |
| ·本文研究所用工具简介 | 第36-37页 |
| ·基础数据资源加工——语料的准备和预处理 | 第37-40页 |
| ·语料的选择标准 | 第37页 |
| ·语料库的存储模式 | 第37-38页 |
| ·语料库的语料量 | 第38页 |
| ·原始语料格式转换 | 第38页 |
| ·文本分类 | 第38-39页 |
| ·文本分词 | 第39-40页 |
| 第四章 利用特定领域的高频种子词提取固定短语候选串 | 第40-50页 |
| ·教育领域高频种子词提取 | 第40-44页 |
| ·面向特定领域的固定短语提取长度的确定 | 第44-49页 |
| ·已有的研究成果 | 第45页 |
| ·实验步骤和实验数据 | 第45页 |
| ·实验结果及分析 | 第45-49页 |
| ·结论 | 第49页 |
| ·固定短语候选串提取 | 第49-50页 |
| 第五章 固定短语候选串的定量考察与分析 | 第50-64页 |
| ·“结合紧密”和搭配的关系 | 第50页 |
| ·搭配研究综述 | 第50-54页 |
| ·国外搭配研究综述 | 第50-51页 |
| ·国内语言学界对搭配的研究 | 第51-53页 |
| ·国内外语界对搭配的研究 | 第53-54页 |
| ·国内计算语言学界对搭配的研究 | 第54页 |
| ·本文对“结合紧密”的搭配从统计量角度的分析 | 第54-57页 |
| ·互信息和熵简介 | 第54-56页 |
| ·互信息和熵的计算 | 第56-57页 |
| ·互信息和熵的计算结果 | 第57页 |
| ·按照频次、互信息结合的方法提取两个切分单位固定短语候选串 | 第57-61页 |
| ·实验方法 | 第57-58页 |
| ·实验结果及分析 | 第58-61页 |
| ·对“v+n”的考察 | 第61页 |
| ·利用频次、互信息、熵值结合的方法提取固定短语候选串 | 第61-64页 |
| ·实验方法 | 第61-62页 |
| ·实验结果 | 第62-63页 |
| ·数据分析 | 第63-64页 |
| 第六章 固定短语候选串的句法角度考察及分析 | 第64-78页 |
| ·固定短语候选串从定量到定性分析 | 第64-65页 |
| ·句法角度考察 | 第65-69页 |
| ·类联接简介 | 第66-67页 |
| ·本文对类联接的定义 | 第67页 |
| ·本文的类联接类型 | 第67-69页 |
| ·类联接模式对固定短语候选串的提取 | 第69-70页 |
| ·实验方法 | 第69-70页 |
| ·实验结果 | 第70页 |
| ·数据分析 | 第70-78页 |
| ·类联接“a+n”候选串分析 | 第70-71页 |
| ·类联接“n+n”候选串分析 | 第71-72页 |
| ·类联接“v+n”候选串分析 | 第72-74页 |
| ·类联接“n+v”候选串分析 | 第74-75页 |
| ·类联接“v+v”候选串分析 | 第75-78页 |
| 第七章 基于语义的方法对固定短语候选串的考察 | 第78-97页 |
| ·搭配与语义的相互关系 | 第78-80页 |
| ·语义对搭配的制约 | 第78页 |
| ·搭配的语义基础 | 第78-79页 |
| ·搭配决定语义 | 第79页 |
| ·国内研究综述 | 第79-80页 |
| ·知网简介 | 第80-82页 |
| ·知网的结构 | 第80-81页 |
| ·知网对词的描述 | 第81页 |
| ·知网的信息结构规则 | 第81-82页 |
| ·基于知网的考察和过滤 | 第82页 |
| ·基于知网的考察实验 | 第82-97页 |
| ·实验方法 | 第82页 |
| ·实验数据 | 第82-83页 |
| ·实验分析过程 | 第83-97页 |
| 第八章 固定短语候选串的历时考察 | 第97-116页 |
| ·历时中包含有共时和共时中包含有历时的相对时间观 | 第97-98页 |
| ·索绪尔的时间观 | 第97-98页 |
| ·历时中包含有共时和共时中包含有历时的相对时间观 | 第98页 |
| ·时点和时段的相对性 | 第98-100页 |
| ·历时考察相关研究工作 | 第100-116页 |
| ·语料数据 | 第100页 |
| ·历时考察对象 | 第100-111页 |
| ·历时考察方法 | 第111页 |
| ·数据分析 | 第111-116页 |
| 第九章 结语 | 第116-118页 |
| ·全文总结 | 第116-117页 |
| ·进一步的工作 | 第117-118页 |
| 参考文献 | 第118-123页 |
| 专著类 | 第118-119页 |
| 论文类 | 第119-122页 |
| 其他资料 | 第122-123页 |
| 附录 | 第123-133页 |
| 附表1. 位序比法提取的教育领域高频词(按频次降序排序前一百) | 第123-125页 |
| 附表2. 左熵排序(按左熵降序排序前一百) | 第125-128页 |
| 附表3. 右熵排序(按右熵降序排序前一百) | 第128-130页 |
| 附表4. “v+n”互信息排序前100(按互信息降序排序前一百) | 第130-133页 |
| 科研成果 | 第133-134页 |
| 致谢 | 第134页 |