基于统计与语法分析的关键词提取
中文摘要 | 第1-6页 |
ABSTRACT | 第6-10页 |
第一章 绪论 | 第10-13页 |
·课题的提出 | 第10页 |
·本文研究意义 | 第10-11页 |
·本文研究内容 | 第11页 |
·本文创新之处 | 第11-12页 |
·章节安排 | 第12-13页 |
第二章 关键词提取的研究综述 | 第13-19页 |
·关键词提取的重要性 | 第13页 |
·关键词的定义、识别、提取 | 第13-14页 |
·中文关键词自动提取技术与其它技术相结合 | 第14-15页 |
·信息检索系统 | 第14页 |
·信息反馈系统 | 第14页 |
·网络信息过滤、提取系统 | 第14-15页 |
·文本库的建立与重建 | 第15页 |
·数字化图书馆管理 | 第15页 |
·关键词识别提取的算法 | 第15-19页 |
·经典算法 | 第15-18页 |
·本文提出的分词改进算法 | 第18-19页 |
第三章 中文自动分词 | 第19-30页 |
·中文自动分词技术综述 | 第19-22页 |
·自动分词 | 第19-20页 |
·关于分词歧义 | 第20-21页 |
·中文自动分词经典算法 | 第21-22页 |
·I CTCLAS 中科院分词算法及提出改进算法 | 第22-30页 |
·ICTCLAS 中科院分词系统 | 第22页 |
·HMM 模型及相关理论 | 第22-23页 |
·基于隐马尔可夫模型提出 HHMM 模型 | 第23-25页 |
·基于 N-最短路径方法的中文词语粗分算法 | 第25-28页 |
·分词算法的改进 | 第28-30页 |
第四章 基于语法功能匹配的汉语句法分析 | 第30-48页 |
·形式语法描述 | 第30页 |
·短语结构语法与乔姆斯基层次体系 | 第30-33页 |
·短语结构语法 | 第30-32页 |
·乔姆斯基层次体系 | 第32-33页 |
·语法分析概要 | 第33-35页 |
·基于规则的方法 | 第33-34页 |
·基于统计的方法 | 第34页 |
·基于统计和规则相结合的方法 | 第34-35页 |
·句法分析算法 | 第35-38页 |
·句法分析概述 | 第35-36页 |
·Chart 算法 | 第36-38页 |
·树库 | 第38-41页 |
·树库定义 | 第38-39页 |
·树库的构造 | 第39-41页 |
·宾夕法尼亚大学的 Penn 树库 | 第41-48页 |
第五章 关键词提取算法 | 第48-55页 |
·关键词算法 | 第48-51页 |
·词频特征值 | 第48页 |
·位置特征值 | 第48页 |
·词性特征值 | 第48-49页 |
·词跨度特征值 | 第49页 |
·new 短语或者词特征值 | 第49页 |
·Headword 短语或者词特征值 | 第49-51页 |
·实验测试与分析 | 第51-55页 |
·实验环境、过程与语料 | 第51页 |
·评测标准 | 第51-52页 |
·系数调整 | 第52页 |
·实验结果 | 第52-55页 |
第六章 结束语与展望未来 | 第55-56页 |
·结束语 | 第55页 |
·展望未来 | 第55-56页 |
参考文献 | 第56-59页 |
附录 A 树库功能对照表 | 第59-62页 |
攻读硕士学位期间发表学术论文情况 | 第62-63页 |
致谢 | 第63-64页 |
作者简介 | 第64-65页 |