基于信息抽取技术的博客知识发现研究
| 摘要 | 第1-6页 |
| Abstract | 第6-8页 |
| 1 引言 | 第8-13页 |
| ·论文的研究背景和研究意义 | 第8-9页 |
| ·论文的研究内容 | 第9-11页 |
| ·论文的主要工作 | 第11-12页 |
| ·论文的内容组织 | 第12-13页 |
| 2 相关概念 | 第13-25页 |
| ·信息抽取技术 | 第13-16页 |
| ·信息抽取技术的发展 | 第13页 |
| ·信息抽取技术处理的对象 | 第13-14页 |
| ·信息抽取系统设计常用方法 | 第14-15页 |
| ·信息抽取系统的三种主要模型 | 第15-16页 |
| ·自然语言处理技术 | 第16-22页 |
| ·自然语言处理技术概述 | 第16-17页 |
| ·自然语言处理技术的理论与方法 | 第17-20页 |
| ·自然语言处理技术的实现 | 第20-22页 |
| ·隐马尔可夫模型 | 第22-25页 |
| ·隐马尔可夫模型的三个主要问题 | 第22-23页 |
| ·隐马尔可夫模型的主要算法 | 第23-25页 |
| ·评估问题的解决算法 | 第23页 |
| ·学习问题的解决算法 | 第23-24页 |
| ·解码问题的解决算法 | 第24-25页 |
| 3 博客热点主题发现 | 第25-44页 |
| ·系统的总体设计 | 第25页 |
| ·主题判定 | 第25-36页 |
| ·构造候选词集 | 第26-28页 |
| ·构造共现矩阵 | 第28-31页 |
| ·关键词选取 | 第31-34页 |
| ·具体算法 | 第34页 |
| ·实验与讨论 | 第34-36页 |
| ·评价标准 | 第34-35页 |
| ·主题判定实验结果与分析 | 第35-36页 |
| ·热点主题发现 | 第36-43页 |
| ·建立主题分布概率模型 | 第36-38页 |
| ·确定主题趋势改变因子 | 第38-39页 |
| ·热点主题发现 | 第39-40页 |
| ·具体算法 | 第40页 |
| ·热点主题发现实验结果与分析 | 第40-43页 |
| ·本章小结 | 第43-44页 |
| 4 博客中基于主题的人物关联网络构建 | 第44-56页 |
| ·系统总体设计 | 第44页 |
| ·人名识别 | 第44-50页 |
| ·构建侯选人名集 | 第45-46页 |
| ·使用启发式规则进行人名抽取 | 第46-47页 |
| ·使用隐马尔可夫模型进行人名抽取 | 第47-50页 |
| ·人名抽取实验结果与分析 | 第50页 |
| ·基于热点主题构建人物关联网络 | 第50-55页 |
| ·人物关联可信度判定 | 第51-53页 |
| ·人物关联网络构建算法 | 第53-54页 |
| ·实验结果与分析 | 第54-55页 |
| ·本章小结 | 第55-56页 |
| 5 展望及结束语 | 第56-58页 |
| ·本文工作总结 | 第56-57页 |
| ·未来工作展望 | 第57-58页 |
| 参考文献 | 第58-65页 |
| 攻读硕士学位期间发表的学术论文目录 | 第65-66页 |
| 攻读硕士学位期间参加的科研项目 | 第66-67页 |
| 致谢 | 第67页 |