| 致谢 | 第1-6页 |
| 摘要 | 第6-7页 |
| ABSTRACT | 第7-10页 |
| 1 概述 | 第10-13页 |
| ·课题研究的背景和意义 | 第10页 |
| ·国内外现状综述 | 第10-11页 |
| ·论文的主要内容和组织结构 | 第11-13页 |
| ·论文的主要内容 | 第11页 |
| ·论文的组织结构 | 第11-13页 |
| 2 相关技术的研究与论证 | 第13-24页 |
| ·文本挖掘技术 | 第13-16页 |
| ·文本挖掘技术概述 | 第13-14页 |
| ·文本挖掘的分类 | 第14-16页 |
| ·文本聚类技术 | 第16-20页 |
| ·文本聚类技术概述 | 第16-17页 |
| ·文本聚类技术的研究意义和应用 | 第17-19页 |
| ·文本聚类结果的评价 | 第19-20页 |
| ·SGML文档结构描述置标语言 | 第20-21页 |
| ·TF-IDF算法 | 第21页 |
| ·中文分词算法简介 | 第21-24页 |
| 3 基于事件词和参考链的Web新闻事件聚类方法 | 第24-36页 |
| ·基于事件词和参考链的新闻事件聚类流程 | 第24-25页 |
| ·使用选取控制词方法选取参考链 | 第25-32页 |
| ·一般参考链的选取 | 第25-27页 |
| ·一般参考链选取中的问题 | 第27-29页 |
| ·使用控制词获取参考链 | 第29-32页 |
| ·使用参考链生成摘要 | 第32页 |
| ·选取事件词 | 第32-34页 |
| ·进行新闻事件聚类 | 第34页 |
| ·组合使用参考链和事件词进行新闻事件聚类 | 第34-36页 |
| ·同比重组合事件词和参考链进行新闻事件聚类 | 第35页 |
| ·不同比重组合事件词和参考链进行新闻事件聚类 | 第35-36页 |
| 4 实验结果以及结论 | 第36-60页 |
| ·实验使用的操作系统及软硬件工具 | 第36页 |
| ·实验数据 | 第36-38页 |
| ·使用参考链方法进行新闻事件聚类的实验结果 | 第38-56页 |
| ·使用固定阈值进行新闻事件聚类的实验结果 | 第55页 |
| ·使用动态阈值进行新闻事件聚类的实验结果 | 第55-56页 |
| ·使用不同时间跨度进行新闻事件聚类的实验结果 | 第56页 |
| ·使用事件词进行新闻事件聚类的实验结果 | 第56-57页 |
| ·组合使用事件词和参考链进行新闻事件聚类的实验结果 | 第57-58页 |
| ·同比重组合事件词和参考链进行新闻事件聚类实验结果 | 第57页 |
| ·不同比重组合事件词和参考链进行新闻事件聚类实验结果 | 第57-58页 |
| ·实验结果分析 | 第58-60页 |
| 5 结束语 | 第60-61页 |
| ·总结 | 第60页 |
| ·进一步工作展望 | 第60-61页 |
| 参考文献 | 第61-63页 |
| 作者简介 | 第63-65页 |
| 学位论文数据集 | 第65页 |