致谢 | 第1-6页 |
摘要 | 第6-7页 |
ABSTRACT | 第7-10页 |
1 概述 | 第10-13页 |
·课题研究的背景和意义 | 第10页 |
·国内外现状综述 | 第10-11页 |
·论文的主要内容和组织结构 | 第11-13页 |
·论文的主要内容 | 第11页 |
·论文的组织结构 | 第11-13页 |
2 相关技术的研究与论证 | 第13-24页 |
·文本挖掘技术 | 第13-16页 |
·文本挖掘技术概述 | 第13-14页 |
·文本挖掘的分类 | 第14-16页 |
·文本聚类技术 | 第16-20页 |
·文本聚类技术概述 | 第16-17页 |
·文本聚类技术的研究意义和应用 | 第17-19页 |
·文本聚类结果的评价 | 第19-20页 |
·SGML文档结构描述置标语言 | 第20-21页 |
·TF-IDF算法 | 第21页 |
·中文分词算法简介 | 第21-24页 |
3 基于事件词和参考链的Web新闻事件聚类方法 | 第24-36页 |
·基于事件词和参考链的新闻事件聚类流程 | 第24-25页 |
·使用选取控制词方法选取参考链 | 第25-32页 |
·一般参考链的选取 | 第25-27页 |
·一般参考链选取中的问题 | 第27-29页 |
·使用控制词获取参考链 | 第29-32页 |
·使用参考链生成摘要 | 第32页 |
·选取事件词 | 第32-34页 |
·进行新闻事件聚类 | 第34页 |
·组合使用参考链和事件词进行新闻事件聚类 | 第34-36页 |
·同比重组合事件词和参考链进行新闻事件聚类 | 第35页 |
·不同比重组合事件词和参考链进行新闻事件聚类 | 第35-36页 |
4 实验结果以及结论 | 第36-60页 |
·实验使用的操作系统及软硬件工具 | 第36页 |
·实验数据 | 第36-38页 |
·使用参考链方法进行新闻事件聚类的实验结果 | 第38-56页 |
·使用固定阈值进行新闻事件聚类的实验结果 | 第55页 |
·使用动态阈值进行新闻事件聚类的实验结果 | 第55-56页 |
·使用不同时间跨度进行新闻事件聚类的实验结果 | 第56页 |
·使用事件词进行新闻事件聚类的实验结果 | 第56-57页 |
·组合使用事件词和参考链进行新闻事件聚类的实验结果 | 第57-58页 |
·同比重组合事件词和参考链进行新闻事件聚类实验结果 | 第57页 |
·不同比重组合事件词和参考链进行新闻事件聚类实验结果 | 第57-58页 |
·实验结果分析 | 第58-60页 |
5 结束语 | 第60-61页 |
·总结 | 第60页 |
·进一步工作展望 | 第60-61页 |
参考文献 | 第61-63页 |
作者简介 | 第63-65页 |
学位论文数据集 | 第65页 |