首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--专用应用软件论文

Web新闻专题组织与生成系统研究

摘要第1-5页
ABSTRACT第5-10页
第一章 绪论第10-17页
   ·研究背景第10-11页
   ·相关工作第11-16页
     ·文本聚类第12-13页
     ·信息检索第13-14页
     ·主题检测与追踪第14-15页
     ·专题来龙去脉生成第15-16页
   ·论文研究内容与结构安排第16-17页
第二章 Web新闻专题组织与生成系统组成第17-25页
   ·Web新闻专题组织与生成系统的基本原理和意义第17-18页
   ·Web新闻专题组织与生成系统的基本结构第18-22页
     ·部分Web新闻信息采集第18页
     ·Web新闻主题内容提取第18-19页
     ·文本表示与特征提取第19页
     ·新闻主题检测第19-21页
     ·新闻主题追踪第21页
     ·新闻专题来龙去脉生成第21-22页
   ·Web新闻专题生成面临的技术困难和相应手段第22-23页
   ·本系统的技术特点第23-25页
第三章 Web新闻信息采集与内容提取第25-40页
   ·Web新闻信息采集方法设计第25-29页
     ·URL队列第25-26页
     ·URL处理器第26页
     ·网页采集器第26-27页
     ·网页去重检测器第27页
     ·URL提取器第27-28页
     ·标签信息提取器第28页
     ·网页类型判断第28-29页
     ·数据库第29页
   ·Web新闻信息采集器的实现过程第29-32页
     ·本采集器的设计关键点第29-31页
     ·Web新闻采集器的实现流程第31-32页
   ·网页主题内容提取第32-36页
     ·新闻网页及噪声分类第32-34页
     ·基于向量空间模型的网页噪声净化第34-36页
   ·实验结果及性能分析第36-39页
     ·Web信息采集效率第37-38页
     ·噪声消除的彻底性第38页
     ·提取内容的完整性第38-39页
     ·噪声消除的效率第39页
   ·本章小结第39-40页
第四章 基于自适应重心的新闻主题检测第40-51页
   ·主题检测的基本原理第40-41页
   ·新闻主题的表示第41-43页
     ·新闻主题的特征项第41页
     ·新闻主题特征项的权重第41页
     ·特征维数约减第41-42页
     ·新闻主题的表示第42-43页
   ·主题检测算法第43-46页
     ·增量式聚类算法第43-44页
     ·主题重心的修正第44-45页
     ·主题重心的组合第45-46页
     ·基于主题重心自适应的主题检测方法第46页
   ·实验结果及性能分析第46-50页
     ·实验数据第46-47页
     ·实验结果评测标准第47-48页
     ·软件实现结果第48-49页
     ·实验结果及性能分析第49-50页
   ·本章小结第50-51页
第五章 基于LS-SVM的新闻主题追踪第51-60页
   ·LSI模型第51-54页
     ·隐含语义分析第51-53页
     ·词-文档矩阵表示第53页
     ·奇异值分解第53-54页
   ·支持向量机(SVM)第54-56页
   ·基于 LS-SVM的新闻主题追踪方法第56-58页
   ·实验结果与性能分析第58-59页
     ·实验数据及评价标准第58页
     ·实验结果与性能比较第58-59页
   ·本章小结第59-60页
第六章 基于NS-IMMC的新闻专题来龙去脉生成第60-73页
   ·多文档自动摘要基础第60-63页
     ·自动摘要的定义和分类第60页
     ·多文档自动摘要的定义和分类第60-61页
     ·多文档文摘与其他自然语言处理的关系第61-62页
     ·评价方法第62-63页
   ·新闻文档结构特点(NS)第63-64页
   ·最小最大聚类算法第64-67页
     ·最小最大聚类原理第64-65页
     ·改进的最小最大聚类算法(IMMC)第65-67页
   ·基于NS-IMMC的新闻专题来龙去脉生成方法第67-69页
   ·实验结果与性能分析第69-72页
   ·本章小结第72-73页
第七章 系统的实现与总结第73-77页
   ·系统总体功能及框架结构第73-74页
   ·新闻专题组织与生成系统实例及结果第74-75页
   ·全文总结第75-76页
   ·展望第76-77页
参考文献第77-83页
致谢第83-84页
作者攻读硕士学位期间的主要研究成果第84页

论文共84页,点击 下载论文
上一篇:基于消息队列的工作流引擎及容错设计
下一篇:基于MarKov链的Web访问序列挖掘算法研究