基于潜在语义分析的标题党新闻识别技术研究

摘要	第1-6页
Abstract	第6-8页
目录	第8-11页
第1章引言	第11-18页
·研究的背景	第11-13页
·研究的现状	第13-14页
·课题研究的目的与意义	第14-15页
·论文研究的主要内容与贡献	第15-17页
·论文的章节组织	第17-18页
第2章相关知识介绍	第18-22页
·网页去噪工作原理	第18-19页
·向量空间模型	第19-20页
·矩阵的奇异值分解	第20-21页
·本章小结	第21-22页
第3章系统关键技术研究	第22-47页
·基于HTTP的新闻网页下载技术	第22-27页
·网页下载技术	第22-24页
·网页信息抽取技术	第24-27页
·基于行块分布算法的网页正文抽取技术	第27-34页
·行块分布算法基本思想	第27-28页
·行块分布算法实例分析	第28-34页
·基于正向最大匹配算法的分词技术	第34-37页
·正向最大匹配算法基本思想	第34-35页
·分词算法实例分析	第35-37页
·向量空间模型的构建	第37-40页
·词-段落矩阵构建	第38页
·向量空间模型构建实例分析	第38-40页
·基于SVD的塌陷矩阵构建技术	第40-43页
·塌陷奇异分解基本思想	第40-41页
·塌陷矩阵构建实例分析	第41-43页
·基于LSA算法的标题党新闻判定技术	第43-46页
·潜在相关度计算	第43-44页
·基于LSA的标题党新闻判定	第44-46页
·本章小结	第46-47页
第4章系统设计与实现	第47-59页
·系统设计	第47-49页
·系统工作流程	第47-48页
·系统功能结构	第48-49页
·系统业务逻辑	第49页
·数据库表结构设计	第49-50页
·系统各功能模块设计与实现	第50-58页
·目标网址列表信息读取模块	第50-52页
·网页下载模块	第52-54页
·新闻信息抽取模块	第54页
·分词处理模块	第54-56页
·向量空间模型构建模块	第56页
·塌陷矩阵构建模块	第56-57页
·潜在相关度计算模块	第57页
·标题党新闻判定模块	第57-58页
·本章小结	第58-59页
第5章实验结果与分析	第59-64页
·实验环境介绍	第59页
·向量空间模型构建实验	第59-60页
·塌陷矩阵构建实验	第60-61页
·潜在相关度计算实验	第61页
·标题党新闻识别实验	第61-62页
·实验数据综合分析	第62-63页
·本章小结	第63-64页
第6章总结与展望	第64-67页
·本文总结	第64-65页
·本文展望	第65-67页
参考文献	第67-71页
致谢	第71-72页
附录	第7页