首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于潜在语义分析的标题党新闻识别技术研究

摘要第1-6页
Abstract第6-8页
目录第8-11页
第1章 引言第11-18页
   ·研究的背景第11-13页
   ·研究的现状第13-14页
   ·课题研究的目的与意义第14-15页
   ·论文研究的主要内容与贡献第15-17页
   ·论文的章节组织第17-18页
第2章 相关知识介绍第18-22页
   ·网页去噪工作原理第18-19页
   ·向量空间模型第19-20页
   ·矩阵的奇异值分解第20-21页
   ·本章小结第21-22页
第3章 系统关键技术研究第22-47页
   ·基于HTTP的新闻网页下载技术第22-27页
     ·网页下载技术第22-24页
     ·网页信息抽取技术第24-27页
   ·基于行块分布算法的网页正文抽取技术第27-34页
     ·行块分布算法基本思想第27-28页
     ·行块分布算法实例分析第28-34页
   ·基于正向最大匹配算法的分词技术第34-37页
     ·正向最大匹配算法基本思想第34-35页
     ·分词算法实例分析第35-37页
   ·向量空间模型的构建第37-40页
     ·词-段落矩阵构建第38页
     ·向量空间模型构建实例分析第38-40页
   ·基于SVD的塌陷矩阵构建技术第40-43页
     ·塌陷奇异分解基本思想第40-41页
     ·塌陷矩阵构建实例分析第41-43页
   ·基于LSA算法的标题党新闻判定技术第43-46页
     ·潜在相关度计算第43-44页
     ·基于LSA的标题党新闻判定第44-46页
   ·本章小结第46-47页
第4章 系统设计与实现第47-59页
   ·系统设计第47-49页
     ·系统工作流程第47-48页
     ·系统功能结构第48-49页
     ·系统业务逻辑第49页
   ·数据库表结构设计第49-50页
   ·系统各功能模块设计与实现第50-58页
     ·目标网址列表信息读取模块第50-52页
     ·网页下载模块第52-54页
     ·新闻信息抽取模块第54页
     ·分词处理模块第54-56页
     ·向量空间模型构建模块第56页
     ·塌陷矩阵构建模块第56-57页
     ·潜在相关度计算模块第57页
     ·标题党新闻判定模块第57-58页
   ·本章小结第58-59页
第5章 实验结果与分析第59-64页
   ·实验环境介绍第59页
   ·向量空间模型构建实验第59-60页
   ·塌陷矩阵构建实验第60-61页
   ·潜在相关度计算实验第61页
   ·标题党新闻识别实验第61-62页
   ·实验数据综合分析第62-63页
   ·本章小结第63-64页
第6章 总结与展望第64-67页
   ·本文总结第64-65页
   ·本文展望第65-67页
参考文献第67-71页
致谢第71-72页
附录第7页

论文共72页,点击 下载论文
上一篇:食品药品监管系统财务资源配置的差异及效率评价
下一篇:基于差分演化算法的图像聚类研究