首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

主题网络爬虫关键技术的研究与应用

摘要第1-6页
Abstract第6-10页
第1章 绪论第10-16页
   ·研究背景与意义第10-11页
   ·国内外研究现状第11-14页
     ·国外研究现状第12-13页
     ·国内研究现状第13-14页
   ·研究中的主要问题第14页
   ·本文组织结构第14-16页
第2章 主题爬虫模型第16-27页
   ·主题爬虫系统框架第17-18页
   ·页面下载模块第18-19页
   ·正文提取模块第19-23页
   ·主题判别模块第23-26页
     ·向量空间模型第24页
     ·常用分类算法第24-26页
   ·本章小结第26-27页
第3章 基于改进贝叶斯分类器的主题判别算法第27-39页
   ·朴素贝叶斯分类第27-28页
   ·特征降维第28-31页
   ·文本关键词自动提取第31-36页
     ·语义加权网络第31-32页
     ·词语重要性度量第32-34页
     ·关键词提取算法第34-36页
   ·改进贝叶斯分类器判别主题第36-37页
   ·实验分析第37-38页
   ·本章小结第38-39页
第4章 主题搜索策略研究第39-48页
   ·Web 链接和页面分布特性第39-41页
     ·链接构成分析第39页
     ·主题页面分布特性第39-41页
   ·通用搜索策略第41-42页
   ·常用主题搜索策略第42-44页
     ·基于内容评价的搜索策略第42-43页
     ·基于链接结构评价的搜索策略第43-44页
   ·改进的 Best-First 搜索策略第44-47页
   ·本章小结第47-48页
第5章 主题爬虫系统设计与实现第48-58页
   ·主题爬虫系统实现第48-51页
     ·软硬件环境第48页
     ·系统实现结构第48-49页
     ·系统工作流程第49-51页
   ·正文提取模块测试第51-52页
     ·单一页面测试第51-52页
     ·准确率测试第52页
   ·关键词提取模块测试第52-54页
     ·单文本测试第52-53页
     ·准确率测试第53-54页
   ·主题判别模块测试第54-56页
     ·基于类别关键词的贝叶斯分类算法搜索效率测试第54-55页
     ·类别关键词比例λ的设置第55-56页
   ·改进的搜索策略测试第56-57页
   ·本章小结第57-58页
结论第58-60页
参考文献第60-64页
攻读硕士期间发表论文与研究成果清单第64-65页
致谢第65页

论文共65页,点击 下载论文
上一篇:基于LDA主题模型的文档文摘研究
下一篇:基于可控核回归和结构张量的加权梯度算法在图像融合中的应用