首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

面向领域的Web文本采集与分类

摘要第1-4页
ABSTRACT第4-8页
1 绪论第8-14页
   ·研究背景及意义第8-9页
   ·国内外研究现状第9-12页
   ·论文研究的主要内容第12-13页
   ·论文组织结构第13-14页
2 机械主题爬虫方案设计第14-50页
   ·机械主题爬虫总体设计第14-19页
     ·网页采集相关理论与技术第14-17页
     ·总体设计方案第17-19页
   ·主题确立及初始URL第19-29页
     ·预处理和主题的向量空间表示模型第19-25页
     ·主题描述方法第25-28页
     ·初始种子URL筛选第28-29页
   ·网页解析与下载第29-39页
     ·HTML语法分析第29-30页
     ·页面下载与链接提取第30-35页
     ·网页正文提取方法第35-38页
     ·礼貌采集第38-39页
   ·主题相关性分析第39-41页
   ·主题搜索策略第41-47页
     ·常见主题爬虫搜索策略第41-44页
     ·PageRank算法第44-46页
     ·综合价值评价主题搜索算法第46-47页
   ·机械主题爬虫系统实验及结果评价第47-50页
3 机械领域文本分类研究第50-60页
   ·领域文本分类的特点第50-51页
   ·机械产品类别信息第51-52页
   ·基于机器学习的文本分类流程第52-54页
   ·常用文本分类算法第54-56页
   ·基于KNN的机械文本分类算法第56-60页
     ·算法描述第56页
     ·实验结果与分析第56-60页
4 机械领域 Web 文本采集与挖掘原型系统第60-68页
   ·面向领域 Web 文本信息采集与挖掘系统模型第60-61页
   ·系统设计目标第61-62页
   ·开发与运行环境第62页
   ·系统功能介绍第62-67页
     ·主题爬虫模块第63-64页
     ·文本挖掘模块第64-67页
   ·本章小结第67-68页
5 结语第68-70页
   ·总结第68页
   ·进一步研究工作第68-70页
致谢第70-71页
参考文献第71-74页
攻读硕士学位期间发表的论文第74-75页
硕士学位期间参与的科研项目第75页

论文共75页,点击 下载论文
上一篇:视频编码在数字监控系统中的应用研究
下一篇:图像尺寸变换的算法研究