首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

网页自动分类和存储管理系统的设计与实现

摘要第1-5页
ABSTRACT第5-9页
第一章 绪论第9-13页
     ·课题研究的背景和意义第9页
     ·课题研究的发展现状第9-11页
       ·文本自动分类的研究现状第9-10页
       ·网页自动分类的研究现状第10-11页
     ·本文的研究内容和组织结构第11-13页
第二章 网页自动分类和存储管理系统的功能分析第13-19页
     ·网页分类概述第13-14页
     ·系统要求第14页
     ·系统功能分析第14-18页
     ·本章小结第18-19页
第三章 网页收集和预处理模块的设计与实现第19-36页
     ·网页收集器的设计与实现第19-22页
       ·网页收集器设计第19-20页
       ·网页收集器实现第20-22页
     ·网页预处理模块的设计与实现第22-35页
       ·文本表示模型选择第23-25页
       ·网页信息提取第25-30页
       ·网页文本分析第30-35页
     ·本章小结第35-36页
第四章 网页特征提取和分类模块的设计与实现第36-46页
     ·特征提取的工作原理第36页
     ·常用的特征提取算法第36-40页
       ·文档频率(Document Frequency)第37页
       ·特征频率(Term Frequency)第37页
       ·特征熵(Term Entropy)第37-38页
       ·信息增益(Information Gain)第38页
       ·互信息(Mutual Information)第38-39页
       ·χ~2统计法(Chi-square,CHI)第39-40页
       ·特征提取算法的比较第40页
     ·特征提取模块的设计与实现第40-44页
       ·特征提取过程第42页
       ·改进的特征权重计算第42-44页
     ·网页分类模块的设计与实现第44-45页
     ·本章小结第45-46页
第五章 网页分类存储和查询模块的设计与实现第46-63页
     ·增量存储和反馈查询技术第46页
     ·基于嵌套FSM的URL解析方法第46-57页
       ·URL解析概述第47页
       ·FSM有限状态自动机第47-49页
       ·方法设计和实现第49-52页
       ·方法流程分析第52-55页
       ·与现存方法的比较第55-57页
     ·存储模块的设计与实现第57-61页
     ·查询模块的设计与实现第61-62页
     ·本章小结第62-63页
第六章 网页自动分类和存储管理系统的测试第63-67页
     ·测试环境设置第63页
     ·测试评价标准第63-64页
     ·测试及结果分析第64-66页
     ·本章小结第66-67页
第七章 结论第67-69页
参考文献第69-73页
致谢第73-74页
发表论文目录第74页

论文共74页,点击 下载论文
上一篇:基于机器学习的P2P流量识别
下一篇:综合网管故障管理系统设计与实现