首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

网络新闻分类系统及个性化新闻网站的研究与应用

摘要第1-4页
Abstract第4-8页
第一章 引言第8-11页
   ·研究的目的和意义第8页
   ·国内外研究现状第8-10页
     ·Web 文本挖掘技术现状第8-9页
     ·网站架构技术现状第9-10页
   ·研究的内容第10页
   ·本文的组织结构第10-11页
第二章 WEB 挖掘相关技术第11-20页
   ·自然语言理解的基本概念第11-12页
     ·什么是自然语言第11页
     ·什么是自然语言理解第11页
     ·关于理解第11-12页
     ·自然语言理解的困难度第12页
   ·网页信息抽取技术第12页
   ·LUCENE 全文检索系统介绍第12-13页
   ·文本分词第13-14页
   ·文本的表示方法第14-16页
     ·向量空间相关知识第14-15页
     ·文本表示模型第15-16页
   ·特征项的抽取第16页
   ·文本分类相关概念第16-17页
   ·文本分类算法第17-20页
     ·简单向量距离分类法第18页
     ·贝叶斯算法第18-20页
第三章 WEB 架构介绍第20-26页
   ·设计模式第20-23页
     ·设计模式概述第20页
     ·相关设计模式简介第20-23页
   ·MVC 设计模式第23-24页
   ·STRUTS 概述第24-26页
     ·Struts 的体系结构第24页
     ·Struts 的实现原理第24-26页
第四章 文本预处理的设计第26-38页
   ·WEB页面的内容提取第26-29页
     ·Html 网页的特征第26-27页
     ·网页内容抽取的设计思想第27-29页
   ·基于LUCENE的中文文本分词第29-33页
     ·文本分词第29-30页
     ·基于Lucene 的中文文本分词第30-31页
     ·Lucene 中文分词算法实现第31-32页
     ·分词词典的选择第32页
     ·分词结果分析第32-33页
   ·文本向量化表示第33-35页
     ·向量化算法选择第33-34页
     ·文本向量化测试第34-35页
   ·文本特征提取第35-38页
     ·文本特征提取算法选择第35-36页
     ·文本特征提取测试第36-38页
第五章 WEB 文本分类第38-42页
   ·训练文本语料集的选取第38页
   ·KNN(K 最近邻居)算法第38-39页
   ·阈值的确定第39-40页
   ·文本分类算法的评价准则及目标第40-42页
第六章 文本分类系统的实现第42-53页
   ·系统的实现目标第42页
   ·系统的总体结构第42-44页
     ·系统的总体结构图第42-43页
     ·Web 分类系统的总体模块设计第43-44页
   ·系统的详细设计第44-51页
     ·具体类的设计(部分重要的类)第44-49页
     ·系统的界面设计第49-51页
   ·系统测试第51-53页
第七章 用户新闻个性化网站的实现第53-58页
   ·系统的实现目标第53页
   ·系统的总体分析第53-54页
   ·系统的实现第54-58页
     ·系统包路径的设计第54页
     ·系统登录界面的实现第54页
     ·系统自动排版的设计与实现第54-58页
第八章 结论与展望第58-61页
   ·结论第58-59页
   ·展望第59-61页
参考文献第61-64页
附录第64-66页
致谢第66-67页
在读期间取得的科研成果第67页

论文共67页,点击 下载论文
上一篇:山东省民营医疗机构现状及发展对策研究
下一篇:富泰热力股份有限公司营销问题研究