首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于统计的网页质量评价技术研究与实现

摘要第1-5页
Abstract第5-9页
第1章 绪论第9-15页
   ·课题研究背景及意义第9-10页
     ·研究背景第9页
     ·研究意义第9-10页
   ·本课题国内外相关研究第10-13页
     ·网络信息资源评价研究综述第10-11页
     ·基于链接分析的网页质量评价第11-13页
   ·基于统计的网页质量评价概述第13页
   ·本文主要研究内容与组织第13-15页
第2章 论坛网页的抓取及正文抽取第15-27页
   ·论坛网页抓取第15-20页
     ·论坛站点收集第15页
     ·列表网页识别流程第15页
     ·列表网页识别第15-18页
     ·列表网页内容抽取第18-20页
   ·网页正文抽取第20-22页
     ·论坛网页正文抽取方法描述第20-21页
     ·实验结果及分析第21-22页
   ·网页编码识别第22-26页
     ·编码简介第22-23页
     ·N-gram语言模型简介第23-24页
     ·编码识别第24-25页
     ·测试结果第25-26页
     ·实验结果分析第26页
   ·本章小结第26-27页
第3章 基于统计的网页质量评价第27-44页
   ·试验结果的评价指标第27-28页
   ·特征词的选择第28-33页
     ·常用的特征选择方法第28-30页
     ·投票法的提出第30页
     ·特征词选择方法的比较第30-32页
     ·试验结果分析第32-33页
   ·最大熵模型简介第33-36页
     ·条件最大熵模型第33-35页
     ·最大熵原则的数学表示第35-36页
     ·最大熵模型的特征选择第36页
     ·最大熵模型的优缺点第36页
   ·网页质量评价相关问题研究第36-43页
     ·非平衡训练集第37-40页
     ·特征选取第40-43页
   ·本章小结第43-44页
第4章 系统设计实现与评测第44-49页
   ·系统总体模块设计第44-45页
   ·系统主要模块简介第45-46页
   ·系统性能测试第46-47页
   ·试验结果分析第47-48页
   ·本章小结第48-49页
结论第49-51页
参考文献第51-55页
致谢第55页

论文共55页,点击 下载论文
上一篇:P2P网络中的Anytime查询处理
下一篇:Db_Kad:一种基于网络时延信息的Kademlia改进算法