首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于文本内容的网页过滤技术研究

摘要第1-5页
Abstract第5-9页
1 引言第9-14页
   ·网页过滤简介第9-11页
     ·个人电脑过滤第9-10页
     ·企业网络内容过滤第10-11页
     ·联网骨干网页过滤第11页
   ·基于文本内容的网页过滤技术第11-12页
   ·网页过滤与网页分类、文本分类第12-13页
   ·内容安排第13-14页
2 网页文本内容抽取第14-24页
   ·网页文本抽取方法第14-17页
     ·基于文档结构的文本抽取第14页
     ·通过摘要的文本抽取第14-16页
     ·基于链接的文本抽取第16页
     ·基于相邻网页的文本抽取第16-17页
   ·文本抽取中存在的问题第17页
   ·基于相似度的网页文本抽取第17-23页
     ·两种类型的网页第18页
     ·宽度优先遍历树第18-22页
     ·类别树第22-23页
   ·小结第23-24页
3 网页文本内容过滤技术第24-33页
   ·概述第24-25页
   ·特征选择方法第25-28页
     ·文档频次第25页
     ·互信息第25-26页
     ·信息增益第26页
     ·相对熵第26-27页
     ·统计量第27-28页
   ·文本分类方法第28-30页
     ·贝叶斯分类算法第28页
     ·支持向量机第28-29页
     ·k近邻方法第29-30页
     ·决策树第30页
   ·阈值策略第30-31页
     ·位置截尾法(RCut)第30页
     ·比例截尾法(PCut)第30-31页
     ·最优截尾法(SCut)第31页
     ·改进型截尾法(RTCut)第31页
   ·评测指标第31-32页
   ·小结第32-33页
4 实验第33-42页
   ·训练、测试流程第33-35页
   ·摘要第35页
   ·贝叶斯方法第35-37页
     ·贝叶斯文本分类算法的两种模型第35-36页
     ·多变量贝努里事件模型第36-37页
     ·多项式事件模型第37页
   ·特征选择第37页
   ·阈值策略第37-38页
   ·实验结果第38-39页
   ·实验结果分析第39-41页
   ·小结第41-42页
5 网页内容类别库更新第42-55页
   ·互联网的动态性第42-45页
     ·互联网的增长特性第42-43页
     ·互联网内容的更新特征第43-45页
   ·链接结构第45页
     ·Random模型第45页
     ·Scale-free模型第45页
   ·网页抓取策略第45-54页
     ·选择策略第46-48页
     ·再次访问策略第48-50页
     ·友好的下载策略第50-51页
     ·并行策略第51-54页
   ·小结第54-55页
6 结束语第55-56页
   ·结论第55页
   ·未来的工作第55-56页
参考文献第56-58页
致谢第58-59页
个人简历第59页
参与的项目第59页

论文共59页,点击 下载论文
上一篇:高职院校公关礼仪类专业舞蹈课程教学的现状与实施对策--以福建省高职院校公关礼仪类专业舞蹈课程教学现状为个案调查
下一篇:云南国税税收收入能力评估分析