首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

大规模中文网页的自动分类研究

中文摘要第1-5页
Abstract第5-8页
第一章 绪论第8-13页
   ·课题研究的目的和意义第8页
   ·课题研究的背景与发展现状第8-11页
   ·课题研究的难点及突出问题第11页
   ·本文工作及内容安排第11-13页
第二章 文本分类的基础理论及相关技术第13-24页
   ·文本分类的基本概念及特点第13-15页
   ·文本表示模型第15-17页
   ·文本特征选择第17-20页
   ·文本分类算法第20-22页
   ·文本分类的评价体系第22-24页
第三章 中文网页内容的自动提取第24-33页
   ·网页的基本结构和特点第24-26页
   ·网页噪音信息的初步过滤第26-28页
   ·网页内容提取的相关方法第28-33页
第四章 网页自动分类系统的实现第33-41页
   ·网页自动分类系统的预处理第33-35页
   ·基于“词-类权重”的权重计算与特征选择第35-38页
   ·基于Jaccard相似度的分类器构造第38-39页
   ·网页自动分类系统的架构第39-41页
第五章 实验设置与结果分析第41-46页
   ·实验用语料库建设第41页
   ·实验评测标准第41-42页
   ·实验项目及步骤第42页
   ·实验结果及分析第42-46页
第六章 结论与展望第46-48页
   ·全文总结第46-47页
   ·下一步工作展望第47-48页
参考文献第48-52页
在校期间参加课题与发表论文情况第52-53页
致谢第53页

论文共53页,点击 下载论文
上一篇:基于SIP协议的IPPhone的QoS研究
下一篇:我国电力二次设备行业技术创新战略研究