首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文网页自动分类的研究及其应用

摘要第1-5页
Abstract第5-8页
1 绪论第8-11页
   ·课题目的及意义第8页
   ·国内外研究现状第8-9页
   ·本文的主要工作第9-11页
2 中文网页分类的相关技术第11-22页
   ·文本分类的概念第11-12页
   ·中文分词第12-13页
   ·维数约简第13-16页
   ·文本表示模型第16-18页
   ·文本分类方法第18-22页
     ·K最近邻法第19-20页
     ·朴素贝叶斯方法第20页
     ·支持向量机方法第20-22页
3 网页分类有效信息的抽取第22-39页
   ·网页信息抽取的研究进展第22-23页
   ·网页的基本结构、特点和表示第23-24页
   ·网页噪音过滤第24-26页
   ·分类有效信息的抽取第26-39页
     ·网页的真实标题第26-32页
     ·网页的主题内容第32-34页
     ·网页中重要标签的元素体第34-35页
     ·相关链接的锚文本第35-37页
     ·抽取结果第37-39页
4 中文网页自动分类的实现第39-50页
   ·自动分类的实现模型第39页
   ·特征权重计算第39-44页
     ·TF*IDF权重计算方法第40-41页
     ·改进的TF*IDF权重计算方法第41-44页
   ·分类效果的评价指标第44-45页
     ·准确率与召回率第44页
     ·F-measure值第44-45页
   ·分类实验设置第45-50页
     ·分类语料集介绍第45页
     ·分类实验步骤第45-46页
     ·实验结果及分析第46-50页
5 公安局刑侦信息抽取与发布系统第50-61页
   ·系统背景介绍第50页
   ·系统功能实现第50-58页
     ·网页抓取器第51-54页
     ·网页信息抽取器第54页
     ·网页分类模块第54-56页
     ·数据库操作模块第56-58页
   ·系统运行效果第58-61页
结论第61-63页
参考文献第63-66页
攻读硕士学位期间发表学术论文情况第66-67页
致谢第67-68页

论文共68页,点击 下载论文
上一篇:中国传统法律文化中的“则天”思想--以唐宋时期为考察核心
下一篇:身体和法律