首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

面向Web文本检索的归一化向量分类算法

摘要第1-4页
ABSTRACT第4-9页
1 绪论第9-13页
   ·信息检索第9页
   ·文本分类第9-11页
   ·国内外研究现状第11-12页
   ·研究目的及意义第12页
   ·本文工作及组织结构第12-13页
2 相关知识介绍第13-31页
   ·文本分类过程第13-14页
   ·WEB 文本采集第14页
     ·爬虫技术第14页
     ·Web 页面处理第14页
   ·文本预处理第14-15页
     ·英文处理第14-15页
     ·中文处理第15页
     ·停用词去除第15页
   ·文本表示第15-16页
   ·特征选择第16-19页
     ·文档频率第16-17页
     ·卡方校验第17-18页
     ·信息增益第18页
     ·互信息第18-19页
   ·常见分类模型第19-24页
     ·基于规则的模型第19页
     ·基于概率的模型第19-21页
     ·基于几何学的模型第21-24页
     ·基于统计的模型第24页
   ·数据集第24-26页
     ·英文文本分类语料库第25页
     ·中文文本分类语料库第25-26页
   ·分类器性能评估指标第26-29页
     ·召回率、准确率与 F1-评测值第27页
     ·微平均与宏平均第27-28页
     ·混淆矩阵第28-29页
   ·本章小结第29-31页
3 MATRIX PROJECTION 特征选择第31-37页
   ·引言第31页
   ·MP 特征选择思想第31页
   ·MP 特征选择过程第31-33页
   ·特征选择分析第33-35页
   ·MP 特征选择小结第35-37页
4 NLV 文本分类算法第37-43页
   ·引言第37页
   ·NLV 算法理论第37-40页
     ·训练过程第37-39页
     ·分类过程第39-40页
   ·NLV 算法实现第40-42页
   ·时间复杂度第42页
   ·NLV 算法小结第42-43页
5 实验与性能评估第43-69页
   ·实验设计第43-46页
     ·实验环境第43页
     ·数据集选择第43-46页
     ·实验目标第46页
     ·关于预处理第46页
   ·实验及结果分析第46-68页
     ·前提实验第47-53页
     ·NLV 分类实验第53-58页
     ·特征选择实验第58-61页
     ·分类对比实验第61-68页
   ·本章小结第68-69页
6 总结与展望第69-71页
   ·本文工作总结第69-70页
   ·未来工作展望第70-71页
致谢第71-73页
参考文献第73-77页
附录第77-79页
 A. 20_NEWSGROUPS 分类混淆矩阵第77-79页
 B.作者在攻读硕士学位期间发表的论文目录第79页

论文共79页,点击 下载论文
上一篇:预测控制软件包的设计与仿真研究
下一篇:基于本体的语义搜索研究与实现