基于KNN及相关链接的中文网页分类研究

摘要	第1-6页
Abstract	第6-11页
第1章绪论	第11-16页
·研究的背景及意义	第11-12页
·网页分类和超链接分析方面的国内外研究现状	第12-15页
·网页分类的发展与研究现状	第12-14页
·超链接的研究现状	第14-15页
·本论文的工作及论文结构	第15-16页
第2章网页分类技术研究	第16-33页
·互联网信息描述语言	第16-18页
·SGML标记语言	第16页
·HTML标记语言	第16-17页
·XML标记语言	第17-18页
·文本分类的基本概念及特点	第18-19页
·文本分类的基本概念	第18页
·文本分类的特点	第18-19页
·文本表示模型	第19-22页
·布尔模型	第19-20页
·概率模型	第20页
·向量空间模型	第20-22页
·汉语分词	第22-24页
·文本特征选择及权值计算	第24-26页
·文档频率	第24-25页
·TF-IDF算法	第25-26页
·文本分类算法	第26-31页
·朴素贝叶斯分类	第26-27页
·支持向量机分类	第27-28页
·KNN分类	第28-29页
·神经网络分类	第29-30页
·决策树分类	第30-31页
·文本分类的评价体系	第31页
·准确率与召回率	第31页
·F值	第31页
·本章小结	第31-33页
第3章中文网页内容的提取算法研究	第33-41页
·网页标题的提取	第33-34页
·网页正文的提取	第34-36页
·网页相关链接的提取	第36-40页
·网页相关链接的提取算法	第36-40页
·相关链接提取算法的测试	第40页
·本章小结	第40-41页
第4章基于KNN的组合分类算法研究	第41-45页
·基于KNN的组合分类算法	第41-42页
·中文网页分类器的设计与实现	第42-44页
·中文网页预处理	第42-43页
·基于词频的特征选择	第43页
·系统流程设计	第43-44页
·本章小结	第44-45页
第5章中文网页分类实验设置与结果分析	第45-54页
·语料库简介	第45-46页
·实验方案及实验步骤	第46-49页
·实验方案	第46页
·实验步骤	第46-49页
·实验结果与分析	第49-53页
·未引入相关链接的网页分类实验结果与分析	第49-50页
·引入相关链接的网页分类实验结果与分析	第50-52页
·基于相关链接进行网页分类实验结果与分析	第52-53页
·本章小结	第53-54页
结论	第54-55页
参考文献	第55-59页
攻读硕士学位期间发表的论文和取得的科研成果	第59-60页
致谢	第60-61页
个人简历	第61页