互联网网站属性标识技术的研究与实现

摘要	第1-5页
ABSTRACT	第5-10页
第一章绪论	第10-14页
·研究背景和意义	第10页
·国内外研究现状	第10-12页
·本文的研究内容	第12-13页
·本文结构	第13-14页
第二章网站标签标识相关技术	第14-26页
·网站资源采集技术	第14-15页
·网络爬虫	第14-15页
·网站关键资源提取	第15页
·网站的抽象表示方法	第15-17页
·空间向量	第16页
·树、图	第16页
·结构参数	第16-17页
·文本分类技术	第17-21页
·单标签分类与多标签分类	第17-18页
·现有的单标签分类算法	第18-19页
·现有的多标签分类算法	第19-21页
·网站标签标识系统的评价指标	第21-23页
·文本分类的衡量指标	第21-22页
·网站标签标识系统中其他特有的评价指标	第22-23页
·网站标签标识的基本框架	第23-24页
·本章小结	第24-26页
第三章网站关键资源动态提取方法研究	第26-38页
·相关研究现状	第26-27页
·关键页面特征研究	第27-28页
·关键页面分布位置分析	第27页
·关键页面结构特征研究	第27-28页
·网站关键资源动态提取的方法	第28-29页
·基于分类器的限定爬虫	第29-31页
·限定爬虫	第29页
·URL特征研究	第29-30页
·针对网站数据的限定爬虫改进	第30-31页
·基于决策树的网站关键资源判定	第31-35页
·决策树	第31-33页
·关键资源属性离散化	第33-35页
·关键资源动态提取的基本流程	第35-36页
·针对关键资源的限定爬虫的基本流程	第35-36页
·使用决策树算法判定关键资源的基本流程	第36页
·实验结果	第36-37页
·决策树判定关键资源实验	第36-37页
·限定爬虫提取关键资源实验	第37页
·本章小结	第37-38页
第四章基于MFMLKNN算法的网站标签标识	第38-50页
·相关研究现状	第38-40页
·多标签算法的应用现状	第38-40页
·多数据域分类的研究现状	第40页
·站多数据域特征研究	第40-43页
·网站的多数据域特性	第40-41页
·网站数据域完备性分析	第41-43页
·针对网站数据的MFMLKNN算法	第43-44页
·MLKNN算法	第43页
·多因子MFMLKNN算法	第43-44页
·站标签标识的基本流程	第44-46页
·实验结果及分析	第46-49页
·本章小结	第49-50页
第五章网站标签标识系统的设计与实现	第50-54页
·系统设计目标	第50页
·系统架构	第50-53页
·关键资源动态提取模块	第50-52页
·网站数据预处理模块	第52页
·标签标识模块	第52-53页
·系统性能分析	第53-54页
第六章总结及展望	第54-56页
·总结	第54-55页
·展望	第55-56页
参考文献	第56-59页
致谢	第59-60页
攻读学位期间发表的学术论文目录	第60页