首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于综合特征空间的Blog网页识别方法研究

摘要第1-4页
ABSTRACT第4-8页
第1章 绪论第8-18页
   ·基本概念第8-11页
     ·Blog的概念第8-10页
     ·Blog网页识别的概念第10-11页
   ·Blog网页识别研究的意义第11-13页
   ·国内外相关研究现状第13-15页
   ·论文组织结构和创新点第15-18页
第2章 网页特征信息抽取第18-47页
   ·Web信息抽取简介第18-19页
   ·网页获取和预处理第19-22页
     ·网页获取第19-20页
     ·网页清洗第20-21页
     ·网页解析第21-22页
   ·Blog特征信息抽取第22-47页
     ·Blog综合特征空间第23-24页
     ·Blog结构特征第24-30页
     ·Blog技术特征第30-38页
     ·Blog内容特征第38-47页
第3章 网页形式化表示第47-60页
   ·文本表示模型第47-51页
     ·向量空间模型第47-48页
     ·特征项获取第48-49页
     ·特征项权重计算第49-51页
   ·网页文本内容特征的形式化表示第51-56页
     ·网页文本内容特征的表示模型第51页
     ·网页文本内容特征的获取方法第51-56页
   ·页面布局特征的形式化表示第56-60页
     ·页面布局特征的表示模型第56页
     ·页面布局特征的获取方法第56-60页
第4章 网页识别算法第60-103页
   ·聚类算法第60-74页
     ·聚类的概念第60-61页
     ·基于SCSD、ICER和LOK的K-means改进算法——SILKM算法第61-74页
   ·分类算法第74-85页
     ·分类的概念第74-75页
     ·基于KM和CV的KNN改进算法——KNC算法第75-85页
   ·基于综合特征空间的Blog网页识别算法第85-103页
     ·基于标签属性特征的Blog网页识别第88-90页
     ·基于文本语义格式特征的Blog网页识别第90-92页
     ·基于技术特征的Blog网页识别第92-95页
     ·基于页面布局特征的Blog网页识别第95-98页
     ·基于文本内容特征的Blog网页识别第98-102页
     ·Blog网页识别算法的小结第102-103页
第5章 实验与性能评估第103-113页
   ·实验评估指标第103-105页
   ·实验环境与数据第105-109页
   ·实验结果与分析第109-113页
第6章 总结与展望第113-115页
   ·工作总结第113-114页
   ·研究展望第114-115页
参考文献第115-118页
致谢第118页

论文共118页,点击 下载论文
上一篇:基于BP算法的动态负载平衡预测
下一篇:基于邻近节点与兴趣分组的P2P网络模型