首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

面向企业竞争情报的主题网络蜘蛛的研究与实现

摘要第1-4页
Abstract第4-7页
第一章 绪论第7-11页
   ·课题背景第7页
   ·研究现状第7-9页
   ·本文的研究内容第9页
   ·本文的组织结构第9-11页
第二章 企业竞争情报主题和网络蜘蛛综述第11-19页
   ·企业竞争情报内涵第11-13页
     ·企业竞争情报的概念第11页
     ·企业竞争情报主要来源第11-12页
     ·企业竞争情报质量评价第12-13页
   ·搜索引擎技术简介第13-15页
     ·搜索引擎的基本原理第13-14页
     ·搜索引擎的分类第14-15页
   ·通用网络蜘蛛简述第15-16页
     ·通用网络蜘蛛工作原理第15页
     ·通用网络蜘蛛的缺点第15-16页
   ·主题网络蜘蛛简述第16-18页
     ·主题网络蜘蛛简介第16页
     ·主题网络蜘蛛设计目标第16-17页
     ·主题网络蜘蛛原理第17-18页
   ·本章小结第18-19页
第三章 网页解析及文本处理第19-35页
   ·HTML 文档解析第19-22页
     ·HTML 文档的格式特点第19-20页
     ·HTML 树形结构第20-21页
     ·HTML 文档的解析第21页
     ·编码的处理第21-22页
   ·特征向量提取第22-26页
     ·中文分词技术第22-23页
     ·文本特征向量权重计算第23-24页
     ·改进的特征向量权重算法第24-25页
     ·FAT 算法实验分析第25-26页
   ·超链接主题相关度算法(LTC 算法)第26-31页
     ·主题网页在 Web 上的分布特征第26-27页
     ·主题相关度计算模型第27-28页
     ·LTC 算法原理第28-29页
     ·LTC 算法的实验分析第29-31页
   ·文本分类算法第31-34页
     ·Web 文本分类概述第31-32页
     ·朴素贝叶斯分类算法第32-34页
     ·KNN 算法第34页
   ·本章小结第34-35页
第四章 主题网络蜘蛛搜索算法第35-43页
   ·基本搜索算法第35-36页
     ·广度优先搜索第35页
     ·深度优先搜索第35-36页
   ·基于内容评价的搜索算法第36-38页
   ·非贪婪遗传搜索算法(NGGS 算法)第38-42页
     ·非贪婪选择策略第38-39页
     ·网络搜索遗传算法第39-40页
     ·非贪婪遗传搜索算法第40-41页
     ·实验结果比较第41-42页
   ·本章小结第42-43页
第五章 主题网络蜘蛛的设计与实现第43-67页
   ·企业竞争情报系统第43-44页
   ·主题网络蜘蛛系统设计第44-46页
     ·BlueSpider 系统设计原则第44-45页
     ·BlueSpider 系统的总体架构第45-46页
   ·网页下载模块第46-47页
   ·网页解析模块第47-49页
     ·网页的结构修正第47-48页
     ·网页内容解析第48-49页
   ·主题相关度评价模块第49-51页
   ·超链接调度模块第51-54页
     ·URL 的分类第51-52页
     ·URL 的管理第52-53页
     ·类图的设计第53-54页
   ·数据存储模块第54-58页
     ·数据类型第54-55页
     ·数据存储设计第55-57页
     ·类图的设计第57-58页
   ·线程管理模块第58-61页
     ·线程工作流程第58-59页
     ·线程同步第59-60页
     ·多线程类图设计第60-61页
   ·检索模块第61-62页
   ·系统运行界面第62-66页
   ·本章小结第66-67页
第六章 总结与展望第67-69页
   ·工作总结第67页
   ·进一步工作第67-69页
致谢第69-71页
参考文献第71-74页

论文共74页,点击 下载论文
上一篇:智能监控系统中行人计数方法的研究与实现
下一篇:模块挖掘聚类算法的研究及应用