首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

面向企业竞争情报的主题搜索研究与实现

摘要第1-4页
Abstract第4-8页
第一章 绪论第8-10页
   ·课题背景第8页
   ·主要工作第8-9页
   ·组织结构第9-10页
第二章 企业竞争情报第10-16页
   ·竞争情报内涵第10-12页
     ·竞争情报概念第10-11页
     ·主要搜集途径第11页
     ·质量评价方法第11-12页
   ·竞争情报流程第12页
   ·竞争情报软件第12-14页
   ·发展现状概述第14页
   ·小结第14-16页
第三章 主题搜索引擎综述第16-24页
   ·主题选择第16-17页
     ·主题的含义第16-17页
     ·主题选择第17页
   ·主题搜索引擎第17-19页
     ·产生背景第17-18页
     ·主要构成第18页
     ·技术难点第18-19页
     ·典型系统第19页
   ·主题网络爬虫第19-21页
     ·工作原理第19-20页
     ·主要功能第20页
     ·关键技术第20-21页
   ·Web挖掘技术第21-23页
     ·Web挖掘的含义第21-22页
     ·Web挖掘的应用第22-23页
   ·小结第23-24页
第四章 主题搜索的理论与算法第24-40页
   ·网页文档解析第24-26页
     ·网页文档的格式特点第24页
     ·网页文档的树型表示第24-26页
     ·网页树型结构的解析第26页
     ·网页文档的分类第26页
   ·Web文本分析第26-31页
     ·网页预处理第26-27页
     ·页内链接提取第27-28页
     ·正文文本抽取第28页
     ·中文分词技术第28-30页
     ·特征向量的项权重第30-31页
   ·主题相关性评价第31-34页
     ·内容的主题相关性第31-33页
     ·链接的主题相关性第33-34页
   ·主题网络爬虫的搜索策略第34-38页
     ·非贪婪链接选择策略第34-36页
     ·主题搜索的全局优化第36-37页
     ·性能分析第37-38页
   ·小结第38-40页
第五章 主题搜索的设计与实现第40-68页
   ·企业竞争情报系统第40-41页
   ·主题搜索的设计第41-43页
     ·主题搜索的设计原则第41-42页
     ·主题搜索的总体框架第42-43页
   ·线程管理模块第43-47页
     ·多线程的运行流程第43-44页
     ·多线程的同步机制第44-45页
     ·wxWidgets中的线程第45-46页
     ·多线程的代码实现第46-47页
   ·网页下载模块第47-48页
   ·网页预处理模块第48-51页
     ·boost正则表达式库第48-50页
     ·过滤网页的无用标记第50-51页
   ·网页解析模块第51-55页
     ·HTML Tidy库第51-52页
     ·网页结构解析第52-53页
     ·网页内容解析第53-55页
   ·主题相关度评价模块第55-57页
   ·超链接调度模块第57-59页
     ·选择种子URL第57-58页
     ·管理URL集合第58-59页
   ·数据存储与检索第59-63页
     ·数据库设计第59-61页
     ·数据索引第61-62页
     ·用户检索第62-63页
   ·运行界面第63-67页
   ·小结第67-68页
第六章 总结与展望第68-70页
   ·研究工作第68页
   ·趋势与展望第68-70页
致谢第70-72页
参考文献第72-74页

论文共74页,点击 下载论文
上一篇:基于视频图像序列的抛洒物检测
下一篇:序列图像超分辨率重建技术研究