首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于Web的竞争信息抽取研究

摘要第1-5页
Abstract第5-6页
目录第6-8页
第1章 引言第8-15页
   ·信息抽取研究背景第8-10页
     ·Web1.0的发展第10页
   ·国内外研究现状及分析第10-13页
     ·Web信息抽取的历史第10-11页
     ·Web信息抽取的相关技术第11-13页
   ·主要研究内容第13-14页
   ·本章小结第14-15页
第2章 Web信息抽取及相关技术第15-27页
   ·HTML的介绍第15页
   ·XML的介绍第15-18页
   ·XHTML的介绍第18-19页
   ·XPATH的介绍第19-22页
   ·XSLT介绍第22-24页
   ·XML访问以及DOM树形结构第24-27页
第3章 Web网页自动批量获取方法第27-35页
   ·GOOGLE WEB API(GWA)第27-28页
   ·网络中页面内容抽取具体过程第28-29页
   ·正则表达式(REGULAR EXPRESSION)第29-31页
   ·WEB信息自动抽取算法第31-32页
   ·WEB页面信息抽取成果第32-35页
     ·建立小型搜索引擎第32页
     ·获取URL第32-33页
     ·抽取相应Web页面第33页
     ·正则表达式校对URL第33-35页
第4章 基于Web的竞争对手挖掘第35-47页
   ·简介第35-36页
   ·实现策略第36-37页
     ·实体信息检索与收集第36页
     ·专业术语提取第36页
     ·差异性检索及信息提取第36-37页
   ·利用网络渠道检索竞争对手资源第37页
   ·算法的设计第37-40页
     ·竞争者载体信息收集第38页
     ·竞争对手排序及筛选第38-39页
     ·竞争实体名过滤第39-40页
   ·利用网络渠道检索竞争领域第40-42页
     ·收集竞争领域信息第40页
     ·竞争领域特征参数第40-41页
     ·竞争领域筛选第41-42页
   ·基于网络的竞争依据查找第42-44页
     ·竞争依据的全面性分析第42-43页
     ·CoSorter算法优化模型第43-44页
     ·CoSorter算法的实验验证第44页
   ·模拟实验第44-46页
     ·竞争对手抽取结果评估第45页
     ·竞争领域挖掘结果评估第45页
     ·竞争依据抽取结果评估第45-46页
     ·领域约束下的竞争对手挖掘第46页
   ·总结第46-47页
第五章 总结与展望第47-48页
   ·本文总结第47页
   ·未来工作的展望第47-48页
参考文献第48-52页
致谢第52-53页
附录 攻读学位期间发表的主要科研成果第53页

论文共53页,点击 下载论文
上一篇:跨域协同制造集成服务平台的研究与实现
下一篇:基于PageRank值的文本相似度改进模型