首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

面向行业的信息融合原型系统的研究与实现

摘要第1-5页
ABSTRACT第5-9页
第一章 绪论第9-14页
   ·课题背景第9页
   ·研究意义第9-10页
   ·国内外研究现状第10-11页
   ·本文的研究工作第11-12页
   ·本文的组织结构第12-14页
第二章 相关理论与技术综述第14-20页
   ·信息检索的经典模型第14-15页
     ·布尔模型第14-15页
     ·向量空间模型第15页
   ·网页数据抽取技术第15-16页
   ·文本的分类技术第16-19页
     ·K-最近邻分类算法第16-17页
     ·支持向量机分类算法第17-19页
   ·基于图排序算法的关键词抽取第19页
   ·本章小结第19-20页
第三章 面向行业的信息融合原型系统的研究第20-32页
   ·系统研究步骤第20-21页
   ·网页数据精确抽取第21-23页
   ·基于百度百科的实体词典第23-28页
     ·基于机器学习的百度百科词条分类第24-26页
     ·文本特征选择第26页
     ·文本的表示第26页
     ·基于百度百科的分类建模第26-28页
   ·实体关联模型第28-31页
     ·实体识别与抽取第28-29页
     ·实体关联模型表示第29-30页
     ·基于TextRank的文本与实体相关度第30页
     ·实体间关联度计算第30-31页
   ·本章小结第31-32页
第四章 面向行业的信息融合原型系统的设计第32-39页
   ·原型系统总体设计第32页
   ·原型系统流程第32-35页
     ·实体词典构建流程第33-34页
     ·实体关联模型构建流程第34-35页
   ·原型系统架构第35-37页
   ·原型系统接口设计第37-38页
   ·本章小结第38-39页
第五章 面向行业的信息融合原型系统的实现第39-57页
   ·网页信息抽取模块实现第39-46页
     ·网页预处理第39-40页
     ·层次聚类算法第40页
     ·网页聚类第40-41页
     ·改进简单树匹配算法第41-42页
     ·模板生成第42-45页
     ·模板标注第45-46页
     ·数据抽取第46页
   ·实体词典构建模块实现第46-51页
     ·百度百科数据抽取第46-47页
     ·构建文本空间向量第47-48页
     ·分类训练第48-50页
     ·分类预测第50-51页
   ·实体关联模块实现第51-55页
     ·新闻类语料的准备第51页
     ·分词模块调用第51-52页
     ·实体抽取第52-53页
     ·实体与文本相关度计算第53-54页
     ·实体间关联度计算第54-55页
   ·系统界面第55页
   ·本章小结第55-57页
第六章 实验结果分析第57-63页
   ·测试的性能指标第57页
   ·对比实验及结果第57-61页
     ·网页抽取性能评估第57-58页
     ·词条分类性能评估第58-59页
     ·文本与实体相关度性能评估第59-60页
     ·实体间关联度性能评估第60-61页
   ·实验及结果分析第61-62页
   ·本章小结第62-63页
第七章 结束语第63-65页
   ·论文工作总结第63-64页
   ·问题和展望第64-65页
参考文献第65-68页
致谢第68-69页
攻读学位期间发表的学术论文第69页

论文共69页,点击 下载论文
上一篇:云计算环境下计费系统的设计与实现
下一篇:基于ITIL的电动汽车加电站的IT服务流程管理系统的设计与实现