首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向主题的文档摘要技术研究

摘要第1-5页
Abstract第5-8页
1 引言第8-11页
   ·课题研究的目的和意义第8页
   ·国内外现状第8-9页
   ·论文的组织结构第9-11页
2 面向主题的摘要相关技术概要第11-25页
   ·信息检索第11-15页
     ·信息检索中的倒排索引第11-12页
     ·数据库中的索引第12-14页
     ·数据库中的全文检索第14-15页
     ·结构化与非结构化数据融合第15页
   ·向量空间模型第15-19页
     ·权重计算第16-17页
     ·相似度计算第17-18页
     ·相似度计算举例第18-19页
   ·关键词提取第19-20页
     ·基于统计的方法第19页
     ·基于机器学习的方法第19-20页
     ·基于语言学的方法第20页
   ·自动文摘技术概要第20-25页
     ·基于抽取的自动文摘第20-22页
     ·基于理解的自动文摘第22-23页
     ·自动文摘方法概述第23-25页
3 海量信息垂直搜索第25-31页
   ·LJSearch第25-26页
     ·索引压缩第25页
     ·内存交换第25-26页
     ·增量索引第26页
   ·数据库检索第26-28页
   ·标准检索第28-31页
     ·题录信息检索第29-30页
     ·详细信息检索第30-31页
4 基于关键词提取的自动摘要第31-39页
   ·文本预处理第31-32页
   ·去除停用词第32页
   ·双数组Trie树第32-35页
   ·关键词提取第35-37页
     ·词的tf-idf特征第35页
     ·词的AV(Accessor Variety)值第35-36页
     ·词的位置局部性第36-37页
     ·词所在句子的位置第37页
     ·词的权重计算第37页
   ·句子切分第37页
   ·句子相似度计算第37-39页
     ·句子冗余度第38-39页
5 面向主题的摘要第39-44页
   ·改进的最大边缘相关度方法第40-41页
   ·面向主题的词特征统计第41页
   ·领域主题词表第41-42页
   ·句子之间的包含关系第42-44页
     ·带权包含度第43-44页
6 实验与分析第44-48页
   ·稳定性测试第44页
   ·时间性能第44-46页
     ·标准垂直搜索系统检索性能测试第44-45页
     ·响应时间测试第45-46页
   ·文摘质量第46-48页
7 总结与展望第48-49页
   ·本文工作总结第48页
   ·下一步研究方向第48-49页
参考文献第49-51页
申请学位期间的研究成果及发表的学术论文第51-52页
致谢第52页

论文共52页,点击 下载论文
上一篇:数据挖掘技术在WMS系统中的应用研究
下一篇:基于视频图像处理的平面交叉口交通冲突自动检测技术研究