首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于关键词提取的中文网页自动文摘方法研究

摘要第1-7页
ABSTRACT第7-14页
第一章 绪论第14-39页
   ·研究背景及意义第14-15页
   ·自动文摘的定义及分类第15-18页
     ·自动文摘的定义第16-17页
     ·自动文摘的分类第17-18页
   ·国内外自动文摘研究的历史与现状第18-24页
     ·国外自动文摘的研究第18-21页
     ·国内自动文摘的研究现状第21-24页
   ·自动摘要基本方法第24-25页
   ·自动文摘的相关基础工作第25-32页
     ·文本的向量表示第25-26页
     ·中文分词第26-28页
     ·文本聚类算法第28-32页
       ·层次方法第28-30页
       ·划分方法第30-32页
       ·基于密度的方法第32页
   ·自动文摘的评价第32-35页
     ·评价方法分类第33页
     ·基于准确率和召回率的方法第33-34页
     ·基于一致性评价的方法第34页
     ·基于内容相似度判别的方法第34-35页
   ·本文研究内容和组织结构第35-39页
     ·本文的研究内容第35-37页
     ·本文的组织结构第37-39页
第二章 基于组合词和同义词集的中文网页关键词提取算法第39-56页
   ·概述第39-41页
     ·引言第39-40页
     ·相关工作第40-41页
   ·相关概念第41-43页
   ·CWKEACS算法核心技术第43-48页
     ·中文网页的预处理第43-44页
     ·中文组合词提取算法与中文分词修正第44-45页
     ·同义词现象和词形相同、词义不同现象的解决第45-46页
     ·候选关键词综合加权评分第46-48页
   ·CWKEACS算法第48-50页
     ·CWKEACS算法步骤第48-49页
     ·CWKEACS算法相关变量及函数说明第49-50页
   ·实验设计和分析第50-55页
     ·语料库的选取第50页
     ·CWKEACS算法与KEA5.0 算法的对比实验第50-51页
     ·CWKEACS算法与改进的TF-IDF算法的对比实验第51-53页
     ·CWKEACS算法抽取实例第53-55页
   ·本章小结第55-56页
第三章 基于关键词提取的问句分析研究第56-67页
   ·概述第56页
   ·相关研究工作第56-60页
   ·问句分析系统设计及实现第60-64页
     ·敬语过滤第61页
     ·命名实体的识别第61页
     ·分词以及词性标注第61页
     ·关键词提取第61-62页
     ·问句类别的识别第62页
     ·查询关键词的扩展第62-63页
     ·问句分析系统的实现第63-64页
   ·实验设计及结果分析第64-65页
   ·讨论第65-66页
   ·本章小结第66-67页
第四章 基于主题词权重和句子特征的中文网页自动文摘第67-84页
   ·引言第67-68页
   ·相关研究工作第68-69页
   ·关键技术第69-73页
     ·组合词的识别与分词修正第69页
     ·词的权重计算第69页
     ·句子的权重计算第69-72页
       ·基于内容的句子权重第69-70页
       ·基于位置的句子权重第70页
       ·基于线索词的句子权重第70页
       ·基于用户偏好的句子权重第70-71页
       ·句子权重计算第71-72页
     ·文摘的评估方法的改进第72-73页
       ·基于准确率和召回率的方法第72页
       ·基于词粒度的准确率和召回率的方法第72-73页
   ·系统的实现第73-76页
     ·文档结构初始化第74页
     ·分词和分词修正第74页
     ·标题类型的研判第74-75页
     ·词语和句子的权重计算第75页
     ·粗文摘的形成第75-76页
     ·文摘的后处理第76页
   ·系统的评估第76-82页
     ·数据集的选取及实验结果第76-77页
     ·实验结果分析第77-78页
     ·对比实验第78-79页
     ·中文网页自动文摘抽取实例第79-82页
   ·讨论第82页
   ·本章小结第82-84页
第五章 基于段落聚类的中文网页自动文摘第84-99页
   ·引言第84页
   ·相关工作第84-86页
   ·算法设计第86-94页
     ·分词和词性标注第86页
     ·组合词识别和分词修正第86-87页
     ·标题类型研判第87页
     ·词语权重计算第87页
     ·句子权重计算第87-88页
     ·段落聚类第88-90页
     ·粗文摘形成第90页
     ·文摘后处理第90-94页
       ·已有的处理方法第90-91页
       ·句子结构优化第91-92页
       ·指代消解第92-93页
       ·文摘的最终形成第93-94页
   ·系统评估第94-97页
     ·数据集的选取和实验设计第94页
     ·实验结果及分析第94-95页
     ·PCAS系统和TWSFAS系统性能对比第95-96页
     ·毗邻段落聚类算法和K-means算法对比实验第96-97页
   ·讨论第97-98页
   ·本章小结第98-99页
结论和展望第99-102页
 结论第99-100页
 展望第100-102页
参考文献第102-111页
攻读博士学位期间取得的研究成果第111-112页
致谢第112页

论文共112页,点击 下载论文
上一篇:无准则多维图像阈值分割算法——最优进化算法--最优进化算法
下一篇:基因表达数据挖掘若干关键技术研究