基于不同特征权重的中文网页自动摘要
摘要 | 第1-5页 |
Abstract | 第5-11页 |
第一章 引言 | 第11-19页 |
·本论文研究的目的和意义 | 第11-12页 |
·基于单篇文档中文自动文摘研究状况 | 第12-17页 |
·本论文的主要研究内容 | 第17-18页 |
·论文架构 | 第18-19页 |
第二章 文本特征词的提取 | 第19-28页 |
·中文自动分词 | 第20-24页 |
·机械匹配方法 | 第21-22页 |
·理解式切分法 | 第22页 |
·特征词库法 | 第22-23页 |
·约束矩阵法 | 第23页 |
·语法分析法 | 第23-24页 |
·词频统计原理 | 第24-28页 |
·语言单位的频度——频级关系 | 第24-25页 |
·汉语信息熵 | 第25-26页 |
·互信息 | 第26页 |
·特征词和非特征词 | 第26-28页 |
第三章 文本主题句的抽取 | 第28-31页 |
·基于句子特征加权的文摘句选取 | 第28页 |
·基于全覆盖方法的文摘句选取 | 第28-31页 |
第四章 中文网页自动摘要系统的设计 | 第31-55页 |
·中文网页自动摘要系统流程 | 第31页 |
·网页预处理过程 | 第31-42页 |
·HTML 简介 | 第31-34页 |
·从WEB中抽取半结构化信息 | 第34页 |
·过滤无用信息 | 第34-35页 |
·处理特殊字符 | 第35页 |
·如何确定段落和句子 | 第35-36页 |
·分词的处理方法 | 第36-42页 |
·加权方法 | 第42-45页 |
·词串权重的计算 | 第45-46页 |
·词频计算 | 第45-46页 |
·标题关键字 | 第46页 |
·句子权重的计算 | 第46-55页 |
·句子有效测度值的计算 | 第46-48页 |
·句子与标题相似度的计算 | 第48-54页 |
·句子权重的获取 | 第54-55页 |
第五章 文档自动摘要系统的评价 | 第55-58页 |
·自动文摘的内部评价 | 第56-57页 |
·自动文摘的外部评价 | 第57页 |
·自动评价和人工评价结果对比分析 | 第57-58页 |
第六章 实验结果分析及评估 | 第58-67页 |
·实验步骤 | 第58-59页 |
·实验结果 | 第59-67页 |
·序列挖掘实验结果及分析 | 第59-62页 |
·词串权重计算实验结果及分析 | 第62页 |
·句子权重计算实验结果及分析 | 第62-64页 |
·摘要成果呈现 | 第64-67页 |
第七章 结论与未来研究方向 | 第67-69页 |
·结论 | 第67-68页 |
·未来研究方向 | 第68-69页 |
参考文献 | 第69-75页 |
致谢 | 第75页 |