基于不同特征权重的中文网页自动摘要
| 摘要 | 第1-5页 |
| Abstract | 第5-11页 |
| 第一章 引言 | 第11-19页 |
| ·本论文研究的目的和意义 | 第11-12页 |
| ·基于单篇文档中文自动文摘研究状况 | 第12-17页 |
| ·本论文的主要研究内容 | 第17-18页 |
| ·论文架构 | 第18-19页 |
| 第二章 文本特征词的提取 | 第19-28页 |
| ·中文自动分词 | 第20-24页 |
| ·机械匹配方法 | 第21-22页 |
| ·理解式切分法 | 第22页 |
| ·特征词库法 | 第22-23页 |
| ·约束矩阵法 | 第23页 |
| ·语法分析法 | 第23-24页 |
| ·词频统计原理 | 第24-28页 |
| ·语言单位的频度——频级关系 | 第24-25页 |
| ·汉语信息熵 | 第25-26页 |
| ·互信息 | 第26页 |
| ·特征词和非特征词 | 第26-28页 |
| 第三章 文本主题句的抽取 | 第28-31页 |
| ·基于句子特征加权的文摘句选取 | 第28页 |
| ·基于全覆盖方法的文摘句选取 | 第28-31页 |
| 第四章 中文网页自动摘要系统的设计 | 第31-55页 |
| ·中文网页自动摘要系统流程 | 第31页 |
| ·网页预处理过程 | 第31-42页 |
| ·HTML 简介 | 第31-34页 |
| ·从WEB中抽取半结构化信息 | 第34页 |
| ·过滤无用信息 | 第34-35页 |
| ·处理特殊字符 | 第35页 |
| ·如何确定段落和句子 | 第35-36页 |
| ·分词的处理方法 | 第36-42页 |
| ·加权方法 | 第42-45页 |
| ·词串权重的计算 | 第45-46页 |
| ·词频计算 | 第45-46页 |
| ·标题关键字 | 第46页 |
| ·句子权重的计算 | 第46-55页 |
| ·句子有效测度值的计算 | 第46-48页 |
| ·句子与标题相似度的计算 | 第48-54页 |
| ·句子权重的获取 | 第54-55页 |
| 第五章 文档自动摘要系统的评价 | 第55-58页 |
| ·自动文摘的内部评价 | 第56-57页 |
| ·自动文摘的外部评价 | 第57页 |
| ·自动评价和人工评价结果对比分析 | 第57-58页 |
| 第六章 实验结果分析及评估 | 第58-67页 |
| ·实验步骤 | 第58-59页 |
| ·实验结果 | 第59-67页 |
| ·序列挖掘实验结果及分析 | 第59-62页 |
| ·词串权重计算实验结果及分析 | 第62页 |
| ·句子权重计算实验结果及分析 | 第62-64页 |
| ·摘要成果呈现 | 第64-67页 |
| 第七章 结论与未来研究方向 | 第67-69页 |
| ·结论 | 第67-68页 |
| ·未来研究方向 | 第68-69页 |
| 参考文献 | 第69-75页 |
| 致谢 | 第75页 |