目录 | 第1-7页 |
图表目录: | 第7-8页 |
摘要 | 第8-11页 |
ABSTRACT | 第11-14页 |
第一章 引言 | 第14-26页 |
·中文信息处理研究概况 | 第15-20页 |
·学习和理论探索的萌芽阶段 | 第15页 |
·汉字信息处理为主的早期阶段 | 第15-16页 |
·字、词等表层处理为特征的初级阶段 | 第16-17页 |
·句法和语义等深层处理为代表的中期阶段 | 第17页 |
·语料库统计方法兴起的近期阶段 | 第17-18页 |
·以INTERNET为主要应用对象、大规模真实文本、智能信息访问的现阶段 | 第18-20页 |
·中文信息处理的难点 | 第20页 |
·中文信息处理研究中的主要问题 | 第20-21页 |
·中文信息处理的需求 | 第21-23页 |
·本文研究工作的主要内容及贡献 | 第23-25页 |
·本文的组织结构 | 第25-26页 |
第二章 中文信息处理基础 | 第26-73页 |
·中文信息处理基本概念 | 第26-27页 |
·信息处理模型 | 第27-28页 |
·中文切词 | 第28-35页 |
·中文文本信息切词中的问题 | 第29-30页 |
·中文文本信息切词的主要方法 | 第30-31页 |
·改进的N-GRAM切词算法 | 第31-35页 |
·对N-gram切词算法进行改进 | 第31-33页 |
·实验与性能分析 | 第33-35页 |
·属性选择 | 第35-49页 |
·现有的属性选择方法 | 第35-39页 |
·信息增量(Information Gain) | 第36页 |
·互信息(Mutual Information) | 第36页 |
·X~2统计 | 第36-37页 |
·交叉熵(Cross Entropy) | 第37页 |
·证据权值(Weight of Evidence) | 第37页 |
·Fisher判别式 | 第37-38页 |
·文档属性选择中的概率值估算 | 第38-39页 |
·改进基于概率统计的属性选择算法 | 第39-49页 |
·基于互依赖的属性选择 | 第40-44页 |
·基于字串匹配度的属性选择 | 第44-45页 |
·基于分布特性和位置特性的属性选择 | 第45-46页 |
·基于统计的属性选择扩展算法 | 第46-47页 |
·实验与性能分析 | 第47-49页 |
·词法分析 | 第49-53页 |
·中文词法分析的难点 | 第49-51页 |
·中文词法分析的研究概况 | 第51-53页 |
·句法分析 | 第53-58页 |
·句法分析的基本策略 | 第53-54页 |
·句法分析算法 | 第54-56页 |
·组块分析算法 | 第56-58页 |
·词语间潜在依存关系研究 | 第58-71页 |
·国内外研究现状 | 第58-59页 |
·本文工作 | 第59-71页 |
·词语的定量识别 | 第60页 |
·词语间的搭配关系、并列关系和从属关系 | 第60-61页 |
·相互依存的词语间的离散分布特性 | 第61-62页 |
·词语间的字串匹配 | 第62页 |
·词语间的依存强度 | 第62页 |
·构建词语间依存关系树 | 第62-65页 |
·更新依存关系树 | 第65-68页 |
·实验结果与分析 | 第68-71页 |
·本章小结 | 第71-73页 |
第三章 中文信息分类 | 第73-101页 |
·国内外相关研究现状 | 第73-88页 |
·信息分类问题与信息分类过程 | 第74-76页 |
·当前各类典型的分类方法 | 第76-85页 |
·Bayesian分类 | 第76-78页 |
·决策树分类法 | 第78-79页 |
·神经网络分类法 | 第79-80页 |
·基于关联规则的分类法 | 第80-81页 |
·其它分类法 | 第81-85页 |
·分类结果性能评估 | 第85-88页 |
·基于等效半径的信息分类算法 | 第88-100页 |
·提出问题 | 第88-89页 |
·分类模型 | 第89-90页 |
·分类算法SECTILE | 第90-95页 |
·分类模型的更新 | 第95页 |
·实验结果与分析 | 第95-100页 |
·实验内容与性能指标 | 第95-97页 |
·实验结果与性能分析 | 第97-100页 |
·本章小结 | 第100-101页 |
第四章 中文信息聚类 | 第101-126页 |
·国内外相关研究现状 | 第101-114页 |
·现有信息聚类算法分类 | 第101-108页 |
·基于层次的算法 | 第101-104页 |
·基于平面分割的算法 | 第104-105页 |
·基于密度的算法 | 第105-107页 |
·基于规则和模型的算法 | 第107页 |
·基于网格和子空间的算法 | 第107-108页 |
·聚类性能评估标准 | 第108-109页 |
·现有聚类算法比较 | 第109-114页 |
·基于子空间的无需输入参数的信息聚类算法 | 第114-125页 |
·本文提出的基于子空间的信息聚类算法与目前国内外相关工作的比较 | 第114-115页 |
·样本分布的性质 | 第115-116页 |
·基于子空间的无需输入参数的聚类算法 | 第116-122页 |
·算法的思路及与相关文献的比较 | 第116-117页 |
·算法说明 | 第117页 |
·进一步提高算法的性能 | 第117-119页 |
·基于子空间的聚类算法 | 第119-122页 |
·算法性能分析 | 第122-123页 |
·实验与结果分析 | 第123-125页 |
·实验内容与设置 | 第123-124页 |
·实验结果与性能分析 | 第124-125页 |
·本章小结 | 第125-126页 |
第五章 中文信息摘要 | 第126-144页 |
·国内外相关研究现状 | 第126-130页 |
·现有信息摘要算法 | 第126页 |
·现有摘要算法分类 | 第126-127页 |
·重要成分获取策略 | 第127-130页 |
·摘要结果性能评估 | 第130页 |
·基于子空间上语句聚类且自适应确定摘要长度的信息摘要算法 | 第130-142页 |
·基于主题聚类的自动摘要 | 第131-134页 |
·语句重要性评估规则 | 第131-132页 |
·基于主题聚类的自动摘要算法 | 第132-134页 |
·自适应确定摘要长度 | 第134-138页 |
·子主题分布的单调性 | 第134-137页 |
·自适应确定摘要长度算法 | 第137-138页 |
·摘要性能评估算法 | 第138-139页 |
·应用及性能评估 | 第139-142页 |
·实验内容与性能指标 | 第139-140页 |
·实验结果与性能分析 | 第140-142页 |
·本章小结 | 第142-144页 |
第六章 中文信息自动主题标引 | 第144-152页 |
·国内外相关研究现状 | 第145-149页 |
·现有的信息主题标引算法 | 第145-148页 |
·一个典型的全文自动标引系统的处理流程 | 第148-149页 |
·主题标引结果性能评估 | 第149页 |
·基于子主题聚类和词语问依存关系的自动主题标引算法 | 第149-151页 |
·本章小结 | 第151-152页 |
第七章 总结与展望 | 第152-156页 |
·本文取得的成果 | 第152-154页 |
·进一步的工作 | 第154-156页 |
参考文献 | 第156-182页 |
参与的科研项目与发表的论文 | 第182-184页 |
致谢 | 第184-185页 |