首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文信息处理中若干关键技术的研究

目录第1-7页
图表目录:第7-8页
摘要第8-11页
ABSTRACT第11-14页
第一章 引言第14-26页
   ·中文信息处理研究概况第15-20页
     ·学习和理论探索的萌芽阶段第15页
     ·汉字信息处理为主的早期阶段第15-16页
     ·字、词等表层处理为特征的初级阶段第16-17页
     ·句法和语义等深层处理为代表的中期阶段第17页
     ·语料库统计方法兴起的近期阶段第17-18页
     ·以INTERNET为主要应用对象、大规模真实文本、智能信息访问的现阶段第18-20页
   ·中文信息处理的难点第20页
   ·中文信息处理研究中的主要问题第20-21页
   ·中文信息处理的需求第21-23页
   ·本文研究工作的主要内容及贡献第23-25页
   ·本文的组织结构第25-26页
第二章 中文信息处理基础第26-73页
   ·中文信息处理基本概念第26-27页
   ·信息处理模型第27-28页
   ·中文切词第28-35页
     ·中文文本信息切词中的问题第29-30页
     ·中文文本信息切词的主要方法第30-31页
     ·改进的N-GRAM切词算法第31-35页
       ·对N-gram切词算法进行改进第31-33页
       ·实验与性能分析第33-35页
   ·属性选择第35-49页
     ·现有的属性选择方法第35-39页
       ·信息增量(Information Gain)第36页
       ·互信息(Mutual Information)第36页
       ·X~2统计第36-37页
       ·交叉熵(Cross Entropy)第37页
       ·证据权值(Weight of Evidence)第37页
       ·Fisher判别式第37-38页
       ·文档属性选择中的概率值估算第38-39页
     ·改进基于概率统计的属性选择算法第39-49页
       ·基于互依赖的属性选择第40-44页
       ·基于字串匹配度的属性选择第44-45页
       ·基于分布特性和位置特性的属性选择第45-46页
       ·基于统计的属性选择扩展算法第46-47页
       ·实验与性能分析第47-49页
   ·词法分析第49-53页
     ·中文词法分析的难点第49-51页
     ·中文词法分析的研究概况第51-53页
   ·句法分析第53-58页
     ·句法分析的基本策略第53-54页
     ·句法分析算法第54-56页
     ·组块分析算法第56-58页
   ·词语间潜在依存关系研究第58-71页
     ·国内外研究现状第58-59页
     ·本文工作第59-71页
       ·词语的定量识别第60页
       ·词语间的搭配关系、并列关系和从属关系第60-61页
       ·相互依存的词语间的离散分布特性第61-62页
       ·词语间的字串匹配第62页
       ·词语间的依存强度第62页
       ·构建词语间依存关系树第62-65页
       ·更新依存关系树第65-68页
       ·实验结果与分析第68-71页
   ·本章小结第71-73页
第三章 中文信息分类第73-101页
   ·国内外相关研究现状第73-88页
     ·信息分类问题与信息分类过程第74-76页
     ·当前各类典型的分类方法第76-85页
       ·Bayesian分类第76-78页
       ·决策树分类法第78-79页
       ·神经网络分类法第79-80页
       ·基于关联规则的分类法第80-81页
       ·其它分类法第81-85页
     ·分类结果性能评估第85-88页
   ·基于等效半径的信息分类算法第88-100页
     ·提出问题第88-89页
     ·分类模型第89-90页
     ·分类算法SECTILE第90-95页
     ·分类模型的更新第95页
     ·实验结果与分析第95-100页
       ·实验内容与性能指标第95-97页
       ·实验结果与性能分析第97-100页
   ·本章小结第100-101页
第四章 中文信息聚类第101-126页
   ·国内外相关研究现状第101-114页
     ·现有信息聚类算法分类第101-108页
       ·基于层次的算法第101-104页
       ·基于平面分割的算法第104-105页
       ·基于密度的算法第105-107页
       ·基于规则和模型的算法第107页
       ·基于网格和子空间的算法第107-108页
     ·聚类性能评估标准第108-109页
     ·现有聚类算法比较第109-114页
   ·基于子空间的无需输入参数的信息聚类算法第114-125页
     ·本文提出的基于子空间的信息聚类算法与目前国内外相关工作的比较第114-115页
     ·样本分布的性质第115-116页
     ·基于子空间的无需输入参数的聚类算法第116-122页
       ·算法的思路及与相关文献的比较第116-117页
       ·算法说明第117页
       ·进一步提高算法的性能第117-119页
       ·基于子空间的聚类算法第119-122页
     ·算法性能分析第122-123页
     ·实验与结果分析第123-125页
       ·实验内容与设置第123-124页
       ·实验结果与性能分析第124-125页
   ·本章小结第125-126页
第五章 中文信息摘要第126-144页
   ·国内外相关研究现状第126-130页
     ·现有信息摘要算法第126页
     ·现有摘要算法分类第126-127页
     ·重要成分获取策略第127-130页
     ·摘要结果性能评估第130页
   ·基于子空间上语句聚类且自适应确定摘要长度的信息摘要算法第130-142页
     ·基于主题聚类的自动摘要第131-134页
       ·语句重要性评估规则第131-132页
       ·基于主题聚类的自动摘要算法第132-134页
     ·自适应确定摘要长度第134-138页
       ·子主题分布的单调性第134-137页
       ·自适应确定摘要长度算法第137-138页
     ·摘要性能评估算法第138-139页
     ·应用及性能评估第139-142页
       ·实验内容与性能指标第139-140页
       ·实验结果与性能分析第140-142页
   ·本章小结第142-144页
第六章 中文信息自动主题标引第144-152页
   ·国内外相关研究现状第145-149页
     ·现有的信息主题标引算法第145-148页
     ·一个典型的全文自动标引系统的处理流程第148-149页
     ·主题标引结果性能评估第149页
   ·基于子主题聚类和词语问依存关系的自动主题标引算法第149-151页
   ·本章小结第151-152页
第七章 总结与展望第152-156页
   ·本文取得的成果第152-154页
   ·进一步的工作第154-156页
参考文献第156-182页
参与的科研项目与发表的论文第182-184页
致谢第184-185页

论文共185页,点击 下载论文
上一篇:渭南市农业产业化与农村经济发展
下一篇:经直肠前列腺穿刺活检疼痛及预防术后感染的临床研究