首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于潜语义与遗传算法的中文文本特征获取方法研究

基于潜语义与遗传算法的中文文本特征 获取方法研究第1-44页
 摘要第5-7页
 第一章 引言第7-9页
   ·研究背景第7页
   ·研究内容第7-8页
   ·论文组织结构第8-9页
 第二章 中文文本的预处理第9-13页
   ·中文分词第9-11页
     ·中文分词概述第9-10页
     ·改进分词算法过程的描述第10页
     ·歧义词的消解第10-11页
     ·未登录词处理第11页
   ·文本禁用词的处理第11-13页
 第三章 基于潜语义分析的文本特征获取方法第13-19页
   ·文本特征获取的基本概念第13页
   ·潜在语义分析的实现第13-17页
     ·潜在语义分析的基本思想第13-15页
     ·词-文本矩阵第15页
     ·权重的计算及改进第15-16页
     ·奇异值分解第16页
     ·降维因子K值的选取第16-17页
     ·查询项的生成第17页
   ·基于潜语义的文本特征获取及检索的算法描述第17-19页
 第四章 基于遗传算法的文本特征获取方法第19-31页
   ·遗传算法概述第19页
   ·遗传算法分析及改进第19-28页
     ·遗传算法的基本操作第19-20页
     ·编码分析第20-21页
     ·适应度函数第21-23页
     ·选择算子第23-24页
     ·交叉算子第24-26页
     ·变异算子第26-27页
     ·性能评价第27-28页
   ·基于遗传算法的文本特征获取第28-31页
 第五章 实验与结果第31-37页
   ·基于潜语义分析特征获取实验与分析第31-34页
     ·基于潜在语义分析的文本检索系统结构图第31页
     ·实验使用的样本第31页
     ·实验结果第31-34页
   ·基于遗传算法获取文本特征的实验第34-37页
     ·改进遗传算法的实验分析第34-36页
     ·基于遗传算法获取文本特征的流程图第36-37页
 第六章 结束语及未来工作展望第37-38页
 致谢第38-39页
 参考文献第39-44页
Research of Chinese Text Feature Gain Method Based On Latent Semantic Analysis and Genetic Algorithm第44-84页
 Abstract第45-49页
 Chapter 1 Introduction第49-51页
   ·Background第49页
   ·The Content of Study第49-51页
 Chapter 2 the Pretreatment of Chinese Text第51-56页
   ·The Chinese Word Segmentation第51-54页
     ·Outlined Chinese Words第51-52页
     ·Improved Segmentation Algorithm Described第52-53页
     ·Ambiguity Resolution第53-54页
     ·Unknown Word Processing第54页
   ·Processing to Banned Words of the Text第54-56页
 Chapter 3 Text Feature Gain Based on Latent Semantic Analysis第56-62页
   ·Features Gain of the Basic Concepts第56-57页
   ·Latent Semantic Analysis for the Realization第57-61页
     ·the Basic Idea of Latent Semantic Analysis第57-58页
     ·Word-text Matrix of the Generation第58页
     ·Calculating Weights第58-59页
     ·Singular Value Decomposition, SVD第59-60页
     ·Reduction Dimensionality Factor of the K-selected第60页
     ·Generation Inquiries Items第60-61页
   ·Based on the Latent Semantic Text Feature Gain and Retrieval Algorithm第61-62页
 Chapter 4 Feature Gain Based on Genetic Algorithm第62-76页
   ·Genetic Algorithm Outlined第62-63页
   ·Analysis of the Main Elements of GA and Improved第63-73页
     ·GA Basic Operation第63页
     ·Analysis of Genetic Coding第63-65页
     ·Fitness Function第65-67页
     ·Selection Operator第67-68页
     ·Crossover Operator第68-70页
     ·Mutation Operator第70-72页
     ·Performance Evaluation第72-73页
   ·Based on Genetic Algorithm of the Text Gained第73-76页
 Chapter 5 Experimental Results第76-82页
   ·Based on Latent Semantic Analysis of Feature Gain and Analysis of Experimental第76-79页
     ·Based on Latent Semantic Analysis Text Retrieval System第76页
     ·the Samples Used of Experimental第76-77页
     ·Experimental Results第77-79页
   ·the Experiment Based on Genetic Algorithm to the Text Feature Gain第79-82页
     ·Improved Genetic Algorithms Experimental Analysis第79-81页
     ·the Flowchart of Text Feature Based on Genetic Algorithm第81-82页
 Chapter 6 Conclusions and Future Prospects第82-83页
 Thanks第83-84页
中文文本挖掘及其相关技术综述第84-130页
 第一章 文本挖掘概述第87-89页
   ·引言第87页
   ·文本挖掘的发展简史与现状第87页
   ·文本挖掘的定义第87-88页
   ·文本挖掘的过程第88-89页
 第二章 中文分词第89-96页
   ·中文分词技术概述第89页
   ·常用的中文分词算法第89-90页
     ·基于机械式的分词方法第89-90页
     ·基于理解的分词方法第90页
     ·基于统计的分词方法第90页
   ·自动分词系统的评价准则第90-91页
   ·典型的中文自动分词系统第91-93页
   ·中文分词面临的问题第93-96页
 第三章 文本的特征表示第96-103页
   ·经典的文本特征表示第96-99页
     ·布尔模型第96页
     ·向量空间模型第96-97页
     ·概率模型第97-98页
     ·模糊模型第98页
     ·传统模型的优缺点第98-99页
   ·潜在语义分析(Latent Semantic Analysis,LSA)第99-103页
     ·潜在语义分析概述(Latent SemanticAnalysis,LSA)第99-100页
     ·潜在语义的理论基础第100-103页
 第四章 特征获取第103-117页
   ·文本特征获取的基本概念第103页
   ·典型的特征获取方法及改进第103-108页
     ·基于评估函数的特征获取方法第103-107页
     ·基于特征相关性的特征获取方法第107页
     ·基于语义理解的特征获取方法第107-108页
   ·其它的特征获取方法第108-117页
     ·模拟退火算法第108-109页
     ·Tabu搜索算法第109-110页
     ·遗传算法第110-117页
 第五章 文本挖掘的分析技术第117-121页
   ·文本检索第117页
   ·文本分类第117-118页
   ·文本聚类第118-119页
   ·文本关联分析第119-121页
 第六章 中文文本挖掘的性能评价第121-122页
   ·评价的基本概念第121页
   ·文本挖掘系统的评估方法第121-122页
     ·查全率和查准率第121页
     ·冗余度和放射性第121页
     ·双目失明测试第121-122页
 第七章 结束语第122-123页
 参考文献第123-130页
A Survey of Chinese Text Mining and Related Technology第130-187页
 Chapter 1 Outline Text Mining第133-136页
   ·Introduction第133页
   ·Text Mining History and the Present Situation第133-134页
   ·Text Mining第134-135页
   ·The Process of Text Mining第135-136页
 Chapter 2 Chinese Segmentation第136-147页
   ·Chinese Word Segmentation Techniques Outlined第136页
   ·Commonly Used Chinese Word Segmentation Algorithm第136-139页
     ·Based on a Mechanical Method of Segmentation Method第137-138页
     ·Based on the Understanding of Segmentation第138页
     ·Based on the Statistical Method第138-139页
   ·the Evaluation Criteria for Automatic Segmentation System第139-140页
   ·Typical Chinese Automatic Segmentation System第140-144页
   ·the problems to Chinese Word Segmentation第144-147页
 Chapter 3 Text Characteristic Expresses第147-157页
   ·Classic Text Characteristic Expresses第147-152页
     ·Boolean Model第147-148页
     ·Vector Space Model(VSM)第148-149页
     ·Probability Model第149-150页
     ·Fuzzy Retrieval Model(Fuzzy Model)第150页
     ·the Advantages and Disadvantages of the Traditional Model第150-152页
   ·Latent Semantic Analysis(LSA)第152-157页
     ·Latent Semantic Analysis Outlined第152-153页
     ·Latent Semantic Theoretical Foundation第153-157页
 Chapter 4 Features Gain第157-179页
   ·Features Gain to the Basic Concepts第157-158页
   ·Typical Methods and Improve Gain to Feature第158-164页
     ·Based on an Assessment of the Function of Feature Gain第158-163页
     ·Based on the Relevance of the Characteristics of Acquisition第163页
     ·Based on Semantic Understanding of the Gain Method第163-164页
   ·Other Methods of Obtaining Feature第164-179页
     ·Simulated Annealing Alogrithm第165-166页
     ·Tabu Search Algorithm第166-168页
     ·Genetic Algorithm(GA)第168-179页
 Chapter 5 Text Mining Technology第179-185页
   ·Text Retrieval第179-180页
   ·Text Categorization第180-181页
   ·Text Clustering第181-183页
   ·the Text Associated Data Analysis第183-185页
 Chapter 6 Text Mining Performance Evaluation第185-187页
   ·Evaluate the Basic Concept第185页
   ·Text Mining System of Assessment Methods第185-187页
     ·Recall and Precision第185-186页
     ·Redundant and Radioactive第186页
     ·Blind Test第186-187页
 Chapter 7 Conclusion第187页

论文共187页,点击 下载论文
上一篇:基于统计和规则混合策略的中国人名识别研究
下一篇:基于时序逻辑的关联规则挖掘方法的研究