首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于朴素贝叶斯和BP神经网络的中文文本分类问题研究

基于朴素贝叶斯和BP神经网络的中文文本分类问题研究第1-60页
 摘要第4-6页
 ABSTRACT第6-11页
 第1章 绪论第11-19页
   ·选题的研究背景和意义第11-13页
   ·文本分类问题第13-15页
   ·现有文本分类系统的不足第15-16页
   ·论文的研究内容与思路第16-17页
   ·论文的组织和各章概要第17-19页
 第2章 中文文本预处理及中文分词第19-31页
   ·中文文本的基本结构和特点第19-20页
   ·中文语料库的建立和维护第20-22页
     ·现有语料库的问题第20-21页
     ·网页语料的获取第21-22页
   ·中文文本分词第22-26页
     ·机械分词方法第23页
     ·基于统计的分词方法第23-24页
     ·本文中文分词第24-26页
   ·中文文本特征表示第26-30页
     ·文本特征表示方法及其改进第26-30页
   ·本章小结第30-31页
 第3章 特征向量维数削减第31-37页
   ·特征选择第31-34页
     ·特征选择主要方法第31-33页
     ·本文特征选择方法第33-34页
   ·基于潜语义的特征提取第34-36页
     ·特征提取方法第34页
     ·潜在语义索引第34-36页
   ·本章小结第36-37页
 第4章 基于贝叶斯方法和BP神经网络中文文本分类研究第37-47页
   ·中本文分分类常用方法第37-39页
     ·朴素贝叶斯分类第37-39页
     ·朴素贝叶斯分类算法第39页
   ·神经网络的定义和特点第39-41页
     ·神经网络的概念第39页
     ·神经网络的性质和功能第39-41页
     ·误差反向传播的前馈网络(BP网络)第41页
   ·基于改进的BP网络的文本分类第41-46页
     ·算法主要思想第41页
     ·用VC维计算BP网络隐层神经元个数第41-42页
     ·激活函数的构造及BP网络的实现第42-45页
     ·算法分析第45-46页
   ·本章小结第46-47页
 第5章 系统总体设计及实验分析第47-54页
   ·CTCS总体设计和中文文本数据集第47-48页
   ·CTCS系统实现第48-53页
     ·文本预处理第48-51页
     ·训练和测试模块第51-53页
   ·中文文本实验结果与分析评价第53-54页
 第6章 总结与展望第54-56页
   ·工作总结第54页
   ·进一步的研究第54-56页
 参考文献第56-60页
中文文本分类问题和相关技术探讨第60-121页
 摘要第61-65页
 第1章 引言第65-71页
   ·数据挖掘概述第65-66页
   ·文本挖掘概述第66页
   ·文本分类的背景和意义第66-68页
   ·文本分类的目前研究状况第68-71页
 第2章 中文分词的主要方法和问题第71-82页
   ·中文分词的主要目标第71-72页
   ·分词的常用方法第72-77页
     ·基本的机械分词方法第72-74页
     ·基于统计的分词方法第74-75页
     ·神经网络的分词方法第75页
     ·基于期望的分词方法第75-76页
     ·基于理解的分词方法第76页
     ·全切分法第76页
     ·基于条件随机场的分词方法第76-77页
     ·专家系统分词方法第77页
   ·未登录词识别第77-78页
   ·歧义切分问题第78-79页
     ·交叉型歧义第78页
     ·组合型歧义第78-79页
   ·中文分词成果第79-80页
   ·现有分词方法的局限第80-82页
 第3章 文本的特征表示和提取的基本方法第82-92页
   ·特征选择和常用的方法第82-88页
     ·文档频率(Document Frequency,DF)第83页
     ·互信息(Mutual Information,MI)第83-84页
     ·信息增益(Information Gain,IG)第84-85页
     ·卡方估计(Chi-square Statistic,CHI)第85-86页
     ·文本证据权(Weight Of Evidence Text)第86-87页
     ·交叉熵(Cross Entropy,CE)第87页
     ·优势率(Odds Ratio,OR)第87-88页
   ·特征抽取和降维第88-92页
     ·主成分分析(Principal Component Analysis,PCA)第88-89页
     ·潜在语义索引(Latent Semantic Indexing,LSI)第89-90页
     ·非负矩阵分解(Non-negative Matrix Factorization,NMF)第90页
     ·词汇聚类方法(Term Clustering Method,TCM)第90-92页
 第4章 中文文本分类的常用方法第92-113页
   ·简单向量距离分类方法第92页
   ·贝叶斯分类方法第92-95页
     ·朴素贝叶斯分类方法(Naive Bayes Method,NBM)第93-94页
     ·贝叶斯网络分类方法(Bayes Net Method,BNM)第94-95页
     ·基于EM算法的朴素贝叶斯分类器(NBM Base on Expectation Maximization,EMNBM)第95页
   ·K-NN分类方法第95-96页
   ·决策树分类方法第96-97页
   ·粗糙集分类方法第97-98页
   ·SVM分类方法第98-101页
     ·VC维和结构风险最小化原理第99-100页
     ·支持向量机的二值分类第100-101页
   ·遗传算法分类方法第101-104页
     ·遗传算法的基本过程第102-103页
     ·遗传算法的优缺点分析第103-104页
   ·神经网络分类方法第104-108页
     ·神经网络的组成和分类模型第105-106页
     ·Hopfield模型第106页
     ·BP网络模型第106-107页
     ·径向基函数网络第107-108页
   ·基于模糊逻辑的分类方法第108-111页
     ·模糊集合定义及关系第109页
     ·模糊(Fuzzy)关系的表示第109-110页
     ·隶属度函数第110-111页
   ·各种分类性能的评定第111-113页
 第5章 结束语第113-114页
 参考文献第114-121页
Researching on Chinese Text ClaSSification Based on Naive Bayes[ind BP NeuraI Network第121-184页
 Abstract第122-126页
 Chapter 1 Forward第126-138页
   ·Selected Topic Research Backgrounds and Significance第126-130页
   ·Text Classification第130-132页
   ·The shortage of Text Classification-System第132-136页
   ·Research and Thought第136-137页
   ·The Organizations and Chapters Outline第137-138页
 Chapter 2 Chinesle text Pretretment Technology And Chinese Word Segmentation第138-154页
   ·The Basic Structure and Characteristics of Chinese Text第138-139页
   ·Establishment and Maintenance of Corpus第139-142页
     ·The Shortage of Corpus第139-141页
     ·Web Page pretreatment第141-142页
   ·Chinese Word Segmentation第142-148页
     ·The Segmentation Method Based On mechanical第143-144页
     ·The Segmentation Method Based On Statistics第144-146页
     ·Word Segmentation of This Paper第146-148页
   ·Chinese Text Feature Selection第148-152页
     ·The Feature Selection Method of This Paper第148-152页
   ·Summary of This Chapter第152-154页
 Chapter 3 Feature Dimension Reduction第154-162页
   ·Feature Selection第154-158页
     ·The Method of Feature Selection第154-157页
     ·The Feature Selection in This Paper第157-158页
   ·Feature Extraction Based on Latent Semantic Index第158-161页
     ·Feature Extraction Method第158页
     ·Feature Extraction Method of This Paper第158-161页
   ·Summary of This Chapter第161-162页
 Chapter 4 the Application of Neural Network in Chinese Text Classification第162-173页
   ·The Common Method of Chinese Text Classification第162-165页
     ·Naive Bayes Method, NBM第162-164页
     ·Naive Bayes Algorithm第164-165页
   ·The Definition and Characteristic of Neural Network第165-167页
     ·The Concept of Neural Network第165页
     ·Property and Function of Neural Network第165-167页
     ·BP Neural Network Model第167页
   ·Text Classification Based on Improved BP Neural Network第167-172页
     ·The Main idea of Algorithm第167-168页
     ·Used VC Dimension to Certain the Number of Neurons in Hidden Layer第168页
     ·Construction of Activation Function and Realization of BP Network第168-171页
     ·Analysis of Algorithms第171-172页
   ·Summary of This Chapter第172-173页
 Chapter 5 System Design and Experimental Analysis第173-182页
   ·The Overall Design of CTCS and Chinese Text Set第173-174页
   ·The Implementation of CTCS第174-180页
     ·Text Pretreatment第174-178页
     ·Train and Test Module第178-180页
   ·Experiment Results and Analysis第180-181页
   ·Summary of This Chapter第181-182页
 Chapter 6 Summary and Prospects第182-184页
   ·Summary第182页
   ·Further Research第182-184页
Discussing of Chinese Text Classification And Relevant Technology第184-253页
 Abstract第185-189页
 Chapter 1 Forward第189-196页
   ·the Overview of Data Mining第189-190页
   ·the Overview of Text Mining第190-191页
   ·Background and Meaning of Text Classification第191-193页
   ·Research state of Text Classification at Present第193-196页
 Chapter 2 the Main Technology and Question of Chinese Word Segmentation第196-211页
   ·The Aim of Chinese Text Segmentation第196-198页
   ·The Common Method of Chinese Text Segmentation第198-204页
     ·The Segmentation Method Based On mechanical第198-200页
     ·The Segmentation Method Based On Statistics第200-201页
     ·The Segmentation Method Based On Neural Network第201-202页
     ·The Segmentation Method Based On expectat i on第202页
     ·The Segmentation Method Based On Understanding第202-203页
     ·The Total Segmentation第203页
     ·The Segmentation Method Based On Conditional Random Fields第203-204页
     ·The Segmentation Method Based On Expert System第204页
   ·The Discernable of Not Logged Word第204-205页
   ·Ambiguous Segmentation Questions第205-207页
     ·Intersection Ambiguous第205-206页
     ·Combination Ambiguous第206-207页
   ·Chinese Word Segmentation Achievements第207-209页
   ·Limitations of Segmentation Method第209-211页
 Chapter 3 the Based Method of Text Feature Representation and Extraction第211-224页
   ·Feature Selection and the Common Method第211-219页
     ·Document Frequency.DF第212-213页
     ·Mutual Information,MI第213-215页
     ·Information Gain,IG第215页
     ·Chi-square Statistic,CHI第215-217页
     ·Weight Of Evidence Text,WET第217-218页
     ·Cross Entropy,CE第218页
     ·Odds Ratio,OR第218-219页
   ·Feature Extraction and Dimension Reduction第219-224页
     ·Principal Component Analysis,PCA第220-221页
     ·Latent Semantic Indexing,LSI第221-222页
     ·Non-negative Matrix Factorization,NMF第222-223页
     ·Term Clustering Method,TCM第223-224页
 Chapter 4 the Common Method of Text Classification第224-251页
   ·Simple Vector Distance Classification Method第224-225页
   ·Beyes Classification Method第225-229页
     ·Naive Bayes Method, NBM第225-227页
     ·Bayes Net Method, BNM第227-228页
     ·NBM Base on Expectation Maximization, EMNBM第228-229页
   ·K-NN Classification Method第229-230页
   ·Decision Tree Classification method第230-231页
   ·Rough Sets Classification Method第231-233页
   ·SVM Method第233-237页
     ·VC structural risk minimization principle第234-235页
     ·Binary Classification of SVM第235-237页
   ·Genetic Algorithm Classification Method第237-240页
     ·The Basic Process of Genetic Algorithm第238-239页
     ·Analysis on the Advantages and Disadvantages in GA第239-240页
   ·Neural Network Classification Method第240-246页
     ·The composition of neural network第242页
     ·Hopfield Model第242-243页
     ·BP Net Model第243-244页
     ·Raidal Basis Function Net第244-246页
   ·Classification Based on the of Fuzzy Logic第246-248页
     ·The Definition and Relation of Fuzzy Set第246-247页
     ·The Expression of Fuzzy Relation第247-248页
     ·The Membership Function第248页
   ·The Performance Appraisal of Classifier第248-251页
 Chapter 5 Conclusion第251-253页
2005-2008硕士研究生期间发表的论文(第一作者)第253-254页
致谢第254页

论文共254页,点击 下载论文
上一篇:IPv6技术及其在校园网改进中的应用
下一篇:课程教学网络互动系统的设计与实现