摘要 | 第4-5页 |
Abstract | 第5页 |
CHAPTER 1 INTRODUCTION | 第9-14页 |
1.1 Background and Significance | 第9-11页 |
1.2 Research status | 第11-12页 |
1.3 The Main Work and Organizational Structure of the Paper | 第12-14页 |
1.3.1 The Main Contents of the Paper | 第12-13页 |
1.3.2 The Paper structure | 第13-14页 |
CHAPTER 2 INTRODUCTION OF TEXT CLASSIFICATION ANDRELATED TECHNOLOGIES | 第14-24页 |
2.1 Text Classification Process | 第14-15页 |
2.2 Pretreatment Text | 第15-17页 |
2.3 Representation of the text | 第17-18页 |
2.3.1 Vector Space Model | 第17页 |
2.3.2 Feature Weight Calculation | 第17-18页 |
2.4 Text Feature Selection | 第18页 |
2.5 Document Frequency | 第18-20页 |
2.5.1 Information Gain | 第19页 |
2.5.2 Expected Cross | 第19-20页 |
2.6 Classification Algorithm | 第20-22页 |
2.6.1 Decision Tree Classification Algorithm | 第20页 |
2.6.2 K- neighborhood Classification Algorithm | 第20-21页 |
2.6.3 Naive Bayesian classification algorithm | 第21-22页 |
2.6.4 SVM algorithm | 第22页 |
2.7 Macro Performance Evaluation Method | 第22-23页 |
2.8 Summary | 第23-24页 |
CHAPTER 3 SYSTEM REQUIREMENTS ANALYSIS | 第24-28页 |
3.1 User Requirements Analysis | 第24-25页 |
3.2 System Goals | 第25-27页 |
3.3 System Development and Runtime Environment | 第27页 |
3.4 Summary | 第27-28页 |
CHAPTER 4 SYSTEM DESIGN | 第28-36页 |
4.1 The Overall Design of the System | 第28-30页 |
4.2 Text Preprocessing Module | 第30-32页 |
4.2.1 The Removal of Stop Words Module Design | 第30页 |
4.2.2 Feature Selection Module Design | 第30-31页 |
4.2.3 Space Vector Representation Module Design | 第31-32页 |
4.3 K-Neighbor Classification Algorithm | 第32-33页 |
4.4 Naive Bayes Classifier | 第33-34页 |
4.4.1 Gaussian Naive Bayes | 第33页 |
4.4.2 Multinomial Naive Bayes | 第33-34页 |
4.4.3 Bernoulli Naive Bayes | 第34页 |
4.5 Performance Evaluation Design | 第34-35页 |
4.6 Summary | 第35-36页 |
CHAPTER 5 SYSTEM IMPLEMENTATION | 第36-47页 |
5.1 Text Processing | 第36-38页 |
5.2 Text Representation | 第38-39页 |
5.3 Feature Selection | 第39-40页 |
5.3.1 DF Feature Selection | 第39-40页 |
5.3.2 2c Statistics Feature Selection | 第40页 |
5.4 K-near Classifier | 第40-42页 |
5.5 Naive Bayes Classifier | 第42页 |
5.6 Achieve Performance Evaluation Module | 第42-43页 |
5.7 Text Classification System Interface Achieve | 第43-46页 |
5.8 Summary | 第46-47页 |
CHAPTER 6 EXPERIMENTAL RESULTS | 第47-55页 |
6.1 K-neighborhood Classifier Results | 第47-50页 |
6.2 Bayesian Classifier Results | 第50-53页 |
6.2.1 Bernoulli Model Results | 第50-51页 |
6.2.2 Polynomial Model Results | 第51-53页 |
6.3 Experimental Results: Comparison between Different Classification Models | 第53-54页 |
6.4 Summary | 第54-55页 |
CHAPTER 7 SUMMARY AND OUTLOOK | 第55-57页 |
7.1 Summary | 第55-56页 |
7.2 Further Studies | 第56-57页 |
Acknowledgements | 第57-58页 |
Reference | 第58-60页 |