摘要 | 第4-5页 |
ABSTRACT | 第5-6页 |
Chapter 1 Introduction | 第9-17页 |
1.1 Motivation | 第9-10页 |
1.2 Background | 第10-13页 |
1.3 Definition of problems | 第13-14页 |
1.3.1 Human segmentation of speech | 第13页 |
1.3.2 HMM-based speech segmentation | 第13页 |
1.3.3 Drawbacks of HMM-based segmentation | 第13-14页 |
1.4 Purpose of this research | 第14-16页 |
1.5 Thesis structure | 第16-17页 |
2 Adaptive Neuro Fuzzy Inference System | 第17-19页 |
2.1 Basic concept | 第17-19页 |
3 The proposed method | 第19-23页 |
3.1 Outline of the proposed method | 第19页 |
3.2 First step: HMM-based forced alignment | 第19-20页 |
3.3 Second step: ANFIS-based refinement | 第20-23页 |
4 Database | 第23-26页 |
4.1 TIMIT database | 第23-24页 |
4.2 Phoneme mapping | 第24页 |
4.3 Evaluation | 第24-26页 |
5 Experiments for segmentation | 第26-36页 |
5.1 The baseline system | 第26-30页 |
5.1.1 Preprocessing for using TIMIT database | 第26-27页 |
5.1.2 Description for experiments | 第27页 |
5.1.3 Feature extraction | 第27-29页 |
5.1.4 Conclusion | 第29-30页 |
5.2 Refinement by ANFIS | 第30-36页 |
5.2.1 Data preparation | 第30-31页 |
5.2.2 Features extraction | 第31页 |
5.2.3 ANFIS training | 第31-32页 |
5.2.4 Results | 第32-36页 |
6 Discussion | 第36-38页 |
7 Conclusion and future work | 第38-40页 |
7.1 Summary | 第38页 |
7.2 Future work | 第38-39页 |
7.3 Contribution | 第39-40页 |
Acknowledgements | 第40-41页 |
Bibliography | 第41-44页 |
Publications | 第44-45页 |