Acknowledgements | 第4-5页 |
Abstract | 第5页 |
摘要 | 第6-11页 |
List of Abbreviations | 第11-14页 |
1. INTRODUCTION | 第14-19页 |
1.1 Introduction | 第14-15页 |
1.2 Motivation | 第15-16页 |
1.3 Problem Statement | 第16页 |
1.4 Research Questions | 第16-17页 |
1.5 Significance of Study | 第17-18页 |
1.6 Thesis Outline | 第18-19页 |
2. BACKGROUND AND RELATED WORK | 第19-35页 |
2.1 Introduction | 第19页 |
2.2 An Overview of Text Mining | 第19-23页 |
2.2.1 Text Mining Processes | 第20-21页 |
2.2.2 Data mining (DM) Techniques for Text | 第21-22页 |
2.2.3 Information Extraction (IE) | 第22-23页 |
2.3 The Social Media | 第23-25页 |
2.3.1 Microblogs | 第23-24页 |
2.3.2 Twitter | 第24-25页 |
2.4 Related Works | 第25-33页 |
2.4.1 Introduction to Event Detection | 第25-26页 |
2.4.2 Characterization of Event Detection as Observed on Microblogs | 第26-27页 |
2.4.3 Large Scale Event Detection from Microblogs | 第27-29页 |
2.4.4 Small Scale Events Detection from Microblogs | 第29-31页 |
2.4.5 Information Extraction from Microblogs | 第31-33页 |
2.5 Detecting Road Traffic accidents from Microblogs | 第33-34页 |
2.6 Summary | 第34-35页 |
3. METHODOLOGY | 第35-66页 |
3.1 Introduction | 第35页 |
3.2 Conceptual Framework | 第35-36页 |
3.3 Data Acquisition | 第36-42页 |
3.3.1 Data Collection using Twitter Streaming and Search API | 第37页 |
3.3.2 Query Keywords Filtering | 第37-38页 |
3.3.3 Study Area | 第38-41页 |
3.3.4 Dataset | 第41-42页 |
3.4 Road Traffic Accidents vs Non-road Traffic Classification | 第42-55页 |
3.4.1 Preprocessing Phase 1: Cleaning Tweets and Filtering | 第43-44页 |
3.4.2 Preprocessing Phase 2: Feature Vectors Extraction | 第44-46页 |
3.4.3 Training the SVM Model | 第46-48页 |
3.4.4 Experiments and Results | 第48-49页 |
3.4.5 Evaluation of Classifier | 第49-54页 |
3.4.6 Discussion | 第54-55页 |
3.5 Traffic Accident Location Extraction | 第55-64页 |
3.5.1 Introduction to Named Entity Extraction | 第55-56页 |
3.5.2 Syntactic Analysis | 第56-58页 |
3.5.3 Proposed Noun Phrase with N-gram Pattern Matching for Location Extraction | 第58-60页 |
3.5.4 Noun Phrase Extraction | 第60-61页 |
3.5.5 Filters: Preposition and Regular Expressions | 第61页 |
3.5.6 N-gram Location Matching | 第61-62页 |
3.5.7 Geographical Name Matching | 第62-63页 |
3.5.8 Experiment and Results | 第63-64页 |
3.6 Summary | 第64-66页 |
4.WEB APPLICATION PROTOTYPE FOR TRAFFIC ACCIDENT DETECTION SYSTEM | 第66-81页 |
4.1 Introduction | 第66页 |
4.2 Requirement Analysis | 第66-69页 |
4.2.1 Functional Requirements for the Traffic Accident Detection System (TADS) | 第66-67页 |
4.2.2 Use cases Diagrams | 第67页 |
4.2.3 Non-functional Requirements | 第67-68页 |
4.2.4 System Environment Requirements | 第68-69页 |
4.2.5 Constraints | 第69页 |
4.3 System Design | 第69-74页 |
4.3.0 Activity Diagrams | 第69-71页 |
4.3.1 Sequence Diagram | 第71-72页 |
4.3.2 Class Diagram | 第72-73页 |
4.3.3 Database Design | 第73-74页 |
4.4 Implementation | 第74-78页 |
4.4.1 Backend Implementation | 第75-77页 |
4.4.2 Front End | 第77-78页 |
4.5 System Testing | 第78-80页 |
4.6 Summary | 第80-81页 |
5. CONCLUSION AND FUTURE WORK | 第81-85页 |
References | 第85-90页 |
Appendices | 第90-102页 |
Appendix A: Tweet JSON Metadata | 第90-92页 |
Appendix B: Sample Codes: Back End | 第92-98页 |
Appendix C: Sample Codes: Front End | 第98-101页 |
Appendix D: Snapshots of TADS | 第101-102页 |