Acknowledgements | 第4-5页 |
Abstract | 第5页 |
Acronyms | 第10-11页 |
1 INTRODUCTION | 第11-16页 |
1.1 BACKGROUND | 第11-12页 |
1.2 MOTIVATION | 第12-13页 |
1.3 PROBLEM STATEMENT | 第13页 |
1.4 RESEARCH OBJECTIVES | 第13-14页 |
1.5 CONTRIBUTIONS | 第14-15页 |
1.6 OUTLINE | 第15-16页 |
2 LITERATURE SURVEY | 第16-25页 |
2.1 DATA MINING TECHNOLOGIES | 第16-22页 |
2.1.1 Statistics methods | 第17-18页 |
2.1.2 Knowledge Discovery (KDD) | 第18-19页 |
2.1.3 Text Mining Techniques | 第19-21页 |
2.1.4 UMLS Metathesaurus | 第21-22页 |
2.2 NAMED ENTITY RECOGNITION (NER) | 第22页 |
2.3 KEY WORD EXTRACTION (KEA) | 第22-23页 |
2.4 LATENT DIRICHLET ALLOCATION (LDA) | 第23页 |
2.5 SUMMARY | 第23-25页 |
3 METHODOLOGY | 第25-53页 |
3.1 DATA MINING AND PREPROCESSING | 第25-31页 |
3.1.1 General techniques used for web scraping | 第26-31页 |
3.2 NAMED ENTITY EXTRACTION | 第31-37页 |
3.2.1 Gazetteer Based Named Entity Extraction | 第31-33页 |
3.2.2 Using Aho-Corasick Algorithm to match entities | 第33-34页 |
3.2.3 Evaluation of Gazetteer Based Named Entity Recognition | 第34-37页 |
3.3 KEYWORD GENERATION USING KEA | 第37-41页 |
3.3.1 Preparation of Corpus for KEA | 第37页 |
3.3.2 Keyword Extraction using KEA | 第37-39页 |
3.3.3 Performance and Evaluation of KEA on cancer stories | 第39-41页 |
3.4 DOCUMENTS EXPLORATION AND TOPIC MODELLING | 第41-52页 |
3.4.1 Approximating the number of topics in the corpus | 第42-44页 |
3.4.2 LDA Topic modelling using KEA generated keyphrases | 第44-50页 |
3.4.3 Stories similarity Calculation | 第50-52页 |
3.5 SUMMARY | 第52-53页 |
4 REQUIREMENTS SPECIFICATION | 第53-67页 |
4.1 INTRODUCTION | 第53页 |
4.2 GENERAL DESCRIPTION | 第53-56页 |
4.2.1 Product Perspective | 第53-54页 |
4.2.2 Product Functions | 第54-55页 |
4.2.3 Product Constraints | 第55页 |
4.2.4 Assumptions and dependencies | 第55-56页 |
4.3 SPECIFIC REQUIREMENTS | 第56-66页 |
4.3.1 External Interface Requirements | 第56页 |
4.3.2 User Characteristics | 第56-57页 |
4.3.3 Functional Requirements | 第57-65页 |
4.3.4 Non-Functional Requirements | 第65-66页 |
4.4 SUMMARY | 第66-67页 |
5 SYSTEM DESIGN | 第67-83页 |
5.1 ARCHITECTURE | 第67-73页 |
5.1.1 CSRS Modules | 第68-70页 |
5.1.2 Logical Database Requirements | 第70-73页 |
5.2 SYSTEM DETAILED DESIGN | 第73-79页 |
5.2.1 Login | 第73-74页 |
5.2.2 Story Module | 第74-75页 |
5.2.3 Fetching similar stories | 第75-77页 |
5.2.4 Search Module | 第77-79页 |
5.3 CLASSES AND OBJECT | 第79-82页 |
5.3.1 Stories Controller Classes | 第79-81页 |
5.3.2 Users Controller Classes | 第81-82页 |
5.4 SUMMARY | 第82-83页 |
6 IMPLEMENTATION | 第83-91页 |
6.1 SOFTWARE DEVELOPMENT TOOLS AND LANGUAGES | 第83页 |
6.2 INTERFACES | 第83-87页 |
6.2.1 Listing stories Lists all the stories from the database, it is the first page that loads stories and users are able to browse with the help of pagination | 第83-84页 |
6.2.2 Read Story Interface | 第84页 |
6.2.3 Edit Stories Interface | 第84页 |
6.2.4 Change Password Interface | 第84-85页 |
6.2.5 Manage Stories Interface | 第85-86页 |
6.2.6 Home page | 第86页 |
6.2.7 Search Story Page | 第86-87页 |
6.3 SOFTWARE TESTING | 第87-91页 |
6.3.1 Testing process | 第87-91页 |
CONCLUSION | 第91-93页 |
FUTURE WORK | 第93-94页 |
REFERENCES | 第94-97页 |
APPENDIX | 第97-106页 |