Declaration | 第2-3页 |
英文摘要 | 第3页 |
Acknowledgments | 第5-11页 |
List of Figures | 第11-12页 |
List of Tables | 第12-13页 |
Chapter 1. Introduction | 第13-21页 |
1.1 Motivation | 第13-15页 |
1.2 Discussions on KE methods | 第15-17页 |
1.3 Nature of the research | 第17页 |
1.4 Possible contribution | 第17-18页 |
1.5 Structure | 第18-21页 |
Chapter 2. Information retrieval: the ultimate goal | 第21-52页 |
2.1 Introduction | 第21页 |
2.2 Theories and practices | 第21-36页 |
2.2.1 Traditional methods | 第23-27页 |
2.2.1.1 Free text string searching | 第23-25页 |
2.2.1.2 Indexing | 第25-27页 |
2.2.2 Advanced strategies | 第27-36页 |
2.2.2.1 The Vector Space Model | 第27-31页 |
2.2.2.2 Probabilistic approaches | 第31-33页 |
2.2.2.3 Document classification and clustering | 第33-36页 |
2.3 Linguistic approaches to IR | 第36-50页 |
2.3.1 Problems with statistical methods | 第36-37页 |
2.3.2 Non-statistical methods | 第37-41页 |
2.3.3 Phrase indexing | 第41-43页 |
2.3.4 Nominal phrases | 第43-50页 |
2.3.4.1 Significance | 第43-47页 |
2.3.4.2 Phrase detection and extraction | 第47-48页 |
2.3.4.3 Base NP | 第48-50页 |
2.4 Summary | 第50-52页 |
Chapter 3. Web search and relevance: trigger and rationale | 第52-73页 |
3.1 Web search: a good landing for IR discussions | 第52-58页 |
3.1.1 The ”hypertext challenge”? | 第52-56页 |
3.1.2 Search engines: performance and problems | 第56-58页 |
3.2 IR and relevance | 第58-60页 |
3.3 Relevance studies | 第60-65页 |
3.3.1 Anatomy of the concept | 第60-61页 |
3.3.2 Relevance assessment variation | 第61-62页 |
3.3.3 System-oriented relevance | 第62-64页 |
3.3.4 User-oriented relevance | 第64-65页 |
3.4 System-oriented definitions of relevance | 第65-68页 |
3.5 Discussion and re-definition | 第68-73页 |
Chapter 4. Keyword extraction: methodology and practices | 第73-87页 |
4.1 KE: a good aid for IR | 第73-74页 |
4.2 What is ”topic”? | 第74-75页 |
4.3 KE: a review | 第75-85页 |
4.3.1 Text segmentation and topic extraction | 第76-77页 |
4.3.2 Basic KE methods | 第77-79页 |
4.3.3 Studies and practice in keyword extraction | 第79-83页 |
4.3.4 Comments | 第83-84页 |
4.3.5 Implications for IE | 第84-85页 |
4.4 The hypothesis | 第85-87页 |
Chapter 5. Experiments | 第87-122页 |
5.1 Design | 第87-89页 |
5.2 Experiment A: testing the hypothesis | 第89-109页 |
5.2.1 The tagging scheme | 第90-100页 |
5.2.2 Corpus material | 第100页 |
5.2.3 Tagging | 第100-101页 |
5.2.4 Manual keywords | 第101页 |
5.2.5 Outcome and analysis | 第101-107页 |
5.2.5.1 Chi-square test | 第103-107页 |
5.2.6 Validity of data and residual issues | 第107-109页 |
5.3 Subsequent experiments: testing the effect | 第109-116页 |
5.3.1 Automatically extracted keywords | 第110-113页 |
5.3.2 Outcome of the four keyword extraction methods | 第113-115页 |
5.3.3 Adjusting SP coefficients | 第115-116页 |
5.4 Discussions | 第116-120页 |
5.5 Summary | 第120-122页 |
Chapter 6. Conclusions and further research | 第122-128页 |
6.1 Summary of the study | 第122-125页 |
6.2 Further research | 第125-128页 |
BIBLIOGRAPHY | 第128-135页 |
APPENDICES | 第135-145页 |