Chapter 1. Introduction | 第14-22页 |
1.1. Thesis Objectives | 第17-18页 |
1.2. Thesis Structure | 第18-22页 |
Chapter 2. Basics of Indexing | 第22-37页 |
2.1. Information Retrieval Systems | 第22-24页 |
2.2. Content Representation and Descriptors | 第24-28页 |
2.2.1. Term Exhaustivity and Specificity | 第24-25页 |
2.2.2. Single and Complex Terms | 第25-26页 |
2.2.3. Term Weighting Factors | 第26-27页 |
2.2.4. Stop Words | 第27-28页 |
2.3. Query | 第28-29页 |
2.4. Relevance Judgement and Evaluation | 第29-32页 |
2.5. Retrieval Models | 第32-33页 |
2.6. Vector Space Model | 第33-35页 |
2.6.1. Query and Document Similarity | 第34-35页 |
2.6.2. Weighting Terms in VSM | 第35页 |
2.7. Summary | 第35-37页 |
Chapter 3. Chinese Indexing Basics | 第37-46页 |
3.1. Chinese Characters,N-grams and Words | 第38-39页 |
3.2. Character-based Indexing | 第39-40页 |
3.3. N-gram-based Indexing | 第40-42页 |
3.4. Word-based Indexing | 第42-45页 |
3.4.1. Word Segmentation and Indexing | 第42-44页 |
3.4.2. Word-based Indexing Procedures | 第44-45页 |
3.5. Summary:Comparing Single Term Indexing Methods | 第45-46页 |
Chapter 4. Phrase Indexing:Why,What and How | 第46-76页 |
4.1. The Need for Complex Term Indexing | 第46-50页 |
4.1.1. The Discrimination Model | 第46-48页 |
4.1.2. DisV,df, Specificity and Indexing Quality | 第48-50页 |
4.2. The Need for Chinese Phrase Indexing | 第50-56页 |
4.2.1. Index Numbers and Frequencies | 第50-51页 |
4.2.2. Increase Rate of Indexes | 第51-53页 |
4.2.3. Document Frequencies of Chinese Word Indexes | 第53-55页 |
4.2.4. Section Summary | 第55-56页 |
4.3. Phrases as Complex Indexes:Related Work | 第56-71页 |
4.3.1. Defining Phrase | 第56-57页 |
4.3.2. Traditional Chinese Phrase Studies | 第57-59页 |
4.3.3. Ways of Extracting Phrases | 第59-65页 |
4.3.4. Phrase Representation Approaches | 第65-67页 |
4.3.5. Phrase Weighting and Similarity Calculation | 第67-69页 |
4.3.6. Effectiveness of Phrase Indexing | 第69-71页 |
4.4. The State of Art of Chinese Phrase Indexing | 第71-73页 |
4.5. Summary:What Affects Phrase Indexing Effectiveness? | 第73-76页 |
Chapter 5. BaseNP Notion and Detection:A Corpus-based Approach | 第76-119页 |
5.1. Chinese Base Noun Phrases | 第76-92页 |
5.1.1. Defining BaseNP | 第77-80页 |
5.1.2. Relationship of BaseNP Components and Structures | 第80-83页 |
5.1.3. Transforming a BaseNP into a Uniform Structure | 第83-87页 |
5.1.4. BaseNP Templates | 第87-89页 |
5.1.5. BaseNP Words and Non-baseNP Words | 第89-91页 |
5.1.6. Section Summary:A Top-down View on BaseNP | 第91-92页 |
5.2. The Corpus-based Approach to Language Processing | 第92-94页 |
5.3. BaseNP Forming Ability Hypotheses | 第94-99页 |
5.3.1. the Hypotheses | 第94-95页 |
5.3.2. Defining the Abilities | 第95-99页 |
5.4. BaseNP Detection:Algorithms | 第99-119页 |
5.4.1. BaseNP Detection Methods:an Overview | 第99-103页 |
5.4.2. Learning and Measuring BaseNP Forming Abilities | 第103-108页 |
5.4.3. Applying What Is Learned | 第108-116页 |
5.4.4. Section Summary | 第116-119页 |
Chapter 6. BaseNP Detection:Empirical Studies and Experiments | 第119-152页 |
6.1. Objectives and Designs | 第119-123页 |
6.1.1. Experiment Designs | 第120-121页 |
6.1.2. Evaluation Considerations | 第121-122页 |
6.1.3. General Procedures for BaseNP Detection Experimentation | 第122-123页 |
6.2. BaseNP Detection Experimental Environment | 第123-127页 |
6.2.1. The Raw Corpus | 第123-124页 |
6.2.2. BaseNP Marking Procedures and Guidelines | 第124-126页 |
6.2.3. Statistics about the Marked Corpus | 第126页 |
6.2.4. The Tag Set and Dictionary | 第126-127页 |
6.2.5. The BaseNP Detection Module | 第127页 |
6.3. Knowledge Bases Acquisition | 第127-132页 |
6.3.1. An Overview of the Three Knowledge Bases | 第128页 |
6.3.2. Individual Differences among Words in Forming BaseNPs | 第128-129页 |
6.3.3. Individual Differences among Tags in Forming baseNPs | 第129-130页 |
6.3.4. Individual Differences among Templates in Forming BaseNPs | 第130-131页 |
6.3.5. Summary of the Learning Results | 第131-132页 |
6.4. Experiment 1:Boundary-based Detection | 第132-140页 |
6.4.1. Algorithm and Procedures | 第132-133页 |
6.4.2. Factors to be Tested and Experiment Designs | 第133-134页 |
6.4.3. Results of Experiment 1 | 第134-140页 |
6.4.4. Summary of Experiment 1 | 第140页 |
6.5. Experiment 2:Template-based Detection | 第140-144页 |
6.5.1. Procedures and experiment designs | 第140-141页 |
6.5.2. Results of Experiment 2 | 第141-144页 |
6.5.3. Summary of Experiment 2 | 第144页 |
6.6. Experiment 3:Hybrid Detection Methods | 第144-150页 |
6.6.1. Two Objectives of Experiment 3 | 第145页 |
6.6.2. Algorithms and Procedures | 第145-146页 |
6.6.3. Factors to be tested and experiment designs | 第146-147页 |
6.6.4. Results of Experiment 3-1 | 第147-149页 |
6.6.5. Results of Experiment 3-2 | 第149-150页 |
6.6.6. Summary of Experiment 3 | 第150页 |
6.7. Summary:Comparing baseNP Detection Results | 第150-152页 |
Chapter 7. Chinese Complex Term Indexing with BaseNP | 第152-173页 |
7.1. Procedures for Retrieval Experimentation | 第152-153页 |
7.2. BaseNP Indexing Method | 第153-156页 |
7.2.1. Overview | 第153-154页 |
7.2.2. BaseNP Representations and Document Vectors | 第154-155页 |
7.2.3. BaseNP Indexing Procedures | 第155-156页 |
7.2.4. Query Processing and Representation | 第156页 |
7.2.5. Weighting Functions and Similarity Calculation | 第156页 |
7.3. Indexing Experimental Environment | 第156-162页 |
7.3.1. Experimental System-CEIRS | 第157-159页 |
7.3.2. Experimental Document and Query Collections | 第159-162页 |
7.4. Indexing Experiments:Objectives and Designs | 第162-163页 |
7.5. Indexing Experimental Results and Analysis | 第163-169页 |
7.5.1. Overall Retrieval Results | 第163-164页 |
7.5.2. Effectiveness of the BaseNP Indexing Method | 第164-167页 |
7.5.3. Effects of baseNP Normalization | 第167-168页 |
7.5.4. Effects of Query Length | 第168-169页 |
7.6. Summary and Further Analysis of Retrieval Results | 第169-173页 |
Chapter 8. Conclusions and Future Work | 第173-180页 |
8.1. General Conclusions and Implications | 第173-177页 |
8.2. Using BaseNP:Efficiency and Other Considerations | 第177-178页 |
8.3. Future Work | 第178-180页 |
Appendix | 第180-189页 |
Bibliography | 第189-197页 |