PHP站内中文搜索技术的研究与实现
摘要 | 第1-4页 |
ABSTRACT | 第4-9页 |
1 前言 | 第9-13页 |
·选题背景和意义 | 第9-10页 |
·PHP 站内中文搜索的必要性 | 第9页 |
·改进PHP 站内中文搜索的意义 | 第9-10页 |
·PHP 站内中文搜索研究 | 第10-11页 |
·论文结构和安排 | 第11-13页 |
2 PHP 站内中文搜索的国内外研究现状 | 第13-18页 |
·PHP 站内中文搜索相关技术 | 第13-15页 |
·中文分词的方法 | 第15-16页 |
·全文检索与数据库 | 第16页 |
·国内外相关技术产品介绍 | 第16-18页 |
3 PHP 站内中文搜索的总体框架 | 第18-23页 |
·PHP 站内中文搜索的设计 | 第18-19页 |
·设计目标 | 第18-19页 |
·应用对象 | 第19页 |
·技术方案 | 第19-21页 |
·组件构成 | 第19-20页 |
·工作原理 | 第20-21页 |
·PHP 站内中文搜索的难点 | 第21-23页 |
·分词性能问题 | 第21-22页 |
·索引集的有效性 | 第22页 |
·搜索结果集的相关度 | 第22-23页 |
4 PHP 站内中文搜索的功能分析和设计 | 第23-31页 |
·PHP 站内中文搜索功能 | 第23-25页 |
·基本步骤 | 第23-24页 |
·性能考虑 | 第24-25页 |
·PHP 站内中文搜索的设计 | 第25-29页 |
·搜索功能设计 | 第25页 |
·索引器功能 | 第25-27页 |
·检索器功能 | 第27页 |
·表示器功能 | 第27-28页 |
·分词器功能 | 第28-29页 |
·索引结果集的相关应用 | 第29-31页 |
·反垃圾内容功能 | 第29页 |
·相似内容功能 | 第29页 |
·自动标签功能 | 第29-31页 |
5 站内搜索相关度数据模型 | 第31-36页 |
·基于关键词权重的相关度模型 | 第31-34页 |
·HTML 标记分析 | 第32页 |
·索引词权重计算 | 第32-33页 |
·全站词频权重 | 第33-34页 |
·基于属性权重的相关度模型 | 第34-35页 |
·站内中文搜索结果集相关度 | 第35页 |
·多因素相关度 | 第35页 |
·用户可干预 | 第35页 |
·相关度模型的实施效果 | 第35-36页 |
6 轻量高效中文分词算法设计 | 第36-45页 |
·中文分词算法的目标 | 第36-37页 |
·最大匹配算法 | 第37页 |
·最大匹配算法的改进 | 第37-40页 |
·改进的目的 | 第37-38页 |
·正向最大匹配算法 | 第38-39页 |
·逆向最大匹配算法 | 第39页 |
·正向逆向最大匹配算法比较 | 第39-40页 |
·字典算法描述 | 第40-42页 |
·字典内容 | 第40页 |
·B-Tree 算法 | 第40-41页 |
·字典生成算法 | 第41页 |
·字典搜索算法 | 第41-42页 |
·实例分析与结果比较 | 第42-45页 |
·分词结果 | 第42-43页 |
·分词性能 | 第43-45页 |
7 总结 | 第45-46页 |
参考文献 | 第46-49页 |
致谢 | 第49-50页 |
作者攻读学位期间发表的论文 | 第50-52页 |