藏文搜索和搜索结果聚类研究及系统实现
| 摘要 | 第1-7页 |
| Abstract | 第7-10页 |
| 第1章 绪论 | 第10-15页 |
| ·选题背景及研究意义 | 第10-11页 |
| ·信息检索研究现状 | 第11-13页 |
| ·信息检索技术发展现状 | 第11-12页 |
| ·藏文信息检索技术发展现状 | 第12-13页 |
| ·本文主要工作及论文结构 | 第13-15页 |
| 第2章 AllCut藏文分词算法 | 第15-26页 |
| ·藏文特性及语法 | 第15-17页 |
| ·藏文字特性 | 第15-16页 |
| ·格助词及添加规则 | 第16页 |
| ·藏文语法特性 | 第16-17页 |
| ·当前分词算法分析 | 第17-21页 |
| ·基于规则的分词算法 | 第17-19页 |
| ·基于概率统计的分词算法 | 第19-21页 |
| ·AllCut分词 | 第21-24页 |
| ·分词流程 | 第21-22页 |
| ·分词原理 | 第22-23页 |
| ·分词歧义处理 | 第23-24页 |
| ·实验结果及结论 | 第24-25页 |
| ·本章小结 | 第25-26页 |
| 第3章 藏文聚类研究 | 第26-40页 |
| ·藏文聚类 | 第26-28页 |
| ·藏文表示 | 第26-27页 |
| ·藏文停词 | 第27-28页 |
| ·藏文聚类算法 | 第28-33页 |
| ·划分法(partitioning)聚类 | 第28-31页 |
| ·层次法(hierarchical)聚类 | 第31-33页 |
| ·相似度评价 | 第33-34页 |
| ·藏文聚类效果 | 第34-39页 |
| ·本章小结 | 第39-40页 |
| 第4章 藏文搜索引擎的设计 | 第40-50页 |
| ·系统架构 | 第40-41页 |
| ·系统框图 | 第40页 |
| ·功能综述 | 第40-41页 |
| ·藏文网络爬虫(crawer/robots) | 第41-43页 |
| ·爬虫原理 | 第41-42页 |
| ·藏文爬虫框架 | 第42-43页 |
| ·藏文预处理 | 第43-45页 |
| ·格式转换 | 第43页 |
| ·文本清理 | 第43-44页 |
| ·文档存储 | 第44-45页 |
| ·聚类显示 | 第45-49页 |
| ·网页质量评价 | 第45-46页 |
| ·结果显示 | 第46-49页 |
| ·小结 | 第49-50页 |
| 第5章 系统实现及实验效果 | 第50-62页 |
| ·系统实现 | 第50-51页 |
| ·系统功能模块 | 第51-56页 |
| ·爬虫实现 | 第51-52页 |
| ·编码转换 | 第52-53页 |
| ·建立索引 | 第53-54页 |
| ·搜索及结果聚类 | 第54-56页 |
| ·实验步骤及试验数据 | 第56页 |
| ·系统运行效果 | 第56-61页 |
| ·系统运行效果 | 第56-60页 |
| ·系统效果评价 | 第60-61页 |
| ·小结 | 第61-62页 |
| 总结展望 | 第62-63页 |
| 总结 | 第62页 |
| 展望 | 第62-63页 |
| 致谢 | 第63-64页 |
| 参考文献 | 第64-68页 |
| 攻读学位期间发表的论文 | 第68页 |