比较购物网站中海量产品信息自动分目录功能的设计与实现
| 摘要 | 第1-7页 |
| ABSTRACT | 第7-11页 |
| 第1章 引言 | 第11-14页 |
| ·比较购物的发展背景 | 第11页 |
| ·比较购物的现状 | 第11-12页 |
| ·课题来源及研究意义 | 第12-13页 |
| ·论文结构 | 第13-14页 |
| 第2章 比较购物网站的数据处理平台 | 第14-20页 |
| ·Smarter的数据处理平台概述 | 第14-16页 |
| ·名词解释 | 第14-16页 |
| ·Smarter商家的数据获取处理流程 | 第16-19页 |
| ·Smarter FTP的处理流程 | 第16-19页 |
| ·HTTP和商家FTP的处理流程 | 第19页 |
| ·商家Feed中的商品信息处理流程 | 第19-20页 |
| 第3章 海量未匹配商品自动分目录的算法设计 | 第20-25页 |
| ·海量未匹配商品的产生 | 第20页 |
| ·总体设计算法 | 第20-24页 |
| ·字典库生成模块 | 第21页 |
| ·DNA库生成模块 | 第21-22页 |
| ·商品自动分目录模块 | 第22-24页 |
| ·算法设计的接口 | 第24-25页 |
| 第4章 英文商品自动分目录的实现 | 第25-33页 |
| ·英文分词简介 | 第25页 |
| ·字典库生成 | 第25-30页 |
| ·特殊词替换 | 第25-27页 |
| ·拼写检查 | 第27-28页 |
| ·单复数处理 | 第28-29页 |
| ·同义词处理 | 第29-30页 |
| ·初始化处理 | 第30页 |
| ·DNA库生成 | 第30-33页 |
| 第5章 中文商品自动分目录的实现 | 第33-58页 |
| ·中文分词技术 | 第33-36页 |
| ·中文分词简介 | 第33页 |
| ·中文分词技术 | 第33-36页 |
| ·Smarter的中文分词系统 | 第36-58页 |
| ·Smarter的中文分词技术简介 | 第36-39页 |
| ·词典结构 | 第39-42页 |
| ·原子切分 | 第42-43页 |
| ·初次划分 | 第43-49页 |
| ·N最短路径 | 第49-54页 |
| ·N最短二叉分词路径 | 第54-55页 |
| ·未登陆词识别 | 第55页 |
| ·生成最终分词结果 | 第55-56页 |
| ·对最终结果做优化调整 | 第56-58页 |
| 第6章 结论与展望 | 第58-60页 |
| 致谢 | 第60-61页 |
| 参考文献 | 第61-63页 |
| 个人简历 在读期间发表的学术论文与研究成果 | 第63页 |