比较购物网站中海量产品信息自动分目录功能的设计与实现
摘要 | 第1-7页 |
ABSTRACT | 第7-11页 |
第1章 引言 | 第11-14页 |
·比较购物的发展背景 | 第11页 |
·比较购物的现状 | 第11-12页 |
·课题来源及研究意义 | 第12-13页 |
·论文结构 | 第13-14页 |
第2章 比较购物网站的数据处理平台 | 第14-20页 |
·Smarter的数据处理平台概述 | 第14-16页 |
·名词解释 | 第14-16页 |
·Smarter商家的数据获取处理流程 | 第16-19页 |
·Smarter FTP的处理流程 | 第16-19页 |
·HTTP和商家FTP的处理流程 | 第19页 |
·商家Feed中的商品信息处理流程 | 第19-20页 |
第3章 海量未匹配商品自动分目录的算法设计 | 第20-25页 |
·海量未匹配商品的产生 | 第20页 |
·总体设计算法 | 第20-24页 |
·字典库生成模块 | 第21页 |
·DNA库生成模块 | 第21-22页 |
·商品自动分目录模块 | 第22-24页 |
·算法设计的接口 | 第24-25页 |
第4章 英文商品自动分目录的实现 | 第25-33页 |
·英文分词简介 | 第25页 |
·字典库生成 | 第25-30页 |
·特殊词替换 | 第25-27页 |
·拼写检查 | 第27-28页 |
·单复数处理 | 第28-29页 |
·同义词处理 | 第29-30页 |
·初始化处理 | 第30页 |
·DNA库生成 | 第30-33页 |
第5章 中文商品自动分目录的实现 | 第33-58页 |
·中文分词技术 | 第33-36页 |
·中文分词简介 | 第33页 |
·中文分词技术 | 第33-36页 |
·Smarter的中文分词系统 | 第36-58页 |
·Smarter的中文分词技术简介 | 第36-39页 |
·词典结构 | 第39-42页 |
·原子切分 | 第42-43页 |
·初次划分 | 第43-49页 |
·N最短路径 | 第49-54页 |
·N最短二叉分词路径 | 第54-55页 |
·未登陆词识别 | 第55页 |
·生成最终分词结果 | 第55-56页 |
·对最终结果做优化调整 | 第56-58页 |
第6章 结论与展望 | 第58-60页 |
致谢 | 第60-61页 |
参考文献 | 第61-63页 |
个人简历 在读期间发表的学术论文与研究成果 | 第63页 |