首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

产品库平台系统的研究和实现

摘要第1-5页
Abstract第5-11页
第1章 绪论第11-18页
   ·课题背景第11-13页
   ·国内外现状第13-15页
     ·产品库第13-14页
     ·产品的自动化识别第14-15页
     ·数据分布式存储和并行处理第15页
   ·本文研究内容第15-16页
   ·文章组织结构第16-18页
第2章 实现产品库平台的技术背景第18-25页
   ·分布式文件系统——HDFS第18-21页
     ·HDFS设计原则和目标第19-20页
     ·HDFS架构和实现第20-21页
   ·分布式计算框架——MapReduce第21-22页
     ·原理第21页
     ·实现第21-22页
   ·Hadoop streaming技术第22-23页
   ·Hadoop 平台的局限性第23-25页
第3章 产品库平台系统设计第25-41页
   ·设计目标和原则第25-26页
   ·产品库整体系统架构第26-27页
   ·系统构成及实现技术第27-36页
     ·商品网页数据预处理第27-30页
     ·关键特征抽取第30-33页
     ·产品分类第33页
     ·产品信息融合第33-34页
     ·支持知识库:同义词表、商业词库和关键属性库第34-35页
     ·外部访问接口服务第35-36页
   ·外部访问接口服务第36-40页
     ·组成部分及功能第36-37页
     ·数据分布式存储系统第37-38页
     ·并行访问系统第38-40页
   ·本章小结第40-41页
第4章 商品标题中属性实体识别算法研究和改进第41-51页
   ·问题描述和定义第41页
   ·属性实体识别算法第41-48页
     ·基准算法: CRF命名实体识别方法第42-43页
     ·改进算法:基于商业词库的属性实体识别算法第43-48页
   ·效果实验分析第48-50页
     ·正确率测试实验第48-49页
     ·属性实体覆盖率实验分析第49-50页
   ·改进算法的优势第50页
   ·本章小结第50-51页
第5章 商品属性规约算法研究和改进第51-59页
   ·问题描述和定义第51-52页
   ·商品属性规约算法第52-53页
     ·关键属性库自动化构建第52-53页
   ·关键属性知识库的形式化定义第53页
   ·属性重要度计算算法第53-56页
     ·基准算法:基于频率统计算法第53页
     ·改进算法:基于用户行为的挖掘算法第53-54页
     ·改进算法:基于文本内容的挖掘算法第54-56页
   ·算法效果实验对比第56-58页
     ·评测数据集第56页
     ·评测指标第56-57页
     ·评测结果第57-58页
   ·改进算法的优势第58页
   ·本章小结第58-59页
第6章 整体产品识别算法研究和改进第59-64页
   ·产品分类算法第60-61页
     ·基准算法:基于人工规则的分类算法第61页
     ·改进算法:基于topK重要属性的分类算法第61页
     ·可能的改进算法:基于机器学习理论的分类算法第61页
   ·产品分类算法效率分析第61-62页
   ·整体产品识别算法有效性验证实验第62-63页
     ·整体产品识别算法第62页
     ·评测数据集第62页
     ·评测指标第62-63页
     ·评测结果第63页
   ·本章小结第63-64页
第7章 总结和展望第64-66页
   ·全文总结第64-65页
   ·研究展望第65-66页
参考文献第66-68页
致谢第68页

论文共68页,点击 下载论文
上一篇:无人机地面站软件的设计与实现
下一篇:基于改进的SVM-KNN算法的中文网页层次式分类