| 摘要 | 第1-6页 |
| Abstract | 第6-7页 |
| 第一章 引言 | 第7-12页 |
| ·电子商务的发展现状 | 第7-8页 |
| ·电子商务中的商品分类问题 | 第8-9页 |
| ·数据挖掘和商品自动分类研究 | 第9-10页 |
| ·论文作者的工作 | 第10-11页 |
| ·论文结构 | 第11-12页 |
| 第二章 常用商品分类算法介绍 | 第12-25页 |
| ·商品分类原理和模型 | 第12-14页 |
| ·商品分类评估方法 | 第14-15页 |
| ·商品特征选择 | 第15-19页 |
| ·频次方法 | 第16页 |
| ·信息增益 | 第16-17页 |
| ·X~2统计(CHI) | 第17页 |
| ·互信息MI | 第17-18页 |
| ·期望交叉熵(Cross Entropy) | 第18页 |
| ·证据权(Weight of Evidence) | 第18-19页 |
| ·常用商品分类算法技术 | 第19-25页 |
| ·朴素贝叶斯方法(Naive Bayes) | 第19-20页 |
| ·神经网络方法(Neural Network) | 第20页 |
| ·近邻学习算法(Nearest Neighbor) | 第20-21页 |
| ·向量空间模型(SVM) | 第21-25页 |
| 第三章 经典商品分类模型与算法 | 第25-35页 |
| ·商品信息的表示形式 | 第25-27页 |
| ·商品类别的层次表示 | 第27-32页 |
| ·传统的树状结构表示法 | 第27-29页 |
| ·DAP模型表示法 | 第29-32页 |
| ·以往商品分类模型中存在的问题 | 第32-35页 |
| 第四章 改进的向量空间模型商品分类算法 | 第35-46页 |
| ·算法设计思路 | 第35-36页 |
| ·多元词组紧密度 | 第36-38页 |
| ·改进算法 | 第38-43页 |
| ·词在段落中的权重 | 第39-41页 |
| ·段落紧密度的计算 | 第41页 |
| ·词在商品信息向量中的权重 | 第41-43页 |
| ·基于词同现和文本结构的商品分类的探讨 | 第43-45页 |
| ·小结 | 第45-46页 |
| 第五章 商品自动分类算法实现与实验结果 | 第46-59页 |
| ·改进的向量空间模型算法的实现 | 第46-52页 |
| ·预处理 | 第48-49页 |
| ·特征选择 | 第49-51页 |
| ·分类器构造和分类 | 第51-52页 |
| ·DAP商品分类模型的实现 | 第52-54页 |
| ·系统实验 | 第54-59页 |
| ·实验数据 | 第54-55页 |
| ·算法精确度分析 | 第55-57页 |
| ·DAP模型性能分析 | 第57-59页 |
| 第六章 总结与将来的工作 | 第59-61页 |
| ·本文总结 | 第59页 |
| ·下一步的工作 | 第59-61页 |
| 附录 | 第61-66页 |
| 参考文献 | 第61-64页 |
| 攻读硕士期间发表论文及参与的科研项目 | 第64-65页 |
| 致谢 | 第65-66页 |