基于内容分析的专利挖掘技术研究

摘要	第1-7页
ABSTRACT	第7-12页
第一章绪论	第12-18页
·研究背景	第12-13页
·研究现状	第13-15页
·相关工作	第15-16页
·本文的研究内容	第16-18页
第二章专利挖掘任务及系统架构	第18-30页
·专利基本概念	第18-20页
·专利概念	第18页
·专利分类表	第18-20页
·专利挖掘任务	第20-25页
·专利挖掘任务描述	第20-21页
·专利挖掘任务数据	第21-24页
·评价方法	第24-25页
·专利挖掘中的问题分析	第25-27页
·专利挖掘系统架构	第27-29页
·问题提出	第27-28页
·系统架构	第28-29页
·小结	第29-30页
第三章分类技术	第30-36页
·文本分类定义	第30-31页
·特征选取方法	第31-33页
·文档频度	第31-32页
·类别频度	第32页
·信息增益	第32页
·CHI-统计	第32-33页
·特征权重的计算方法	第33-34页
·布尔权重	第33页
·词频权重	第33页
·tf×idf-权重	第33-34页
·分类器	第34-35页
·KNN分类器	第34页
·支持向量机	第34-35页
·小结	第35-36页
第四章专利文本的向量表示	第36-50页
·问题提出	第36-37页
·训练数据的存储	第37-38页
·倒排索引技术	第37页
·专利倒排存储	第37-38页
·专利文本向量表示	第38-42页
·数据的预处理	第38-40页
·特征选取的方法	第40页
·类别中心向量表示方法	第40-42页
·实验及分析	第42-49页
·基于同源数据的实验	第43-44页
·基于专利不同字段实验	第44页
·特征选取的方法实验	第44-46页
·基于USPTO的不同K值实验	第46-47页
·基于中心向量的方法	第47页
·类别归并的方法实验	第47-49页
·小结	第49-50页
第五章文本相似度计算方法	第50-56页
·向量余弦	第50页
·BM25	第50-51页
·SMART算法	第51-52页
·Pivoted Normalisation方法	第52页
·Log-linear	第52-53页
·实验及分析	第53-55页
·实验数据	第53页
·评价方法	第53页
·实验及分析	第53-55页
·小结	第55-56页
第六章基于多种RANKING的决策方法	第56-64页
·求异排序	第56页
·投票方法	第56-57页
·相似度加和	第57页
·相似度均值	第57-58页
·类别权重加和	第58页
·相似度位置权重加和	第58页
·实验及分析	第58-63页
·基于不同Ranking方法比较实验及分析	第59页
·基于Rank-SVM决策方法实验	第59-62页
·多个最优系统线性组合实验及分析	第62-63页
·小结	第63-64页
第七章总结及展望	第64-66页
参考文献	第66-70页
致谢	第70-72页
攻读硕士期间发表的论文	第72页