基于数据分布和文本相似性的PU分类技术
附表 | 第1-6页 |
摘要 | 第6-7页 |
Abstract | 第7-11页 |
第一章 绪论 | 第11-19页 |
·研究背景 | 第11-13页 |
·研究内容 | 第13-15页 |
·本文工作与贡献 | 第15-17页 |
·本文结构 | 第17-19页 |
第二章 研究现状 | 第19-22页 |
·PU分类相关工作 | 第19-20页 |
·相似性匹配相关工作 | 第20-21页 |
·本章小结 | 第21-22页 |
第三章 基于编辑距离的冗余检测 | 第22-39页 |
·相似性下的冗余检测 | 第22-23页 |
·预备知识 | 第23-25页 |
·现有相似性查询方法存在的问题 | 第25-27页 |
·泛化gram过滤器 | 第27-30页 |
·基于泛化gram过滤器的冗余检测方法 | 第30-33页 |
·基于gram排序的泛化gram过滤器选择方法 | 第33-37页 |
·本章小结 | 第37-39页 |
第四章 浓度估计下基于KL距离的PU分类方法 | 第39-49页 |
·预备知识 | 第39-41页 |
·现有工作缺陷分析 | 第41-43页 |
·浓度估计算法 | 第43-44页 |
·基于浓度估计的KL-Auto算法 | 第44-46页 |
·基于浓度估计的集成策略 | 第46页 |
·本章小结 | 第46-49页 |
第五章 实验部分 | 第49-60页 |
·相似性查询实验部分 | 第49-54页 |
·基于浓度估计的PU分类实验 | 第54-58页 |
·去除冗余的PU分类实验 | 第58-60页 |
第六章 总结与展望 | 第60-61页 |
参考文献 | 第61-66页 |
致谢 | 第66-69页 |
攻读硕士学位期间发表论文和科研情况 | 第69页 |