基于JAVA的行业属性关键词扩展方法设计与实现
摘要 | 第5-6页 |
ABSTRACT | 第6-7页 |
第一章 绪论 | 第10-19页 |
1.1 本论文的背景和意义 | 第10-11页 |
1.2 研究现状与发展 | 第11-17页 |
1.2.1 信息抽取技术研究现状 | 第11-14页 |
1.2.2 属性抽取研究现状 | 第14-17页 |
1.3 本论文的主要内容和结构安排 | 第17-19页 |
1.3.1 本论文的主要内容 | 第17页 |
1.3.2 本论文的结构安排 | 第17-19页 |
第二章 属性关键词拓展算法原理与产品属性挖掘方法 | 第19-37页 |
2.1 属性关键词拓展算法原理 | 第19-31页 |
2.1.1 基于语义词典的方法 | 第19-24页 |
2.1.2 基于模式匹配的方法 | 第24-26页 |
2.1.3 基于词素的方法 | 第26页 |
2.1.4 基于知网的方法 | 第26-31页 |
2.1.5 传递性补充 | 第31页 |
2.2 产品属性挖掘方法 | 第31-37页 |
2.2.1 人工挖掘 | 第32-33页 |
2.2.2 计算机辅助挖掘 | 第33-37页 |
第三章 属性关键词扩展方法研究 | 第37-50页 |
3.1 属性的获取 | 第37页 |
3.2 关键词的定义 | 第37页 |
3.3 K元模式挖掘 | 第37-41页 |
3.3.1 K元模式挖掘的概念 | 第38页 |
3.3.2 K元模式挖掘的算法描述 | 第38-40页 |
3.3.3 K元模式挖掘算法 | 第40-41页 |
3.4 关键词拓展算法 | 第41-44页 |
3.4.1 语义相似度计算 | 第42-44页 |
3.4.2 种子同义扩展 | 第44页 |
3.4.3 种子同义扩展算法 | 第44页 |
3.5 备选属性触发词选取与评价 | 第44-45页 |
3.6 实验过程及其结果 | 第45-50页 |
3.6.1 实验过程截图 | 第47-49页 |
3.6.2 实验总结及分析 | 第49-50页 |
第四章 基于网络百科的同义词抽取技术研究 | 第50-62页 |
4.1 互动百科词条语料收集 | 第50-56页 |
4.1.1 网络爬虫原理 | 第50-51页 |
4.1.2 网页爬虫的设计 | 第51-56页 |
4.2 正则表达式运用 | 第56页 |
4.3 算法原理 | 第56-58页 |
4.3.1 提取规则生成算法 | 第57-58页 |
4.3.2 同义词生成算法 | 第58页 |
4.4 算法优劣势 | 第58页 |
4.5 种子选取 | 第58-59页 |
4.6 实验过程及其结果 | 第59-62页 |
4.6.1 第一次返回的模式和模式的频率 | 第59页 |
4.6.2 第二次新生成的关键词对 | 第59-60页 |
4.6.3 第二次新生成的模式 | 第60-62页 |
第五章 总结与展望 | 第62-64页 |
5.1 本文总结 | 第62页 |
5.2 未来展望 | 第62-64页 |
致谢 | 第64-65页 |
参考文献 | 第65-69页 |