生物医学多文档自动文摘系统设计与实现
| 摘要 | 第1-5页 |
| Abstract | 第5-9页 |
| 第1章 绪论 | 第9-16页 |
| ·课题背景 | 第9-10页 |
| ·多文档自动文摘综述 | 第10-11页 |
| ·国内外研究现状和分析 | 第11-13页 |
| ·通用领域多文档自动文摘的现状 | 第12-13页 |
| ·医学领域多文档自动文摘的现状 | 第13页 |
| ·研究目的和意义 | 第13-14页 |
| ·本文主要研究内容 | 第14-16页 |
| 第2章 系统分析与技术难点 | 第16-22页 |
| ·系统需求分析 | 第16-17页 |
| ·系统总体设计 | 第17-18页 |
| ·系统开发的难点 | 第18-20页 |
| ·生物医学文摘的特点 | 第18-19页 |
| ·生物医学命名实体识别面临的困难 | 第19-20页 |
| ·文摘评价面临的困难 | 第20页 |
| ·本文采用的技术路线 | 第20-21页 |
| ·本章小结 | 第21-22页 |
| 第3章 生物医学文本预处理技术 | 第22-38页 |
| ·语料获取技术 | 第22-25页 |
| ·语料获取 | 第22-23页 |
| ·语料库的建立 | 第23-25页 |
| ·文本预处理技术 | 第25-37页 |
| ·分句 | 第26-27页 |
| ·词性标注 | 第27-31页 |
| ·词干还原 | 第31-32页 |
| ·命名实体识别简介 | 第32-35页 |
| ·命名实体识别的实现 | 第35-36页 |
| ·去除停用词 | 第36-37页 |
| ·本章小结 | 第37-38页 |
| 第4章 生物医学主题识别技术 | 第38-52页 |
| ·句子的向量化表示 | 第38-40页 |
| ·基于聚类算法的主题识别 | 第40-51页 |
| ·句子相似度计算 | 第40-42页 |
| ·常见聚类算法介绍 | 第42-47页 |
| ·基于聚类算法的主题识别 | 第47-51页 |
| ·本章小结 | 第51-52页 |
| 第5章 系统的运行结果及评价 | 第52-61页 |
| ·摘要生成 | 第52-54页 |
| ·文摘句的抽取 | 第52-53页 |
| ·文摘句的排序 | 第53-54页 |
| ·系统的运行结果 | 第54-57页 |
| ·系统评价 | 第57-60页 |
| ·评价方法 | 第57-59页 |
| ·系统评测 | 第59-60页 |
| ·本章小结 | 第60-61页 |
| 结论 | 第61-63页 |
| 参考文献 | 第63-68页 |
| 致谢 | 第68页 |