摘要 | 第5-7页 |
ABSTRACT | 第7-8页 |
符号说明 | 第9-10页 |
文献综述 | 第10-34页 |
1 中文分词 | 第10-20页 |
1.1 完全基于词典的方法 | 第12-15页 |
1.2 完全基于统计的分词方法 | 第15-16页 |
1.3 基于规则的分词方法 | 第16页 |
1.4 混合分词方法 | 第16-17页 |
1.5 基于机器学习的中文分词 | 第17-20页 |
2 中文分词和命名实体识别 | 第20-29页 |
2.1 序列分类模型 | 第21-28页 |
2.2 神经网络模型 | 第28-29页 |
3 中医药领域中的应用 | 第29-30页 |
4 参考文献 | 第30-34页 |
前言 | 第34-38页 |
1 研究背景 | 第34页 |
2 研究目的 | 第34页 |
3 研究意义 | 第34页 |
4 研究内容及方法 | 第34-36页 |
5 技术路线 | 第36-38页 |
1 分词工具 | 第38-50页 |
1.1 比较分词工具的功能 | 第38-40页 |
1.2 中药名词和方剂名词词典 | 第40-43页 |
1.3 比较识别中药名词和方剂名词 | 第43-45页 |
1.4 自定义词典的格式 | 第45-46页 |
1.5 自定义词典的作用 | 第46-48页 |
1.6 添加自定义词典 | 第48-50页 |
2 神经网络模型 | 第50-78页 |
2.1 准备语料库 | 第50-53页 |
2.2 语料预处理 | 第53-55页 |
2.3 训练神经网络模型 | 第55-62页 |
2.4 收集语料素材 | 第62-64页 |
2.5 格式化语料素材 | 第64-68页 |
2.6 建立语料库 | 第68-69页 |
2.7 迁移字嵌入模型 | 第69-72页 |
2.8 正、负样本比例 | 第72-75页 |
2.9 语料数量 | 第75-78页 |
2.10 BLSTM神经网络模型和BLSTM-CRF神经网络模型 | 第78页 |
3 比较分词工具和神经网络模型 | 第78-82页 |
结语 | 第82-84页 |
1 结论 | 第82页 |
2 研究贡献 | 第82页 |
3 研究不足和展望 | 第82-84页 |
参考文献 | 第84-86页 |
致谢 | 第86-88页 |
在学期间主要研究成果 | 第88页 |