- 中国包装大数据知识图谱
- 王志兵等
- 1306字
- 2020-08-27 20:49:03
1.3 研究思路及结构安排
1.3.1 研究思路
本书的研究思路为从知识图谱的构建技术出发,并结合中国包装产业的特点开展研究。具体说明如下:针对目前中国包装行业知识图谱的市场空白和包装领域知识不全面的问题,结合包装学科、计算机学科、图书情报学、统计学和现今发展迅速的数据科学,构建出包含包装学科、包装教育、包装产业等信息的综合性大数据知识图谱,以填补目前包装行业知识图谱的空白。由于构建知识图谱需要大量真实可靠、精确度极高的结构化数据,而针对行业的结构化数据又相对匮乏,本书在行业知识数据缺乏的情况下,综合多种学科门类,实施多学科交叉融合研究,以中国包装本体模型为核心元素,以知识抽取模型为实现手段,以知识库为底层数据基础构建了由知识抽取层、数据存储层、数据控制层、查询处理层、应用接口层和展示层组成的中国包装知识图谱集成平台。通过命名实体识别、自动标注、语义分析、实体链接、机器学习等方法从行业统计数据库、图书情报库、网络信息等多源数据中抽取出实体、属性、关系等参数,构建出准确的模式层,进而构建出准确、可信的包装产业大数据知识图谱。
1.3.2 结构安排
第1章 绪论。对知识图谱的研究现状及其面临的研究问题进行论述,确定本书的研究目的及意义,并进一步阐述本书的基本思路和研究框架。
第2章 包装大数据知识图谱平台架构。本章首先对知识图谱技术的基本概念、发展现状、体系结构、关键技术以及应用领域等进行阐述,并详细介绍了其在包装行业的应用和大数据知识图谱的构建。
第3章 包装大数据分类体系。本章主要对包装大数据的概念及相关含义做了说明,并针对性地提出了中国包装大数据分类体系。同时,结合分类体系的特点、包装大数据知识图谱平台与实际企业信息的相关度,做了进一步的属性(多重属性)说明。
第4章 包装大数据知识图谱模式构建。本章介绍了知识图谱的一般构建过程,包括知识图谱数据模式层和实体层的学习。同时,对行业知识图谱的构建进行了说明,主要针对行业知识图谱的两类特殊数据源的学习方法进行了详述,并结合包装大数据行业知识图谱构建实例进行了举例说明。
第5章 包装大数据来源及获取方法。本章首先对数据采集技术的基本概念、发展现状、数据类型、关键技术以及应用领域等进行阐述,并详细介绍了多源数据获取和图数据库,并展示了包装大数据数据采集技术。
第6章 结构化、半结构化和非结构化包装大数据的抽取。本章首先对数据抽取的基本概念、类型、关键技术以及应用领域等进行阐述,并详细介绍了ETL和包装大数据的数据抽取实施过程。
第7章 包装大数据的实体及其属性抽取。本章首先对实体抽取技术的基本概念、发展现状、关键算法以及应用领域等进行阐述,并详细介绍了实体命名、关系抽取、事件抽取以及模板元素抽取,最后介绍了包装大数据中实现的实体抽取相关功能。
第8章 包装大数据知识库实体对齐与冲突检测。本章首先对实体对齐的基本概念、算法、关键技术以及学习冲突等进行阐述,并介绍了中国包装大数据知识库实体对齐的语义自动标注模型。
第9章 包装大数据知识推理及规则定义。本章首先介绍了基于符号逻辑的推理、基于图的推理和基于统计的推理三种常见的知识推理方法,并详细介绍了包装大数据知识图谱中知识推理和智能查询的实现机制。