资源类型:
申请号:
申请日期:
授权年份:
公开号:
公开日:
法律状态:
主分类号:
分类号:
摘要:
本发明涉及数据分析处理技术领域,公开基于人工智能的医疗数据科普方法,包括步骤:通过多种数据源获取医疗相关文献;参照国际疾病分类ICD的疾病类型划分方式构建疾病树状数据库,所述疾病树状数据库包含多个节点;对医疗相关文献进行疾病类型的分类整理,存储到疾病树状数据库对应的节点中;接收用户输入的提问语句,从提问语句中提取疾病类型,并从疾病类型对应的节点中检索医疗相关文献返回给用户。本发明参照ICD的疾病分类方式构建多阶度的疾病树状数据库,用户在查询某一疾病的相关文献时,可以查询该疾病类型由广到细,或由细到广的相关文献,从而科普到更多的医疗知识。
主权项:
1.基于人工智能的医疗数据科普方法,其特征在于:包括以下步骤: 步骤1,通过多种数据源获取医疗相关文献; 步骤2,参照国际疾病分类ICD的疾病类型划分方式构建疾病树状数据库,所述疾病树状数据库包含多个节点; 所述步骤2中,选取国际疾病分类ICD的前24个章节对应的疾病类型,构建24个疾病树状数据库,将章节对应的疾病类型作为疾病树状数据库的根节点;每个疾病树状数据库按照国际疾病分类ICD的分类方式延伸子孙节点,将带有4位编码的疾病类型作为叶节点; 步骤3,对医疗相关文献进行疾病类型的分类整理,存储到疾病树状数据库对应的节点中; 所述步骤3具体包括以下步骤: 步骤3-1,对文献的名称和关键词进行分词后,再进行词向量编码,使用最优分配函数将文献存入与分词匹配的节点中,若该节点是非叶节点,则执行步骤3-2,若该节点是叶节点,则结束; 步骤3-2,对文献的内容进行分词后,再进行词向量编码,在步骤3-1已存储的节点的孙子节点中,使用最优分配函数识别与分词匹配的节点,将文献存入与分词匹配的节点中; 所述最优分配函数为: 其中,f(xi)表示最优分配函数;xi表示第i个分词的编码值;yj表示第j个节点的编码值,j=1,2,...,K,K表示节点数量;sgn表示阶跃函数;表示核函数参数;表示高斯径向基参数,;表示偏置项;hi表示第i个分词的权重系数; 步骤4,接收用户输入的提问语句,从提问语句中提取疾病类型,并从疾病类型对应的节点中检索医疗相关文献返回给用户。