资源类型:
申请号:
申请日期:
授权年份:
公开号:
公开日:
法律状态:
主分类号:
分类号:
摘要:
本申请公开了基于放疗流程的人工智能问答系统,属于医疗设备领域。一种基于放疗流程的人工智能问答系统,包括:服务器和若干个信息终端,信息终端与服务器信号连接,信息终端用于输入问题和输出对应问题的回答;服务器包括:输入模块、大模型模块、词向量转换模块、回答模块、分类模块、匹配模块、输出模块。本申请所提供的技术方案中:患者通过信息终端向服务器输入问题,服务器会自动匹配出问题的回答,从而能够及时的回答患者的问题,及时的引导患者完成放疗工作。
主权项:
1.一种基于放疗流程的人工智能问答系统,包括: 服务器和若干个信息终端,信息终端与服务器信号连接,信息终端用于输入问题和输出对应问题的回答; 其特征在于, 服务器包括: 输入模块,用于输入问题; 大模型模块,部署有训练好的语言大模型,并根据输入问题生成初始回答; 词向量转换模块,将初始回答转化为回答向量; 回答模块,部署有两个以上的回答题库; 分类模块,基于回答向量与各回答题库的相似度,将回答向量与相似度最高的回答题库对应; 匹配模块,将回答向量与对应的回答题库匹配,从回答题库中筛选出对应问题的回答信息; 输出模块,将回答信息发送至终端设备; 词向量转换模块包括: 分词器,将初始回答划分为若干个词; 词向量计算器,将每个词转换为词向量,生成所有词的词向量矩阵; 词向量池化层,将词向量矩阵进行池化,生成池化向量; 向量输出层,将池化向量进行归一化处理,生成回答向量; 在词向量计算器中词向量的计算公式为:其中,i表示词的索引,Ei表示初始回答中第i个词的词向量,表示初始回答中第i个词的位置向量,表示初始回答中第i个词的频率向量,表示初始回答中第i个词的词性向量,λ1表示位置权重,λ2表示频率权重,λ3表示词性权重,λ1+λ2+λ3=1;每个回答题库预先设置一个根据词频构建的词典; 初始回答中的第i个词遍历各词典生成的组合向量为第i个词的频率向量;所述的部署有两个以上的回答题库包括流程回答题库、治疗预期回答题库以及护理建议回答题库; 将流程回答题库对应的词典中的词按照词频从低到高排列生成第一维度轴; 将治疗预期回答题库对应的词典中的词按照词频从低到高排列生成第二维度轴; 将护理建议回答题库对应的词典中的词按照词频从低到高排列生成第三维度轴; 将第一维度轴、第二维度轴以及第三维度轴在空间上相互垂直,构建三维正交坐标系; 将第i个词的频率向量转化为第i个词在三维正交坐标系中的位置; 将第一维度轴的中点、第二维度轴的中点以及第三维度轴的中点作为三维正交坐标系的原点; 第一维度轴、第二维度轴、第三维度轴的生成步骤如下: S1:获取流程回答题库中的所有文本,将所有文本划分为词; S2:统计所有词出现的次数,计算出每个词的频率,生成词表; S3:将词按照频率的低到高进行排布,得到第一维度轴;所以每个词就变成了第一维度轴上的位置; 频率向量即定义为该坐标值的向量表示:其中,g表示沿着第一维度轴正方向的单位向量,y表示沿着第二维度轴正方向的单位向量,k表示表示沿着第三维度轴正方向的单位向量,(x,y,z)表示第i个词在三维正交坐标系的坐标; 将所有的词向量拼接,可以得到词向量矩阵H; 池化过程包括如下步骤: 步骤1:将词向量矩阵H进行主成分分析,将词向量矩阵降低至不同维度u,得到数据矩阵Zu; 步骤2:基于高斯分布假设,计算对数似然函数InL(u):;;; 其中,n表示词向量的样本数量,b表示对样本的遍历索引,u表示词向量矩阵H降低后的维度,Zu为词向量矩阵H降低至u维度后的数据矩阵,Zb表示Zu的第b行,βu表示数据矩阵Zu的均值向量,表示数据矩阵Zu的协方差矩阵,表示协方差矩阵的逆矩阵,tr()表示矩阵的迹,Su表示中间变量; 步骤3:计算参数数量P;步骤4:计算AIC值;;步骤5:遍历所有的候选维度u,以寻找到使得AIC最小的维度u。