广告位API接口通信错误,查看德得广告获取帮助

电竞之家_品味电竞生活移动版

主页 > 英雄联盟 >

Nature子刊:71位中外科学家联手打造史上最强“AI儿科医生”(2)

然后,我们为每种类型的病例数据构建一个模式:由当前疾病的病史和患者主诉,体检与实验室检查构成。然后将此架构用于文本新格式的建模。架构设计的基本原理是增强不同医院之间的数据的互操作性,以便将来进行进一步研究。此外,与使用有可能被识别出的原始病例相比,以新格式提供病例也有助于保护患者的隐私。

符号化与词嵌入

由于缺乏公开的标记临床中文数据资源,我们为分词建立了标准数据集。我们使用pythonTensorflow包中的word2vec来嵌入具有100个特征的4,363个令牌,以表示高维空间中单词的语义和相似性。

LSTM模型训练集和测试集的构建

我们创建了一个用于训练问答提取模型的小数据集,并在训练和验证队列中对问答信息进行了手动注释。对于答案为是/否的问题,我们使用0或1来表示。

对自由文本协调过程使用之前描述的基于注意力的LSTM建模。我们使用Tensorflow实现并训练模型。我们将NLP模型应用于所有电子病历中。我们没有调整超参数,而是使用LSTM模型的默认或常用的超参数设置。

分层多标签诊断模型

诊断的层级结构由专家医生研究确定,采用基于解剖学的分类系统进行,因为这是在人类医师评估患者时制定差异化诊断的常见做法。首先,将诊断范围分至一般器官系统(比如呼吸系统、神经精神病学或胃肠系统)。在每个器官系统内,再进一步分为子系统(如上呼吸道和下呼吸道),并将“全身”专门标记为一个系统,适用于全身性多器官疾病的情况。

模型训练和验证

来自问答模型的数据由混合分类变量和是/否形式的答案组成。因此,我们首先通过访问矩阵将分类和答案转换为统一的二进制特征。然后将数据随机分成训练组(包括总访问数据记录的70%)和测试组(剩余的30%)。然后通过构建问答矩阵,在训练和测试队列中对每个访问记录进行注释。对于每个中间节点,我们基于直接子项训练了多类线性逻辑回归分类器。子项的所有子类都折叠到子项的级别。使用Sklearn类逻辑回归来训练多类别分类器,使用默认的l1正则化惩罚(Lasso),模拟医生基于有限数量的症状进行的诊断。

对疾病的层级聚类

为了评估聚类结果的稳健性,我们首先将数据随机分成两半,一半用于训练,另一半用于测试,并独立地重新生成训练和测试数据的两个聚类图。我们通过在相应高度独立地切割相关的树形图,将训练和测试聚类图中的叶子分配给10个类别。使用调整的Rand指数(ARI)24评估训练和测试数据之间的类别分配一致性。结果表明我们的聚类图是稳健的。

微信图片_20190213143521.jpg

无人监督聚类NLP从儿科疾病中提取文本特征(灰色框内是聚类块)

在一些病例中,系统使用相关的ICD-10代码进行聚类诊断,说明具备检测与人类定义的分类系统一致的临床特征的趋势。但是,另一些时候,系统会将相关类型的诊断分为一类,但不包括该类别中的其他非常类似的诊断。比如将“哮喘”和“咳嗽变异性哮喘”分到同一组中,但该类中不包括“急性哮喘恶化”,该病与“急性鼻窦炎”组合在一起。在许多情况下,即使没有任何定向标记或分类系统,系统也成功建立了相关诊断的广泛分组,这表明我们开发的临床特征成功学习了建模和诊断的条件之间的关键的相似性和差异。

AI系统与人类医生的表现对比

我们选择了20名儿科医生,根据多年的临床实践经验对11926条病历记录进行手动标记。这五个小组的医生涵盖住院医师到主任医师,临床实践从3年到25年不等。每组中的医生从独立验证数据集中读取2981个临床记录的随机子集并分配诊断。每条患者记录被随机分配并由四名医师(每组一名)评分。我们使用F1评分评估了每个医师组在前15个诊断类别中的诊断表现。

(责任编辑:波少)
广告位API接口通信错误,查看德得广告获取帮助