天津电机维修_天津进口电机维修_天津特种电机维修_天津发电机维修天津电机维修_天津进口电机维修_天津特种电机维修_天津发电机维修

国内首个脑血管专病大模型亮相 对话参与医生:被AI“上了一课”

国内首个脑血管专病大模型亮相 对话参与医生:被AI“上了一课”

  每经记者 林姿辰    每经编辑 张海妮(nī)    

  距离谷歌大(dà)模型(MedPaLM 2)拿(ná)下(xià)美国医学执照考试已经快两年了,人工智能(AI)够(gòu)资格成为临床医生的“假想 敌(dí)”了吗?

  今年7月,一篇发表于Nature Medicine的论文显示(shì),即使是目前最先进(jìn)的大语言模型(LLM)也无法为所有患者作出准(zhǔn)确诊断,且(qiě)诊断正确率(73%)明显差于人类医生(89%);在(zài)极端情况(胆囊炎诊(zhěn)断)下,LLM的正确(què)率仅为13%。

  但(dàn)对于北京清华长庚医院神经中心医师(shī)邳靖陶来(lái)说(shuō),他今年刚被(bèi)AI“上了一课”。8月下旬(xún),邳靖陶(táo)参与的灵犀医学脑血管病(bìng)专病大模(mó)型正式发布,该模型由其所在(zài)医院的神经中心武剑教授(shòu)团(tuán)队主(zhǔ)导研发,是国(guó)内(nèi)首(shǒu)个基于专病的医学人工智能模型(xíng)。

  “大模(mó)型的能力(lì)说强也强,说(shuō)弱也(yě)弱,我们不能让它(tā)天马行空地自由发(fā)挥。”邳靖陶表示,专病(bìng)大模型与ChatGPT的最大不同,是要将AI杜撰(zhuàn)的似是而非的诊疗建议扼杀(shā)在摇篮里,避(bì)免灾难性后果。

  8月下旬,灵犀医学脑血管(guǎn)病专病大模型正(zhèng)式发布,该(gāi)模型(xíng)由北京清华长庚医院神经中心武剑教 授团队主导研发,是国内首个基于专病的医学人工智能(néng)模型。图为(wèi)灵犀医学大模型(xíng)技术(shù)交流会现场。 受访(fǎng)者供图

  对标专科和专病专家

  作(zuò)为国内四(sì)大慢病之一,脑血管病的首次发病者约有三分(fēn)之(zhī)二是60岁以上的老年(nián)人,其(qí)具有“高发病率、高患病率、高死亡(wáng)率、高复发率”的特点。而截至2021年,我国65岁及以上(shàng)的老年人口已(yǐ)经(jīng)超过2亿人,脑血管病医生短缺 、水平参差不齐(qí)的问题尤为突出。

  “基层医(yī)院(yuàn)不缺全(quán)科医(yī)生,但缺 专科(kē)专家或专(zhuān)病专家(jiā),这就是大模型要 解决的问题。”邳靖陶介绍,脑血管病专病大(dà)模型是医疗机构与科技企业的合作(zuò)产物。具体来说,新华三(sān)集团提供技术人员、AI算法(fǎ)和算力,北京清华长庚医院和清(qīng)华大学提(tí)供大数据和临床(chuáng)需求,共同打造一款面(miàn)向临床医生的辅助诊断(duàn)工具。

  武剑教授曾表示,医学人工智能在缓解医疗资源(yuán)紧(jǐn)张和提升医疗服务水(shuǐ)平方(fāng)面(miàn),具(jù)有巨大的潜力和(hé)优(yōu)势。其核心在(zài)于对海量健康数据(jù)的深(shēn)度挖掘和(hé)智能(néng)分析,这能够大幅(fú)提升临床诊断和治疗(liáo)的准(zhǔn)确性与效率。

  目前,这个大(dà)模型的核(hé)心功能是分析 和(hé)提取病(bìng)历中的(de)关键信(xìn)息,并与临(lín)床知识库相匹配,最终提供符(fú)合临床(chuáng)指南的(de)标(biāo)准化治疗建议。

  一方面,临床医生可以输入脱敏(不包括患者个人信息)的临床病程信息,由大模型生成最终的治疗方案。其间,如果大模(mó)型(xíng)察觉(jué)到病程信(xìn)息存在疏漏,会提醒医生(shēng)及时补充,保证病历(lì)记录的标准化。

  另一方面(miàn),临床医生也可以输入患者主诉(如主要(yào)症状和持续(xù)时间等信息(xī))等简单信息(xī),大模型(xíng)将通 过选择性交 互引导问诊方向,根据医生(shēng)点击的选项,逐步完善临(lín)床诊(zhěn)疗过程,提升医生(shēng)的循证能力。

  专业性体(tǐ)现在两方面

  在邳(pī)靖陶看来,与ChatGPT等通用大模(mó)型相比,专病大模(mó)型的专业性体现在(zài)思维链和知识库两(liǎng)方面。以(yǐ)脑(nǎo)血管病专(zhuān)病大模(mó)型为例,其数据来源包(bāo)括两大部分:一部分是国内首个脑血管专病大模型亮相 对话参与医生:被AI“上了一课”经过脱敏处理的临床 资料(liào),涉及疾(jí)病的特定特征,发病情况以及诊疗过程等综合信息。另一部分(fēn)是公开获 取的临床指南、大量神经病学(xué)和(hé)神经科学的教科书和参考书籍,这些构成(chéng)了数据库的核心内(nèi)容(róng)。值得注意的是,大模型并不能直接接收这些知识,而是需要经(jīng)临(lín)床医生和(hé)工科团(tuán)队之手,将(jiāng)临(lín)床指(zhǐ)南的(de)框(kuāng)架和重点(diǎn)内(nèi)容重新整理,转化为计算(suàn)机能够理解(jiě)的语言和流程后,再(zài)输给大(dà)模型。

  “如果不加限制地(dì)直接投喂,大模型会发散到其(qí)他方面,生(shēng)成一些新的理(lǐ)解。但临床指南已经是最(zuì)高(gāo)级别的标准化诊疗推荐(jiàn),在此基础上的任何修改都是错误的,也不是我们想要的。”邳靖陶(táo)告诉记(jì)者,想让大模型“听话 ”,除了要投喂计(jì)算(suàn)机能“听(tīng)懂”的知识,更(gèng)关键的是教给它一套临(lín)床医生的“思维链”,并(bìng)依托这一能力对不同患者(zhě)的临床资料进行推理。

  例如,一位脑血管病医生的诊疗流程大致包括询问病史,进行体格检查,考虑辅助检查,综合分析后给出准确诊(zhěn)断等 环节。基于诊断(duàn)结(jié)果,医生会考虑患者的(de)具体病因和其(qí)他(tā)基础(chǔ)疾病 情况(kuàng),结合标准化的诊疗建议,制定规(guī)范化的治疗(liáo)方案。

  在这个过(guò)程中,不同的(de)患(huàn)者主诉指向不同的询问(wèn)方向。但问题是,大模型的(de)思维(wéi)虽然“发散”,但不(bù)具备自 主搭建思维链的能力,所(suǒ)以需要工科团(tuán)队(duì)深(shēn)刻 理解临床诊疗场景,将(jiāng)医生的(de)临床(chuáng)思维转(zhuǎn)换为机器(qì)可以理解的思 维。而(ér)这个过程让(ràng)临床医生和技术团队,都(dōu)经历了交叉学习的历练(liàn)。

  “Gap(差距)主要是语言交(jiāo)流(liú)上的障碍,比如 我 们不理解思维链,他们不理解不同疾(jí)病间的关系。但(dàn)这不会对我(wǒ)们的研究造成实(shí)质性影响,只要了解对方领域(yù)的基 础知识,就(jiù)能扫清(qīng)困(kùn)难。”邳靖陶说。

  负责的仍是临床医生

  邳靖陶透露,目前(qián)脑血管(guǎn)病专病大模型正在北京清华长庚医院神经中心进行临床验证。此前,他和同(tóng)事们(men)使用真实(shí)病例或模拟复杂临(lín)床场景,对大模型(xíng)进行过内部测试。这项测试建立在前(qián)期简单测试的基础之上(shàng),旨(zhǐ)在评估大模型对不同复杂程度、不(bù)同语言风(fēng)格(gé)和(hé)不同级别医生的病历的理解能力。

  其中,最困(kùn)扰邳靖陶的一个问题是,如果大模型出(chū)现了错误,怎(zěn)么保(bǎo)证临床医生不受干扰呢?换言(yán)之,临床医生应该怎么(me)处(chù)理和大(dà)模(mó)型之间的 关系?

  这一矛盾在首次内部测试时(shí)就(jiù)出现了。当(dāng)时,邳靖陶(táo)模(mó)拟了(le)一个复杂的临床场景(jǐng),大模型给出的治疗方案和预想的“标准(zhǔn)答案”有所出(chū)入。随后,技术(shù)人员介入并回溯 了(le)大(dà)模型的推理过程,试图找出可能的错(cuò)误,却无功(gōng)而返。而当邳靖陶用“标准答案”去匹配临床指南时,让 他印象深(shēn)刻的结(jié)果出现了:是自己的诊疗思 路存(cún)在盲区。

  “一开始这个 模型设计(jì)出来,到底能不能用于临床(chuáng),能不能起到提升和改善(诊疗效(xiào)率)的(de)作用,其实我心里也没有底。但是这件事之后,给了我(wǒ)特别大(dà)的底气(qì)。”邳靖陶总(zǒng)结这次经历(lì),发现患者的临床症状是(shì)一个(gè)综(zōng)合(hé)结果。例如(rú),患者(zhě)可能因(yīn)为神经(jīng)系统问题住院,但心血(xuè)管、肾脏(zàng)、肝脏状况也在发生(shēng)变化。尽管医生接受过规范化(huà)的专科培训,但诊疗思维仍可能存在盲点(diǎn),无法保证每次都能提供全面的(de)诊疗方案。

  另外,临床指南是不断更新的,并非所有(yǒu)医生都能及时更(gèng)新(xīn)知识。当医生(shēng)的知识更新滞后时,大(dà)模(mó)型可以(yǐ)帮(bāng)助弥补这些纰漏。

  不过,阅(yuè)读指南并作出判断(duàn),仍(réng)是临床 医生(shēng)不能丢弃的基本(běn)功。邳靖陶表示(shì),如果(guǒ)医生发现大模型(xíng)提供的诊疗方(fāng)案与自(zì)身判(pàn)断不符,不应简单地接受或拒绝,而应深入探究原因。这一思考(kǎo)过(guò)程(chéng)有助于医生提高临床诊疗能力(lì),是大模型作为临床辅助诊断工具的终(zhōng)极愿景。毕竟,虽然大模型可以提供结论,但对诊疗过程(chéng)负责的仍是 临床医生本人。

  呼吁更多人加入

  2023年7月,谷歌Research和DeepMind共同打(dǎ)造(zào)的 全球首个全科(kē)医(yī)疗大模型Med-PaLM M正(zhèng)式(shì)发布(bù)。资(zī)料显示,这(zhè)个大 模型具备临床语(yǔ)言、影像和 基因(yīn)组学(xué)的(de)理解(jiě)能(néng)力,用于临床(chuáng)指日(rì)可待。

  而根据《2023医疗健康AI大模(mó)型行业研究报告》,截(jié)至(zhì)2023年10月(yuè),国内累计公开的大模(mó)型数量达到238个,其中,医疗大模型(xíng)近50个,涉及患者(zhě)问诊、医生助 手 、药物研发(fā)、健康科(kē)普等多个领域。据邳靖陶观(guān)察,许多医疗大模型的开发从(cóng)“全科”出发,试(shì)图直接构建一个(gè)涵盖所(suǒ)有专科的大型(xíng)全科模型,供(gōng)用户咨(zī)询各种疾(jí)病。

  但(dàn)在参(cān)与构建脑血管病专病(bìng)大模型(xíng)后,武剑(jiàn)教授团(tuán)队对这一模(mó)式表示怀疑(yí)。他们发现,把一种疾病的临床指(zhǐ)南梳(shū)理清(qīng)楚颇具难(nán)度,打造对应(yīng)的思维链也耗(hào)时耗力,短期内很难用同样的方法训(xùn)练出全(quán)科模型(xíng)。换言之,目前(qián)的(de)全科大模型能够做到医学(xué)科普,但(dàn)很难在(zài)特定专科领域(yù)提(tí)供有效的临床指导。因此,武剑教授团队的研发思路是以专(zhuān)病为起点,再走(zǒu)向全科。

  “如果针对脑血管病的专病大(dà)模型走通了,我们可以把成功经验复(fù)制 到其他神经系统疾病上;如果神经系统(tǒng)疾病覆盖(gài)全面了,就成了专科大模型(xíng);神经科的经验再复制(zhì)到其他科,就会形(xíng)成一个真正的全(quán)科医疗大模(mó)型。”邳靖陶表示,在武剑教 授看来,国内发病人(rén)数越多、疾病负担越大 的疾病,其专病大模型的临床需求和研发空间就会越(yuè)大,例(lì)如我(wǒ)国发病率最高的四大慢病 ——高血压、糖尿病、冠心病、脑血管病都(dōu)有非常广阔的(de)大模型开(kāi)发空间。

  而在脑血管病专病大模(mó)型的发布会上,武剑教授已经通过招(zhāo)募(mù)令的形式,呼吁全国神(shén)经系统疾病领域的专家,以及人工智能领域的专业人士携手把握创新技术的改革可(kě)能,改善(shàn)临床诊疗现状。他表示,如(rú)果能打破学术壁垒,医疗大模(mó)型的重复性工作是(shì)完全可以(yǐ)避免的。

  “这不是我们一个人(rén)能做的事情。”邳靖陶说。

责任编辑(jí):何松琳

未经允许不得转载:天津电机维修_天津进口电机维修_天津特种电机维修_天津发电机维修 国内首个脑血管专病大模型亮相 对话参与医生:被AI“上了一课”

评论

5+2=