2024年值得关注的国内医疗大模型

 SuperCLUE:2024 年最值得关注的中文大模型全景图展示了不同类型的中文大模型及其相关信息,主要分为文本、多模态和行业三个类别。

文本类别

通用闭源:包括文心一言(字节豆包)、通义千问、腾讯混元、商汤日日新、BlueLM、360 智脑、天工、MiLM、中科闻歌、紫东太初、百川智能、智谱・AI、云知声、山倒、零一万物、盘古大模型、oppo、AndesGPT、ZTE 中兴、讯飞星火、天翼 AI、西湖心辰等。

通用开源:有 Qwen2.5、deepseek coder、GLM-4、MiniCPM、Yi、Baichuan2、RWKV-LM、TeleChat2-35B、书生・浦语等。

推理:包含 QWW-32B-Preview、DeepSeek-R1-Lite、InternThinker、K0-math、Skywork o1、360gpt2-o1、LLaVA-CoT 等。

多模态类别

实时交互:如星火极速、智谱清言、海螺 AI、豆包、文小言、通义 APP、日日新、HiKimi 等。

文生视频:可灵 AI、豆包梦 AI、清漪、Vidu、PixVerse、海螺 AI、HiDream.ai、通义万相。

视觉理解:腾讯混元、阶跃星辰、Qwen2-VL、Doubao-vision、SenseChat-Vision、海螺 AI、GLM-4v、书生・万籁。

文生图:豆包梦 AI、混元 - Dit、快手可图、CogView、讯飞星火、meitu、通义万相、文心一格。

语音合成 / 声音复刻:Doubao - 语音合成、百度 TTS、讯飞语音合成、CosyVoice、Fish Audio、speech-01。

行业类别

医疗:百度灵医、医联 MedGPT、百川 AI 全科医生、讯飞晓医等。

汽车:理想 MindGPT、DriveGPT、极氪 Kr 大模型、易车大模型等。

教育:MathGPT、作业帮、子曰等。

金融:蚂蚁金融大模型、妙想金融大模型、HithinkGPT 等。

工业:奇智孔明 Alnno-15B、华为盘古工业大模型、SmartWare、SMore LrMo、羚羊工业大模型等。

更多行业:营销(探迹 SalesGPT)、文化(阅文集团妙笔大模型)、法律(Chat Law)、AI/IS(DP 深势分子大模型)等。

其中最值得关注的是其中的医疗大模型:

百度灵医:百度灵医大模型是百度推出的一款面向医疗健康领域的大语言模型,旨在通过其强大的生成式服务能力,为医疗行业提供更专业、更准确、更丰富的AI解决方案。该模型基于百度文心大模型技术底座,融合了全国超800家医院、4000多家基层诊疗机构的智慧医疗服务经验,具备深度语义理解及生成能力。

        百度灵医大模型的训练过程主要涉及以下几个关键步骤和技术:

        在数据准备阶段,模型的训练数据涵盖了“医-患-药”全场景的医疗健康数据,包括线下诊疗场景的脱敏病历、文献指南、医疗知识图谱数据,线上场景的科普知识、健康医典、健康咨询数据,以及贯穿全生命周期的全球药品器械数据等,这些数据确保了模型训练的全面性和准确性。此外,百度与人卫智数、爱思唯尔(Elsevier)等业内权威医学知识库达成深度战略合作,获取高质量的医学文献资源,进一步丰富了训练数据的来源和质量。

        在模型架构方面,灵医大模型依托百度文心大模型作为技术底座,文心大模型本身具备强大的生成式服务能力,为灵医大模型提供了坚实的技术基础。灵医大模型推出了Lite版、旗舰版和定制版三个版本,分别对应不同的参数规模和应用场景,这种多版本的架构设计使得模型能够满足不同用户和场景的需求。在训练过程中,模型在预训练阶段使用了千亿token的医疗类训练语料,通过大规模的自监督学习,让模型初步掌握医疗领域的语言和知识结构。循证AI技术被深度整合到训练过程中,循证医学强调基于证据的决策,模型通过这种方式避免了自行创造医疗知识,减少了“幻觉”的产生,确保了输出内容的准确性和可靠性。

        灵医大模型支持多模态交互,能够理解患者输入的文字、图片和语音,在训练过程中,模型通过多模态数据的融合,提高了对复杂医疗信息的理解能力。在优化与反馈方面,模型通过内部和外部的双重反馈进行优化,内部反馈来自于模型自身的评估和调整,外部反馈则来自于实际应用中的用户反馈和专家评估,这种机制使得模型能够持续学习和改进,不断提升其在医疗领域的表现。 

        在模型开发过程中,百度邀请了上百名来自专业医疗机构、三甲医院的医生,对模型的作答结果进行了盲评,通过专家的评估和测试,确保了模型在安全性、正确性、逻辑性、理解力和完整性等方面的表现优异。通过这些训练方法和技术,百度灵医大模型能够不断提升其在医疗领域的专业性和准确性,为医疗行业提供更可靠、更高效的AI服务。

        百度灵医大模型的训练是一个复杂的过程,需要遵循一系列步骤和技术要求。首先,需要收集海量的医疗数据,包括线下诊疗场景的脱敏病历、文献指南、医疗知识图谱数据,线上场景的科普知识、健康医典、健康咨询数据,以及全球药品器械数据等,并对数据进行清洗与标注。其次,选择一个适合的预训练大模型作为基础,如GPT、BERT等,使用准备好的数据进行预训练,让模型学习医疗领域的语言和知识结构。然后,在预训练的基础上,针对具体的医疗应用场景和需求,使用更专业、更细分的数据进行微调,使模型更好地适应特定的医疗场景。此外,需要将RAG技术集成到模型中,通过检索相关的医疗知识和数据,为模型生成答案提供更准确和全面的上下文信息,同时加入多模态处理能力,使模型能够理解患者输入的文字、图片和语音。在开发过程中,进行多轮内部测试和专家评估,确保模型的医学准确性和可靠性。最后,根据模型的规模和应用场景,选择合适的部署方式,并开发基于灵医大模型的应用程序或服务,将模型的能力嵌入到实际的医疗业务流程中,为用户提供便捷、高效的医疗服务。
 

医联MedGPT:医联MedGPT是由医联公司研发的一款医疗大语言模型,被誉为国内首款AI医生。该模型基于Transformer架构,通过大模型技术,结合医疗知识图谱和大量的真实医患沟通数据进行深度训练,具备从疾病预防、诊断、治疗到康复的全流程智能化诊疗能力。在核心功能方面,MedGPT能够通过多轮对话的方式全面了解患者的病情信息,然后给出疑似诊断和诊断理由,并推荐必要的检验检查项目。

        此外,它还能对患者的检验检查结果进行分析和解读,并根据诊断结果提供个性化的治疗方案,包括药品治疗、手术治疗等。在治疗过程中,MedGPT还可以进行随访,调整治疗方案以适应患者的具体情况。技术特点方面,MedGPT实现了多模态输入输出,首次突破了AI医生无法与真实患者连续自由对话的难点,其诊断结果与患者原有线下门诊的诊断吻合率超过97.5%,显示出高准确性。

医联MedGPT采用了多项先进的技术来实现其医疗大语言模型的功能:

        它基于Transformer架构的大模型技术,该模型的参数规模达到了1000亿,确保了其强大的计算能力和处理复杂医疗数据的能力。其次,MedGPT结合了医疗知识图谱,为模型提供了丰富、准确、结构化的医疗知识,知识图谱能够将医学概念、关系和属性以结构化的方式表示出来,帮助模型更好地理解和推理医疗信息。通过收集整理接近20亿条真实医患沟通对话、检验检测和病例信息进行深度训练学习,这些大量的真实数据使得模型能够准确理解患者的病情描述、症状表现和医疗需求,以及医生的诊疗思路和方法。

        为了进一步优化模型,MedGPT利用医生的真实反馈进行强化学习,不断调整模型的推理逻辑和诊断策略,使其更符合临床实际需求,提高推理质量、准确性和可靠性。同时,MedGPT支持多模态的输入和输出,在医疗问诊场景中可以接收和处理多种类型的数据信息,如文本、语音、图像等,这种多模态能力使得模型能够全面实现疾病的预防、诊断、治疗、康复四个重要环节的智能化。为了提升模型的性能和稳定性,MedGPT结合了一系列工程调优技术,包括算法优化、模型压缩、并行计算等,有效提升了模型的运行效率和响应速度。为了确保模型的医疗准确性,MedGPT采用了医学一致性校验技术,通过与真实医生的诊断结果进行对比和校验,及时发现和纠正模型的错误,使模型的诊断结果更加可靠。在模型微调训练阶段,MedGPT采用了大量真实医生参与的RLHF(Reinforcement Learning from Human Feedback)监督微调,这种监督微调方式能够进一步提升模型的疾病特征判断与模式识别能力,确保其在实际医疗场景中的准确性。

        MedGPT整合了多种医学检查检验数据,如影像、生化、病理等,通过深度学习、自然语言处理等AI技术,开发了一系列多模态医学应用,如智能预问诊、智能分导诊、报告解读等,进一步拓展了医疗服务的广度和深度。最后,MedGPT采用了快慢系统结合的工作流,快系统通过高效的算法和模型实现病情的快速初步评估和科室推荐,而慢系统则针对复杂、疑难病例提供更为详细和准确的诊断建议和治疗方案,这种结合提高了AI在医疗决策的准确性,消除了大模型在医疗应用中的“幻觉”问题。

百川AI全科医生:模型的实现方式主要包括以下几个方面:首先,百川智能利用大语言模型(LLM)技术,模拟全科医生的思维方式和综合诊断治疗能力。这种技术通过大数据分析和算法,自主获取医学领域专业知识并进行高级医学推理。其次,百川智能的通用医疗增强大模型Baichuan 4在专业医疗知识方面进行了万亿token级别的增强训练,使得模型在美国执业医师资格考试题目测试中的准确率超过94%。此外,百川智能与海淀区卫健委合作,基于前沿医学知识、医疗专家经验等高质量数据构建了一个医疗领域的多模态大模型,具备疾病诊断、辅助决策、预后预测、慢病管理等能力。

        百川智能的AI医学系统通过大量数据建构而成,并结合团队创新的机器学习训练策略,使得性能表现比其他现有模型更为优秀。为了提升医疗人员对AI模型的信任度,百川智能采用了可解释的人工智能(XAIM)框架,这是一个创新的AI框架,用于剖析各个AI医学系统如何作出决策,并为系统的诊断结果提供图像及文字解释。最后,百川智能与海淀区卫健委合作的模式采用“1+2+N”方案,即1个多模态医疗大模型,2个AI医生(AI全科医生、AI儿科医生),以及N个不同场景的应用。这种模式旨在实现居家-基层-医院的多级赋能,推动分级诊疗落到实处。通过上述技术和方案,百川智能成功研发了AI全科医生模型,旨在提升基层医疗服务的质量和效率。

讯飞晓医:是由科大讯飞医疗推出的个人AI健康助手产品,其背后的技术支持和模型制作技术主要包括以下几个方面:首先,讯飞晓医基于讯飞医疗多年的行业知识积累,依托于讯飞星火医疗大模型的核心能力支撑,这个大模型能够通过语音、文字等多模态信息进行理解与交互,模拟医生进行自由对话。其次,讯飞晓医支持用户多轮交互和多模态交互(文字,语音,图片),能够随时随地响应用户的医疗健康问题,并给出即时病情分析。此外,讯飞晓医高分通过临床执业医师资格考试综合笔试测试,回答专业、全面且详细,成绩超过96.3%的人类考生。

        讯飞医疗已建立围绕深度神经网络、深度学习和医学知识图谱的核心技术框架,以及在医疗领域应用的语音识别、图像识别及自然语言理解等专有核心技术。讯飞医疗推出了唯一基于全国产算力训练、自主可控平台训练出的讯飞星火医疗大模型,该模型面向300多种医学场景应用。讯飞医疗是唯一一家参与制定“医疗大模型的技术评估体系和标准规范”的企业,该体系属于中国第一批基于行业标准拟定的相关医疗人工智能技术使用规范,用以评价人工智能技术在医疗行业的应用。

        讯飞晓医可以根据用户的健康状况,生成个性化的健康调理方案和养生建议。依托讯飞星火医疗大模型,构建以人机协同的全程患者管理平台,为患者自动生成个体化、精细化、专业化的诊后管理方案。讯飞晓医APP已通过数据安全与隐私保护的多类权威认证,进一步保障健康数据的安全。通过这些技术和标准,讯飞晓医能够为用户提供症状自查、药物查询、中医辨证、报告解读、医院推荐、科室推荐、饮食建议等七大功能,满足用户在看病前、用药时、检查后的核心场景健康需求。