自2022年11月ChatGPT推出以来,生成式大语言模型强大的信息整合能力、自然语言处理能力引发了公众的关注,诸多行业已经探索如何引入大模型技术来提质增效,AI大模型的浪潮正以革命性姿态冲击各行各业,资源紧张的医疗行业也不例外。
在第九届浙江国际健康产业博览会上,网易杭州研究院与浙江省人民医院联合演示了一个“玉言医疗文献领域大模型”,旨在解决医疗人员在科研工作中的主要痛点。
网易副总裁、网易杭州研究院执行院长、网易数帆总经理汪源表示:玉言医疗文献领域大模型基于网易AI技术积累和浙江省人民医院专业医疗知识、数据研发而成,具有懂专业、懂场景、更安全和更高效四大特色,能够在文献流程中有效提升医疗科研的效率,加速医疗智能化升级。
公开资料显示,从海外到国内,从微软、谷歌等巨头到医联等垂类企业,目前进军医疗领域的大模型已超过了40个,包括药物挖掘、医院管理、辅助医疗科学研究、疾病风险预测、辅助诊疗、医学影像和虚拟助理等不同细分领域,每个赛道都有多家企业涉足。
汪源表示,传统AI技术在医疗领域存在应用范围狭窄、学习能力不足、投入成本过高等缺陷,如早期的“专家系统”,需要对每种疾病甚至每个医生的观点进行构建,难以普及推广。相比之下,大模型“封装”了大规模数据预训练的知识,具备优秀的上下文学习和复杂推理等能力,能够在医疗领域实现更强大的通用性和准确性,其落地潜力为医疗AI发展带来了新的曙光。
作为一家大型综合性三级甲等医院,浙江省人民医院正在从数字化建设向智能化迈进。浙江省人民医院科研部副主任叶潇医生表示: 医院开展了多类癌种人工智能辅助决策系统的开发,其智慧医院“三位一体”建设已达国家优秀标准,引入医疗大模型加强医疗、科研、服务、管理效率成为了未来的工作目标。为此,浙江省人民医院选择了网易杭州研究院作为技术合作伙伴,推进医疗大模型应用,进一步提高发展质量。
由于训练数据及训练方法等原因,大模型存在难以克制的“幻觉”,即一些看似有理实则错误的回答,这是该技术生产落地的核心障碍之一。尤其是在医疗这样非常专业、严肃、敏感的特殊行业,如何克服AI幻觉实现严苛的专业度和准确率极为考验研发团队的实力。
为此,网易杭州研究院和浙江省人民医院结合院方科研项目稳定增长、亟需借助AI提效的需求,以医疗科研为突破点落地大模型,并成功研发了玉言医疗文献领域大模型。医疗文献场景对AI幻觉的容错性更高,落地风险更小,同时医院医疗科研痛点明显,是一个绝佳的突破点。
汪源介绍,玉言医疗文献领域大模型以浙江省人民医院医学知识和海量医疗文献数据为基础,在网易自研的玉言大模型基座之上,根据领先的知识增强领域大模型方法论定制优化而成,为医疗科研应用提供支撑。领域大模型专注垂直领域专业数据和知识,对专业理解更精准,知识增强技术则相当于给大模型外挂个性化知识库,能够提升细分领域问题解决率。这一方法论已经被成功应用来为网易数帆ChatBI、EasyData、CodeWave、轻舟云原生等核心产品增强智能特性。
为了实现玉言医疗文献领域大模型在细分领域“懂专业”的能力,以匹配科室需求,网易杭州研究院研发人员构造了超过100万条专业数据用于模型的监督微调,其中90%为浙江省人民医院优选的内分泌领域数据,包括疾病知识、药品咨询等知识图谱数据,和论文、指南、医学书籍等文献数据,以及摘要、翻译、纠错、润色等数据。这是通用大模型所难以企及的。而且在知识增强技术之下,随着医疗科研人员不断在使用中对模型结果进行打分、排序,模型将会越来越“懂专业”。
“懂场景”方面,叶潇医生表示: 玉言医疗文献领域大模型覆盖了文献筛选、文献阅读、科研写作等医疗科研文献多个应用场景需求,能够深度识别用户意图,深层次地理解和处理海量医学科研文献,加速医学前沿信息获取、权威知识触达,简化信息汲取流程,辅助科研成果更好更快见刊。
此外,模型私有化部署的设计,以及网易专业的定制优化能力,为玉言医疗文献领域大模型带来了敏感医疗数据“更安全”、推理“更高效”、资源消耗更少的特点。这些特点,对于模型在医院的部署应用也极为重要。
结合自身强大的产品策划和软件工程能力,网易杭州研究院已经基于玉言医疗文献领域大模型开发了一款医疗文献管理的产品原型,包含文献检索、文献问答、文献综述、文献翻译和辅助写作等实用功能,并提供给浙江省人民医院试用,收集反馈优化。汪源通过一段视频简要演示了文献翻译和文献综述功能的效果,这两项能力为医疗科研带来了前所未有的体验,获得了浙江省人民医院的初步认可。汪源认为,这符合“技术无价、产品为王”的论断,验证了玉言医疗文献领域大模型的业务价值。
展望未来,汪源表示,网易杭州研究院将与浙江省人民医院一道,以玉言医疗文献领域大模型为起点,在模型方面持续加强前沿技术研发强化“内功”,在场景方面把科研领域做精做深后逐步覆盖更多细分领域需求,不断提升医疗大模型的落地能力,并推广行业应用,促进我国医疗行业智能化升级。