
撰文 | 文 慧众盈易配
AI问诊、AI影像、AI病理、AI医生、AI制药……人工智能正在引发医疗健康领域的深刻变革,并逐步改变着人们的生活。
当AI与基因科技相融合,将激发出怎样的创新火花?作为我国基因行业的领军者,这个9月,华大基因继去年发布行业首个基因检测多模态⼤模型后,再次交出新答卷。

GeneT Agent是基因检测领域的通用智能体,可智能拆解并完成基因检测各项任务,处理建议与临床专家的诊断⼀致率高达98.5%,案例分析整体效率提升60.7%;iGeneT Pro作为专业的基因检测智能解读平台,可以帮助专业解读人员完成生物信息学分析、临床解读、报告生成以及遗传咨询等环节。
“在大数据和人工智能不断革新的背景下,行业迎来了新的答案,正逐步实现从专家经验驱动,走向数据与智能驱动。”华大基因副总裁朱师达博士表示。
基因检测“智惠化”
基因测序作为分子诊断领域的最前沿发展方向,已广泛应用于产前诊断、抗击传染病、早期筛查、癌症分子分型及精准用药等多个领域。此外,随着单人全基因组测序成本的显著下降,基因科技逐渐不再“高不可攀”,以用于筛查唐氏综合征的无创产前基因检测为例,2019年前河北省的价格每例为2400元左右,现今仅需345元。
基因检测的市场需求与日俱增。据BCC Research发布的数据显示,预计到2026年,我国基因测序市场规模将达到42.35亿美元。
海量的需求背后,是专业人才的匮乏。一名成熟的基因检测解读专家,在大学毕业后还至少需要5年的培养周期,3年硕士加2年专业培训。曾有数据显示,我国遗传咨询师缺口高达10万。
“如何高效、精准地解读⼀个⼈近100G的测序数据?如何结合个体复杂的临床信息,从500万个潜在变异位点中,精确锁定5个可能致病的关键点,并最终生成⼀份权威、可靠的基因检测报告?”在朱师达看来,仅仅依靠有长期经验和丰富技术知识积累的临床技术专家,难以支撑日益增长的检测需求。
当大数据和人工智能兴起的今天,有没有更智能、更高效的解法?华大基因表示众盈易配,有!
2024年,华大推出了行业首个基因检测多模态大模型——GeneT。这是华大基因在AI大模型领域的重大突破。朱师达介绍,GeneT利用超过百万级的高质量数据,构建了百亿级的高质量token,结合解读专家经验,能够从数百万个变异位点中快速筛选出与临床表型相关的致病突变,实现了对全基因组数据的精准解读,在模拟样本和真实临床样本的测试中,GeneT均展现出了极高的准确率。
“质控准确率达到99%,推荐30个位点的准确率甚至高达99.8%。”朱师达表示,GeneT现已⼴泛应⽤于241家合作机构,赋能于临床诊断和治疗的各个环节。
一年后,基于GeneT,华大基因又推出了GeneT Agent和iGeneT Pro。

朱师达介绍,GeneT Agent作为行业首个基因检测通用智能体,具有很强的自主学习和任务拆解的能力,可以根据用户需求,自动分解基因检测任务并执行,实现了问诊增强、生物信息分析、质控验证、证据查询、报告生成以及遗传咨询等功能。
“它就像一位专业的助手与顾问,协助你在每一个环节做出更准确、更高效的选择。”在与多家权威医院的联合测评中,GeneT Agent提出的处理建议与临床专家的诊断一致率高达98.5%,案例分析的整体效率提升了60.7%,致病性判断时间节约51.3%。

而iGeneT Pro则是一个工作站,是专业的基因检测智能解读平台,集成了八种AI功能,全面覆盖基因检测的各个环节,如生物信息学分析、临床解读、报告生成以及遗传咨询,甚至还包括如何去设计引物等。
“华大在基因多组学和表型数据集的优势,让我们的基因检测智能体和智能模型都在各个临床应用场景中取得了更好的表现。”朱师达说。
他还强调:“我们也希望通过人工智能使得基因检测、解读等看似遥不可及的场景,变得与普通用户更为贴近。不仅能让经过专业培训的医生和专家理解,还能让受检者本人也能看懂,从而帮助他们更深入地理解检测结果,能够更好地去为自己的健康做决策。”
大数据改变临床
GeneT Agent和iGeneT Pro均是华大基因“智惠医学系统”的组成部分众盈易配。
朱师达表示,智惠医学系统的核心是“数据聚生态,智能惠场景和云边智协同”,把分散的健康数据和临床应用连接起来,让数据真正流动起来,并转化为可用的健康服务。
他进一步解释,“数据聚生态,构建一体化数据中枢,高效集成科研、临床的全周期数据,彻底打破数据孤岛,打造高质量数据底座;智能惠场景,是指聚焦临床核心需求,将云端能力下沉至医疗一线,真正让数据转化成惠民服务;云边智协同,打通云端和边端的节点,让数据进行实时分析,通过智能模型的迭代和算法,让AI和多组学技术真正全方位守护大众健康。”
朱师达认为,大规模数据积累与人工智能应用,正在重塑疾病预防、诊断和管理的方式。
“我们对这个世界的理解还远远不够。理解来自于认知,认知来自于信息,信息来源于数据。”朱师达表示,世界上还有太多多维度数据没有被收集,太多数据空白等待填补;同时,已经大量存在的数据还远没有发挥它应有的价值作用,处于数据沉睡的状态。“这就是大数据时代的两个关键问题,如何获得高质量数据和如何高质量使用数据。”
2024年,华大基因与北京大学医学部合作,对CKB(中国慢性病前瞻性研究)项目的研究对象的生物样本开展全基因组测序,近50万人的基因组学数据,将极大填补相关数据的不足,也将为后续深入研究疾病的发病机制和遗传基础、开展疾病风险预测等提供强有力的数据支撑。
填补数据空白具体有什么作用?朱师达举了一个例子,早产是母婴健康的隐形刺客,成因错综复杂,华大基因通过Transformer架构串起游离DNA和RNA的数据,将基因组学、转录组学与大语言模型结合,设计出一个高精度的早产风险预测模型,极大提高了早产风险预测的准确性,远超任何单一模型的作用。“AI与数据的联手,丝滑而有力。”
而当沉睡的数据“醒”过来,就是拯救生命的光。肺癌常居恶性肿瘤之首,但其遗传背景还远未厘清。华大基因通过全基因组和多组学的数据整合,不仅验证了已知的易感位点,还发现了很多新的关联基因,为早期干预提供了靶点。
“华大基因的数据集已从最初的30兆迈向了100P。”朱师达表示,就在前不久,华大基因申报的“分子检测高质量数据集建设”项目,成功入选国家数据局“行业高质量数据集建设先行先试”工作名单。
数据的流动,最终是要应用到临床实践中。“在出生缺陷防控领域,真实世界数据的积累与应用,帮助无数家庭迎来健康新生儿;在肿瘤与慢病防治中,基于大规模人群数据的早筛早诊,为患者赢得宝贵的治疗窗口;在感染性疾病防控方面,快速整合和解析多源数据,使公共卫生体系能够及时应对风险,筑牢安全防线。”
让科技进步人人可及
“基因作为遗传信息的载体,其实跟我们的生活息息相关,每个人从出生、成长到衰老,都可以通过基因检测和其他多组学技术来实现更好的生活。”这些技术不仅能在临床中解决关键问题,也能为普通人更好地了解自身状况提供方案。据朱师达介绍,基于多组学数据和技术方案,华大还推出了133111i健康管理新模式。

133111i,即“1基线(全基因组)+3管(生化标志物)+3图(影像学)+1镜(内镜)+1生理(健康动态)+1脑科学(脑健康)”,融入了基因组学、代谢组学、蛋白质组学、表观组学、微生物组学等多维度、多层次的组学检测技术,完成个人健康的数字化图谱,最终指导个性化健康生活。
“无论是源自先天基因变异的遗传病,还是后天基因变化引发的疾病如肿瘤,抑或外源基因侵入导致的疾病如病毒感染等,基因检测技术都能根据不同的场景和需求,准确捕捉信号、及早诊断鉴别。”朱师达指出。
他表示,细胞到组织的异常变化是漫长的,在其真正发展成之前,窗口期可能长达几年甚至十几年,但异常信号已经出现在体内。通过对相应变化的分子层面的检测能够及早发现信号并且有效地干预。如结直肠癌,通过对粪便中脱落细胞的异常信号,主要是DNA甲基化,就能及早发现问题如息肉、腺瘤、癌前病变和早期肠癌,再通过肠镜进行诊断和进一步的干预,就能避免晚期肿瘤发生。
这一方法可以居家自取样,无创无痛,适宜大人群推广。据了解,全国已有超过200万人接受无创肠癌(粪便)筛查基因检测。
“坚持科学的本质,以技术去解决实际问题,更重要的是可及性。华大基因不希望技术成果是曲高和寡,而是真正走进人们的生活,让每一个人都能够从科技进步中受益。”朱师达说。
*“医学界”力求所发表内容专业、可靠,但不对内容的准确性做出承诺;请相关各方在采用或以此作为决策依据时另行核查。

卓信宝配资官网提示:文章来自网络,不代表本站观点。