
依托海量数据集训练而成的大型语言模型(LLM),能够有效推动基因组学研究提速、简化临床文档处理、优化实时诊断流程、支撑临床决策制定、加速药物发现进程,甚至可以生成合成数据以助力实验研究的推进。
然而,这类模型在改变生物医学研究格局的过程中,常常遭遇明显瓶颈:除了医疗保健领域所依赖的结构化数据之外,它们在罕见病、不寻常疾病等边缘场景中难以发挥实效,核心原因在于这些场景下缺乏可靠且具有代表性的数据支持。
总部位于美国纽约的Mantis Biotech公司表示,他们正致力于开发一种解决方案,以填补这一数据可用性空白。该公司打造的平台能够整合各类不同来源的数据源,生成可用于构建人体“数字孪生”的合成数据集——所谓人体“数字孪生”,即是基于物理学原理、可预测人体解剖结构、生理机能及行为模式的模型。
Mantis Biotech公司正积极推广这项数字孪生技术,将其应用于数据聚合与分析领域。这些数字孪生技术可广泛用于新医疗程序的研究与测试、手术机器人的训练,以及医疗问题乃至行为模式的模拟与预测。例如,Mantis公司创始人兼首席执行官Georgia Witchel在近期接受媒体采访时就曾解释,一支运动队可依据特定NFL球员近期的表现、训练负荷、饮食情况以及运动年限,预测该球员发生跟腱损伤的可能性。
为构建这些人体数字孪生模型,Mantis的平台会首先从多种渠道获取数据,包括教科书、动作捕捉摄像机、生物识别传感器、训练日志以及医学影像等。随后,平台利用基于LLM的系统对各类数据流进行路由、验证与合成,并将所有这些信息输入物理引擎,进而生成该数据集的高保真渲染图,这些渲染图后续可用于训练预测模型。
“我们能够收集所有这些不同的数据源,然后将它们转化为预测模型,从而预测人们的表现。因此,任何时候你想预测一个人的表现,这都是我们技术的绝佳应用场景,”维切尔说道。
Witchel在接受媒体采访时表示,物理引擎层是整个技术的关键核心,因为它能够让生成的合成数据更具真实性,通过精准模拟人体解剖学物理特性,帮助平台进一步增强可用信息的实用性。
“如果我让你估计一个缺了一根手指的人的手部姿态,那将非常非常困难,因为目前没有公开可用的、带有标注的缺指者手部位置数据集。我们可以非常轻松地生成这个数据集,因为我们只需要用我们的物理模型,然后说,移除手指X,重新生成模型,”她说道。
由于Mantis的平台成功填补了数据源的空白,Witchel认为该技术具备在生物医学行业广泛应用的潜力。在生物医学领域,有关手术操作或患者的相关信息往往难以获取,要么结构化程度较低,要么分散在不同的数据源中。她特别强调了特殊情况或罕见病领域,因为在将这类患者数据纳入公共数据集或用于训练人工智能模型时,通常存在伦理和监管方面的限制,这也导致此类数据的获取难度大幅增加。
“你知道那种三岁小孩拿着芭比娃娃跑来跑去,抓住娃娃的一条腿,然后把它摔到桌子上的情景吗?我希望人们对待我们的数字孪生模型也能有这种心态,”她说。“我认为这将让人们接受这样一个观点:在使用虚拟人时,可以拿真人做实验。我觉得目前人们的心态恰恰相反,这完全可以理解,因为人们的隐私应该得到尊重。事实上,我认为人们的数据根本不应该被滥用,尤其是在使用数字孪生模型的时候。”
目前,Mantis Biotech公司已在职业体育领域取得了一定的成功,这大概率是因为该市场存在对高水平运动员进行建模分析的迫切需求。Witchel透露,这家初创公司的主要客户之一是一支NBA球队。
她解释说:“我们创建了运动员的数字模型,这些模型基本上显示了这位运动员的跳跃情况,不仅是今天的,而是过去一年中的每一天,以及他们的跳跃情况如何随着睡眠时间的增加或举起手臂的次数而变化。”
这家初创公司近期成功完成了740万美元的种子轮融资,此次融资由Decibel VC领投,Y Combinator、多位天使投资人和Liquid 2也参与其中。据悉,这笔融资资金将用于团队招聘、广告投放、市场营销及市场推广等相关工作。
Witchel表示,Mantis Biotech公司的下一步计划是持续完善技术体系,最终将该平台面向公众发布,其核心目标聚焦于预防性医疗保健领域。同时,该公司也在积极拓展服务范围,致力于为参与FDA临床试验的制药实验室和研究人员提供支持,旨在为其提供关于患者对治疗反应的深度分析报告。