客人列| 2021年10月25日

最近初创企业的爆炸式增长突显出在药物发现、开发和临床试验方面对AI/ML的商业需求

作者Adam Lohr, RSM US LLP

istock - 859157470

“逐渐,然后突然” - 来自欧内斯特海明威的这条线太阳照常升起- 体现人工智能(AI)和机器学习(ML)将对我们的经济和生命科学未来的影响。

从看医生、健身追踪器到药物发现和疫苗开发,了解人工智能和ML是什么、不是什么,以及企业未来可能利用这些技术的原因很重要。

适应新的商业环境

计算能力、无处不在的数据以及对高技能劳动力的日益激烈的竞争,是AI和ML在商业应用中扩展的一些实际力量。现实情况是,企业,包括生命科学企业,正变得越来越数字化,并追求越来越复杂的问题。人工智能和ML有潜力增强现有的劳动力和业务流程,并允许企业在一个全球竞争的生态系统中用更少的资源做更多的事情。

根据RSM对PitchBook数据的分析,生命科学初创企业的数量持续增加,在过去7年里,平均每年有1000家公司获得首次私募股权或风险投资。

来源:PitchBook

虽然这一新公司和技术的涌入在行业中刺激创新,但这些初创公司越来越多地竞争人才和资本。二十年前,在生命科学公司的首次投资公司占投资的40%,并投入了20%的资本。在2021年,只有20%的交易和9%的私人生命科学资本正在流向首次筹款人。有了这一说,整个投资派持续增加,过去几年已经看到了私人投资的记录水平和初始公开发行资本提出。这种融资公司的涌入也导致高技能工人短缺,根据美国劳动统计局的劳动力资料,招聘生命科学是纪录水平。

根据对在2020年1月至2021年6月期间成功推出首个商业药物的公司的分析,从创立到美国食品和药物管理局(Food and drug Administration)批准之间的平均融资金额为3.3亿美元。更值得注意的是,有6种药物获得批准的资金不超过1亿美元。

来源:EvaluatePharma有限公司。

值得注意的是,越来越多的新批准的药物是他们赞助商的第一家商业产品。2020年,22%的新药是赞助商的第一药,到2021年6月,数量增加到45%。记录投资水平,新的市场进入者和首次发射机的速度是所有迹象表明,生命科学公司正在寻找尽可能有效地实现商业成功的新方法。这是AI和ML开始表现出潜力的地方。

与机器一起工作

人工智能属于计算机科学的主要领域,但包含了广泛的子集——主要是深度学习和机器学习。简而言之,人工智能旨在创造能够像人脑一样思考和行动的机器。机器学习的理念是,只要能够访问数据集和算法,这些“机器”就应该能够学习有关数据的东西,比如识别模式和预测结果。更进一步,深度学习专注于将算法安排在层中 - 被称为“人工神经网络”,然后能够独立学习和做出决策。

据估计,到2025年,我们的全球数据圈将包含175ztb的信息.平均一台电脑需要18亿年才能下载这么多数据。有了ML,我们就可以开始在更有效的全球范围内识别趋势、模式和异常,这是我们今天无法做到的。有了这些工具,医学文献和患者数据的收集和分析变得更快、更简单,可以用来为每个患者定制更适合的药物。

虽然在人工智能的应用方面,这是一个相当新的领域,但药物设计和开发过程已经成熟,可以应用机器学习和深度学习技术。有了这些技术,研究人员就能够对蛋白质、化合物和实验性药物进行诊断,并在过渡到临床试验之前评估疗效和潜在问题。在如此早期的阶段发现潜在的缺陷和功效指标可以极大地降低开发成本和时间。

充分利用人工智能的能力可能还需要10年或更长的时间,但ML的计算和预测能力更容易实现。由于现代临床试验收集了大量的数据,研究人员正在评估ML如何分析历史数据集、患者数据和生物库,并将这些数据应用于未来的临床试验,以降低失败率。机器学习可以用来防止“救援研究”的需要,并帮助研究人员开发和设计更有可能被批准、更不可能失败的研究。虽然单独使用人工智能和ML进行临床试验的可能性有限,但这种方法将允许研究人员对药物可能的效果进行粗略测试,并在药物进入试验前识别潜在的失败。

类似的方法已被应用于癌症治疗的开发中,这使人们更容易看到哪些治疗方法可能最有效,而无需实际参与试验。几年来,大规模的人工智能项目被用于建议新型药物的假设用于治疗纯粹人类研究的速率下癌症的癌症,但速度更大。PUBMED.类似的系统可以作为医学出版物和其他数据的存储库和搜索引擎,在解释和识别癌症驱动途径方面具有高通量和准确性。亚利桑那大学和俄勒冈健康与科学大学的研究人员对此进行了探索这些系统试图表明,“将人类策划的‘大机制’与提取的‘大数据’相结合,可以导致对细胞过程的因果性、预测性理解,并开启重要的下游应用。”

冠状病毒:AI和药物发育中的催化剂

人工智能及其所包含的知识体系已被证明是全球应对新型冠状病毒的一股强大力量。疫情使生命科学产业走上了科学、社会和经济讨论的最前沿,全世界都在注视和等待全面、有效和立即的反应。认识到冠状病毒疫苗将是我们及时恢复“正常”的最佳选择,加大了前所未有地加快SARS-CoV-2疫苗开发的压力。

在当今世界,药物的发现和开发受到高失败率、高成本和长达数年甚至数十年的时间线的阻碍,技术被证明是游戏规则的改变者。在对病毒基因组进行测序的几周内,人工智能技术被用于评估蛋白质结构,筛选潜在的疫苗靶点,并开始早期药物测试。事实上,在基因组测序完成之前,研究人员巴塞尔大学瑞士的研究人员已经开始使用人工智能建模工具来预测病毒外表面蛋白质的结构,这些结构对疫苗设计至关重要。

通常情况下,药物发现需要三到五年研究人员分析了数千种化合物作为测试的潜在目标。然而,就COVID-19而言,部分得益于测序技术的进步,基因组的快速测序使科学家在数周内就开始了解病毒的结构。到2020年1月底,生物技术公司Cyclica部署了一个工作组,利用其人工智能增强药物发现平台。Ligand Design公司利用其深度学习工具MatchMaker,筛选了6700多种已获批准的药物和具有1期临床试验数据的候选药物,以确定可能的药物再利用机会。

与此同时,一组计算机科学家斯坦福人以人为中心的人工智能研究所以线性回归模型的形式使用机器学习和神经网络算法,生成冠状病毒基因组上可能引发免疫反应的目标列表,这标志着疫苗开发的第一步。

BenevolentAI,他们的人工智能平台创建了一个有助于阻止COVID-19病毒感染过程的潜在药物的知识图谱。利用这些工具,他们假设baricitinib,一种用于治疗风湿性关节炎的药物,可以减少病毒的感染性、复制和炎症反应。到2020年11月底,在一项随机对照试验支持这一假设后,FDA批准了baricitinib对COVID-19患者的紧急使用。

诸如此类的例子强调了技术的力量,使药物开发人员加快了疫苗开发的步伐。即使在最初的COVID-19疫苗开发完成后,变种的传播也推动了一组研究人员南加州大学开发一种能够在不到一分钟内为新病毒构建多目标疫苗的AI供电模型,结果在一个小时内验证。这是传统的发现,开发和测试方法的呐喊。

解决整个开发周期的挑战

发现

发展

临床试验(CTs)

挑战

  • 有大量的数据要处理
  • 目标识别成本高、劳动强度大、耗时长、科学难度大
  • 研发生产力低
  • 研究可能会受到“直觉”的影响,而人工智能/技术会消除这种直觉,因为它只根据输入的数据行事
  • 由于人体生物学的复杂性和疾病的性质,它历史地更容易开发治疗/管理症状的药物,而不是潜在的原因
  • 目前的动物模型/标本缺乏预测有效性

为什么AI / ml适合

  • AI / ml揭示隐藏在大量数据中的模式
  • ML可以处理组织和标记的小数据集
  • 自然语言处理(NLP)可以在基因组数据上使用,因为它通常呈现为一串字母
  • 科学家/研究人员使用临床数据库来帮助医生在日常工作中。这为人工智能以深度神经网络的形式被利用创造了机会,使数据映射更容易
  • 有助于预测物理化学性质(溶解度,电离等),药物设计的关键因素
  • 人工智能预测药物靶点相互作用的能力,用于协助药物再利用
  • 预测靶蛋白的结构 - 一种开发中的关键阶段,可以在合成或生产之前有助于安全考虑
  • 生物活性预测(药物分子的有效性取决于其与靶蛋白/受体的亲和力),因此基于人工智能的方法可以测量药物的结合亲和力,以降低毒性的可能性
  • NLP可以用来扫描医生的笔记、健康记录、病理报告等,以更快地识别潜在的CT参与者
  • 在ct设计中也有可能被利用,以帮助提前调整试验方案,以减少中断/延迟的机会
  • 基于人工智能的解决方案,帮助确保ct不受患者错误的危害

采用状态

在实践中

还没有实施

有限的部署

公共卫生、技术和监管规范的交集

虽然利用人工智能的技术,平台和应用已经走了很长的路,但由于该术语在20世纪50年代中期首次创造,围绕该领域的政治和监管框架有点混乱。近年来,追求稀有疾病的追求是指数增长的,这是利用AI供电的药物发现的主要目标。对于上下文在过去的八年里FDA将新药的批准率提高了一倍在对抗罕见疾病的药物方面,与前八年相比。FDA也以创纪录的速度接收和批准了基于人工智能的申请。2014年,FDA只批准了一项人工智能申请,用于检测心房纤颤;到2019年底,已经批准了70多个人工智能批准。这表明,人工智能和ML在医药领域的发展既有市场需求,也有监管需求。

还应该指出的是,绝大多数药物开发商和生物制药公司并不开发自己的人工智能和ML技术,而是依赖于部署在其运营环境中的第三方平台。当第三方或其平台利用重要的是要理解这些风险,和一个基于ai的解决方案,其中两个主要的风险是其需要访问大量数据和可能的知识产权,以及潜在的影响,这种解决方案可以对公司的决策。虽然人工智能产品提交给FDA审批,但它们的审查方式与新药不同,新药的试验数据是公开共享的,并在监管小组之间进行审查。相反,大多数人工智能产品是通过501(k)途径,它只要求被认可的工具具有“实质性的等效性”,而不是一种工具改善护理的具体证据。此外,关于人工智能工具开发人员以及他们需要如何记录他们的人工智能是如何开发的,或是否在独立的数据集上测试,并没有相关的法规或指导方针。由于算法的结果只与输入的数据一样多样化和全面,因此很难确定工具的发现中是否存在意想不到的后果、偏见或错误。统计报告称,在FDA批准的161种人工智能产品中,只有73项研究披露了用于评估其设备的患者数据。在73名报告患者数据的人中,只有13人透露了被研究患者的性别,只有7人透露了研究参与者的种族身份。

这些课程的目的是伦理,社会和隐私问题。在记录和测试这些AI算法的记录中不仅有限的规定,还有有限的监管,而且还在收集的数据如何收集和分发。健康保险便携性和问责法(HIPPA)未能规范的一个领域是公司提供的零售遗传测试领域祖先和23andme..在这一领域运营的公司可以存储用户数据长达10年,并可以合法地将数据出售给制药和生物技术公司。2017年,23andMe获得了监管部门的批准,可以在未经客户同意的情况下分析客户的基因数据,扫描某些疾病的风险因素,如帕金森病和阿尔茨海默病。诸如此类的例子强调了这一领域中规定的不一致性质。显然,这些技术对患者数据的操作基础必须得到充分的收集、使用和保护,以确保全面、公正和准确的结果。

更快,更便宜的药物开发,个性化医学,更好的患者结果

最终,在大数据的速度和能力、现代处理能力以及人工智能和ML的出现方面,进行传统药物开发的成本和熟练劳动力的稀缺找到了对应。

生命科学和医疗保健内AI和ML的相对成本效益和令人印象深刻的能力为什么越来越多的公司所采用和开发AI平台和工具。该技术能够识别模式并检测宽带数据阵列的变化,包括分析广泛的患者数据范围,使其成为合适且理想的投资。

的应用人工智能和机器学习在制定和发现药物以及药物生产和临床试验中,已被证明导致人力资本提高成果和减少费用。深度学习可以特别有效的选择应用的结果和数据。

此外,人工智能和ML的预测分析能力,包括预测患者的预后临床试验正在引领精准和个性化医疗的进步。这项技术有潜力使我们从仅仅治疗疾病的症状,转变为识别、定位和分析潜在原因,提供更好的治疗计划,更成功的患者结果,以及更完整的医疗保健方法。进一步,AI的潜力减少药物发现和开发的高成本,和那种感觉更彻底地识别和管理药物再利用的机会,是人工智能因素中对生命科学行业和医疗的本质。

关于作者:

亚当罗尔他是RSM US LLP的审计合伙人和生命科学高级分析师。除了为客户提供保险服务,他还在RSM的国家生命科学团队任职,并领导圣地亚哥办公室的生命科学实践。他的高级分析师职责包括为公司生命科学客户和客户服务器提供建议,帮助他们在快速变化的行业环境中导航。亚当经常就资本市场、数字转型、政策和其他改变生命科学的问题撰写、介绍和提供建议。他专注于在生命科学、技术和消费产品行业全球活跃的高增长公司。他的专长是提供财务审计服务,帮助客户应对影响其业务的技术、监管和经济变化。