AI催生科研新范式
科学家在做科研时,往往需要从海量数据中分析出潜在的规律,再通过大量实验去验证猜想,才可能得到正确的结果。一旦科研中变量个数或维数增加,计算的复杂度将会指数增加,这就是所谓的维数灾难。
近年来前沿技术AI for Science的发展,却将科学家从维数灾难的计算困局中解放了出来。
AI for Science指的是运用AI算法从海量数据中快速找出潜在规律,科学家可从AI预测的规律中甄别出正确的结果。比如 DeepMind开发的人工智能系统AlphaFold2,就曾对蛋白质折叠结构进行较为准确的预测,攻克了困扰生物学界 50 余年的难题。
而创立于2018年的深势科技是国内AI for Science的创新者。为帮助科研工作者提高效率,深势科技提出了「多尺度建模+机器学习+高性能计算」的科学研究新范式,并推出了Hermite®药物计算设计平台、Bohrium®微尺度科学计算云平台等微尺度工业设计基础设施。
2021年11月,深势科技与宁德时代达成战略合作,双方共建联合实验室,来探索能源领域的微尺度工业设计。
创始人孙伟杰认为AI计算对实验学科最大的价值就是替代实验,以药物研发为例,全球每年在药物研发上投入的费用是2600亿美金左右,其中1/9是投入在蛋白质层面的分子设计、优化和筛选中。而这些实验几乎都可以被AI计算替代。“比如过去解析出一个蛋白质的微观结构,需要花费几个月的时间,成本就要几十万元以上,现在通过深势的平台,最多不超过一个小时,就可以得到一个不错的微观结构。”
选择药物研发作为突破口深势科技刚创立时,只有一个想法和两个人:一个“AI for Science”的想法和两个创始人——孙伟杰和张林峰。
深势科技创始人兼CEO孙伟杰
孙伟杰和张林峰曾是北大元培的同班同学,毕业后一度走上了不同的道路。孙伟杰选择成为早期投资人,曾供职于唯猎资本,主要关注前沿科技领域的创业公司。而张林峰则选择去普林斯顿大学留学,在AI for Science领域深造。
2016到2017年,张林峰运用人工智能和分子模拟算法来求解重要科学问题,在AI for Science领域中取得突破性成就。
2018年张林峰回国,孙伟杰邀他见面。许久不见的两人深入探讨后,共同认为AI for Science 存在巨大的市场应用前景,而最好的方式就是将这个技术放在创业公司里,通过市场的需求驱动其快速发展。
但他们也明白,仅凭两人是无法完成此事的,所以孙伟杰和张林峰先在2018年11月注册了公司,“创业前半年的时间,我们都分别在周围「摇人」,把身边特别有本领的人都找来一起创业。”孙伟杰表示。
深势科技创立后,团队面临的第一个挑战就是“往哪儿走”。AI for Science技术的应用范围很广泛,其中应用在材料科学领域更精准。但最终团队还是选择从药物研发领域切入,因为药物研发领域有完善的分工体系,所以开展技术的商业化能够更快落地。
找准了方向,团队也多了几分把握,但仍需面对早期资金、资源匮乏的困境。深势科技早期依靠研发驱动,需要大量研发人员。“因此我们尝试了各种方法,刚开始依靠团队在学术领域的成绩,拿到了一些科研订单,并于2019年获得北京中关村科技类项目的扶持,同时又和一些大实验室进行合作,才渡过了早期的‘生死危机’。”孙伟杰表示。
在2018到2019年期间,深势科技开发了第一款AI计算软件DeePMD,并将其代码开源。孙伟杰称,当时有几百个用户使用该软件做前沿科学研究,加快了DeePMD开源生态的发展。而在2019年到2020年期间,团队对软件进行了多次高性能计算优化,将计算速度提升1000倍——该成就获得了 2020 年的戈登贝尔奖,此奖项也被称为是“全球超算领域的诺贝尔奖”。
2020年疫情,对很多企业来说都是一场大考,深势科技最初也受到了影响。团队因研究工作等原因分散在世界各地,只能线上协作办公。
“当时团队所有人的位置加在一起有五个时区,大家需要挑共同在线的时间才能开会;但好处是我们也能利用时间差优势,24小时接力来赶项目进度。”孙伟杰表示。
2020年7月,深势科技获得了由百度风投领投,唯猎资本和盛景嘉成跟投的天使轮投资。该轮投资拿的十分顺利,据孙伟杰回忆,双方连面都没见过,只是打了几个电话,融资材料也是线上准备的。“我们为了找到志同道合的投资人,还特地把BP(商业计划书)写的很难,但还是顺利地拿到了投资。”
孙伟杰认为这是由于创始团队比较符合主流资本市场审美所致,“一个青年科学家和青年CEO的组合,背后还有中科院院士顾问,此外还有很多来自国内外名校的交叉学科人才。这反映了高学历团队配置在前沿科技领域的优势。”
在“推动AI for Science技术实现完全商业化”这点,孙伟杰曾预测至少需要10亿人民币,主要是用于基础设施建设、专业人员和计算资源的增加。“我们先计算好做成这件事情需要多少钱,然后确定公司融资和估值增长的节奏,最后是一步步按计划实施。”
深势科技产品架构示意图
面向国际的市场竞争优势近4年的发展中,深势科技探索出了两种商业模式:一种是面向科研人员、企业客户等直接销售软件平台;另一种则是与企业客户合作,帮助客户研发指定的药物、材料等配方。
现在在全球范围内,深势科技软件平台的用户已超过1000个课题组和一万名以上的科学家,并服务超过5万名科研工作者。同时在药物研发、材料研发领域,深势科技合作的企业客户超过50家,覆盖了众多医药类院校和研究所,如中国药科大学、上海医药工业研究院等。
在研发药物配方上,深势科技合作的大部分药企重点瞄准的是肿瘤疾病、CNS(中枢神经系统)疾病和自免疫疾病方向。近期,深势科技在肿瘤领域的热门靶点发现了新的药物分子。孙伟杰表示,此前这个靶点全球只公布了一个药物分子,而且该分子还会与蛋白质形成共价键,导致药物的毒性很强,同时活性也不高。
“而我们用AI加分子模拟的方法,模拟了蛋白质的动态变化,找到了一个全新的蛋白质结合口袋。根据这个口袋的特性,我们用AI计算筛选出了很多候选药物分子,只进行了86次实验,就获得了一个新颖且有效的化合物。这个药物分子比现有的毒性更低,活性更好,更有成交的潜力。”
随着AI for Science的商业化路线越来越明朗,许多国际大厂的创新团队也在探索这个领域,孙伟杰表示国外的DeepMind、薛定谔是这个行业的先行者,但大家擅长的领域各有不同。
“DeepMind更擅长的是数据驱动,他们是运用大量蛋白质分子结构的数据来训练AlphaFold2的精准度,而我们更擅长的是模型驱动,所以我们会在彼此擅长的领域里互相学习。”
目前国内AI for Science还处于起步阶段,深势科技具有先发优势,但孙伟杰认为任何一款摆在市场上的产品,别人都可以拿来仿照、抄袭,没有绝对的竞争壁垒。“只有永远比别人领先一步,这才是科技公司唯一的壁垒。”