5月30日,中科院院士、北京科学智能研究院院长、北京大学国际机器学习研究中心主任鄂维南在中关村论坛平行论坛“人工智能驱动的科学研究论坛”上作了题目为《AI时代的科研体系重构》的演讲,并接受了新京报记者的采访。
(相关资料图)
鄂维南对新京报记者表示,AI可以对科研工作产生巨大影响,但科学家从事的创造性工作不能被AI取代。在他看来,目前的主要任务是“AI for Science”(科学智能)推动下,建立“平台科研”,可以比喻为科学研究的“安卓模式”,进而产出更多的新方法、新工具,“我不认为这只是中国要做的事,应该国际上大家共同合作,进行研究。”
值得注意的是,5月30日当天,由北京科学智能研究院、中国科学院计算机网络信息中心、墨奇科技联合开发的“基于大语言模型+向量数据库的文献知识库——Science Navigator”(直译科学导航,暂无官方中文名)也正式发布。对此鄂维南表示,这是“AI for Science”基础建设中重要的一步。
鄂维南认为,“AI for Science”体系能大幅度提升科研能力,加强科研和产业之间的连接,是整个中国科技创新历史上最好的机会。
AI为解决科学研究瓶颈问题提供了有效手段 为科研带来巨大空间
在演讲中,鄂维南提到 “科研包括数据驱动和基本原理驱动两个模式,数据驱动的瓶颈在于大部分情况下我们缺乏有效的数据和数据分析方法。而采用基本原理解决实际问题,虽然基本原理本身比较清楚,但是表达基本原理的数学模型比较困难。产生的后果是简单问题可以解决的很好,如利用结构力学帮助造房子,但复杂的问题如材料设计、药物研究等,目前只能通过经验和试错的方法解决,这是因为这些复杂问题面临维数灾难:随着问题自由度(即数学中的维数)的增加,复杂度呈现指数级增加。而这一困难AI可以帮助我们解决。”
在他看来,深度学习提供了一个解决维数灾难的基本工具。这不仅仅针对科学,而是具有一般性,这也是AI for Science的起点,“AI提供了新的工具。在数据驱动方面,AlphaFold2(暂无官方中文名)就是很典型的用AI方法来发展新的数据驱动的工具,也是最典型的成功案例,其基本解决了结构生物学里面最基础的问题,蛋白结构问题。而在基本原理驱动的层面,最好的例子可能是DeePMD(深度势能分子动力学):结合机器学习和物理建模,它将以前只能处理上千个原子的工具通过人工智能的加持一下子做到了可以处理上亿甚至上百亿。”
“从我自己的科研经历来看,很多年都在尝试解决材料科学、化学等学科的一系列问题。我意识到其中面临的核心困难,人工智能可以帮助到我们,这也是AI for science最基本的出发点。”鄂维南说。
鄂维南强调,有了AI加持的能力带来的生产力变革,必然会带来生产关系的变革,“我们虽然科研做了这么多年,也做出很多科研成果,但是仔细想一想,目前科研的模式还是偏向作坊式。每个实验室,每个课题组,都基本上自给自足,周期拖得非常长,效率有待提升。有了刚才说的人工智能方法以后,必然会带来新一代的基础设施工具建设,提升科研效率。”
他在接受采访时表示,除了科研,产业中很多问题核心点也都与算法有关,例如工业软件基于算法,药物设计也需要算法,因此AI也能对产业产生直接影响,“具体到AI for Science对实体经济制造的影响,我们有信心在5至10年左右的时间内,让材料、药物等行业内产生微观领域的工业设计软件,使之更加系统化,就像现在造汽车一样,它们也会拥有一种生产线。在AI for Science的推动下,使微观层面的制造业也能够变成一种流水线操作的模式。”
鄂维南在接受采访时称,AI为科研带来的空间是巨大的,它提供了一些平台,解决了许多科学家以前无法解决的问题。不同之处在于,科学家做科研强调的不仅仅是解决问题,而且需要知道其中的原由,因此也希望AI还能告诉科学家为什么能够解决这些问题,如何解决的这些问题。
发布基于大模型+向量数据库的文献知识库迈出AI for Science重要一步
鄂维南还提出,是否可以把所有的文献、实验数据变成一个知识库或者数据库,之后再采用自然语言对话,或是其他的搜索、查询办法,帮助科学家提升读文献的效率,更便捷地找到需要的知识。
对于当日发布的Science Navigator,鄂维南表示,该知识库能让科研工作者通过对话提问的方式进行文献的检索、阅读、分析及管理,大大提升效率,进一步助力科研人员提升科研生产力,释放更多的时间精力在解决关键问题与创新思考上,这是AI for Science的重要基础设施建设之一。
“今天的发布是第一版本,我们希望将来这能成为一个整合文献和实验计算数据的一个大平台,大家都可以使用。”
“总的来说,这样一个新的科研体系,一方面会大幅度提升科研能力,另一方面会大大加快科研和产业之间的连接。AI for Science是整个中国科技创新历史上最好的机会,它能全面改变科学研究和产业创新的格局,而且跟国家发展的国策高度符合。在这方面中国也有一定的先发优势,有高度前瞻性的设计、广泛的共识,我们需要利用这些优势,集中力量、资源,尽快落地,率先走出平台+垂直整合这样新的科研范式。”