科研智能(AI4R研發)研究報告-2024.08-29正式版-WN8_第1頁
科研智能(AI4R研發)研究報告-2024.08-29正式版-WN8_第2頁
科研智能(AI4R研發)研究報告-2024.08-29正式版-WN8_第3頁
科研智能(AI4R研發)研究報告-2024.08-29正式版-WN8_第4頁
科研智能(AI4R研發)研究報告-2024.08-29正式版-WN8_第5頁
已閱讀5頁,還剩23頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

科研智能(AI4R&D)——人工智能驅動的研發新范式中國人工智能產業發展聯盟(AIIA)科學智能(AI4S)工作組2024年7月編制說明本報告主要是在中國人工智能產業發展聯盟指導和組織下起草編寫,主要參編單位包括中國信息通信研究院、華

技術有限公司、北京百度網訊科技有限公司、北京深勢科

有限公司、之江實驗室、阿里云計算有限公司、北京航空航天

學、國網智能電網研究院有限公司、中冶京誠數字科技(北京)有限公司、中國科學院沈陽自動化研究所、中國華能集團清潔能源技術研究院有限公司、深圳華大生命科學研究院、同方知網數字出版技術股份有限公司、上海和今信息科技有限公司、北京科技大學、北京市商湯科技開發有限公司、東方財富信息股份有限公司、北京新數科技有限公司。核心編制人員為張瑋婷、董昊、丁欣卉、曹峰、周景才、王紫東、胡曉光、孫佩源、劉會師、劉大鵬、貢金鵬、李振廷、王忠新、蒙貴云、張艷博、周原野、楊康、王錦海。目錄?一、科研智能發展態勢...............................................1二、科研智能產業發展情況..........................................2(一)科研算力—賦能科研智能高效運行..........................2(二)科研數據—驅動科研智能創新發現........................4(三)開發工具鏈—全鏈路打造科開發工具...................7三、科研智能應用發展情況..........................................15(一)基礎科學研究—開展前沿探索,推動科學邊界拓展............16(二)產業研發創新—構建核心驅動力,加速產業升級變革..........18四、科研智能生態建設情況..........................................19(一)產業組織................................................19(二)社區設................................................19(三)科研賽事................................................20(四)會議交流................................................21(五)教學培訓................................................21(六)標準布局................................................1五、總結與展望....................................................22附錄一............................................................23表

錄表1國外科研領域主要公開數據集.....................................5表2國內外典型科研智能算法庫.....................................10表3我國代表性科學套件...........................................12表42019年至2023年Science雜志評選的十大學突破................17表5科研智能典型領域模型.....................................23科研智能(AI4R&D)—人工智能驅動的研發新范式一、科研智能發展態勢科研智能(AIforResearchandDevelopment,以下簡稱

AI4R&D,人工智能賦能科學研究及產業研發)是科學智能(

IforScience,AI4S)概念的延伸和擴展,主要包括兩方

內涵,一是聚焦人工智能加速基礎科學研究,拓展研究思路

加速研究進程;二是強調人工智能在應用研究和產業研發中

重要作用,全面提升工程技術創新的效率。科研智能代表了科技創新的新范式和新動能,有望全面加速基礎研究和產業研發的進程,并縮短兩者之間的轉化周期,推動科技成果在工業界的產業化和規模應用。科研智能正在全球范圍內加速發展。從戰略層面看,各國相繼發布政策構筑科研智能發展環境。2023年

12月,歐盟委員會發布政策簡報《人工智能在科學中的應用》,倡導為歐洲量身制定一項政策,促進人工智能在科學領域的應用。2023年

5月,美國新建

7家國家人工智能研究所,推動人工智能在氣候、腦科學、社會決策、教育等領域的應用研究。2022年

8月,我國發布《關于加快場景創新以人工智能高水平應用促進經濟高質量發展的指導意見》,支持探索人工智能技術用于重大科學研究和技術開發的應用場景。從賦能層面

,一方面

AI持續拓展科學領域問題解決的能力,圍繞生命科學、物理等領域,形成了如Alphafold3等代表性成果。另一方面

AI不斷加速產業研發進程,在材料研發、氣象預測、計等領域相繼取得技術突破。科研智能作為

個新興的交叉領域,目前尚處于發展的早期階段,但已經展現出巨大的發展潛力和廣闊的應用場景,中國信息通1科研智能(AI4R&D)—人工智能驅動的研發新范式信研究院(以下簡稱“中國信通院”)持續跟蹤科研智能技術和產業動態,于

2024年發布報告《科研智能(AI4R&D)—人工智能驅動的研發新范式》,旨在描繪科研智能領域的生態全景,為政府部門制定產業政策、指導項目布局提供參考,為

究機構、科技企業把握技術方向、開拓應用場景提供借鑒速該領域的技術創新和應用實踐,為我國在該領域搶占發展

機提供助力。未來,中國信通院將關注全球科研智能發展動向,深化對關鍵技術和產業趨勢的研判,加強與科研機構、高校、企業等產學研各界的交流合作,共同推進科研智能生態體系建設,為科技強國和創新型國家建設提供有力支撐。二、科研智能產業發展情況科研算力與科研數據的深度融合為

AI4R&D奠定了堅實基礎。由

AI框架、算法庫、開發套件及領域模型組成的開發工具鏈極大提升了科研效率,促進了跨學科、跨領域的協同創新與融合,深刻改變了科學研究范式。(一)科研算力—賦能科研智能高效運行科研算力是指結合智能算力與超算算力的計算能力,通過異構計算架構滿足高精度計算和

AI模型訓練推理需求。智能算力基于GPU(圖形處理器)、TP(張量處理單元)、NPU(神經網絡處理單元)等

AI芯片,提

供并行計算能力,適用于人工智能的訓練和推理計算。超算算力依托超級計算機集群,實現大規模科學計算和模擬,能夠處理復雜的科學計算問題,廣泛應用于如行星模擬、2科研智能(AI4R&D)—人工智能驅動的研發新范式藥物分子設計、基因分析等場景。而科研智能算力整合了

AI計算和科學計算兩種方式,采用異構計算架構,結合多種計算單元,以滿足高精度科學計算和人工智能模型訓練、推理的雙

需求。科研智能的研究涉及大量復雜的計算

務,包括大規模數據處理、深度學習模型訓練和高精度科擬等,這些任務均需要充足的算力支撐。在多數場景下,為

足科學研究和工程應用的需求,如蛋白質結構預測模型

AlphaFold2取得了突破性進展,能夠以原子級精度預測蛋白質的三維結構,其預測效果可以與實驗結果媲美,解決了生物學界長達

50年的重大挑戰,該成就被

Science雜志評為2021年度十大科學突破成果的第一位。這一進展也在很大程度上依賴于大規模的計算資源支持,在

AlphaFold2的研發過程中,DeepMind團隊投入了大量的算力資源,訓練階段使用了約

128個TPUv3,歷時

11天才能完成1。當前業界提供科研智能算力服務的方式主要有三種:一是云服務企業以公有云模式提供智能算力服務。云服務企業以智能算力平臺的形式提供計算資源,如阿里云靈駿智算平

、百度智能云

AIStudio、華為昇騰云等,面向基礎科研、新

研發、工程仿真等場景提供一站式算力服務。二是由政府、企業建設并對外提供服務的人工智能算力中心。西安的未來人工智能計算中心已成功孵化出多個智能科研領域的大模型球首個面向雷達遙感場景的“秦嶺·西電遙感腦大模型”,

及全球首個面向計算流體力學場景的“秦嶺·翱1

《HighlyaccurateproteinstructurepredictionwithAlphaFold》3科研智能(AI4R&D)—人工智能驅動的研發新范式翔大模型”。三是以一體機形式交付的科研智能算力。一體機通過將專用硬件、軟件和服務集成在一個系統中,打造便捷、高性能的科研智能系統。如深勢盒子是面向分子動力學模擬設計場景推出一體機,硬件層面以定制加速卡與

CPU結合的方式提供計算能力,軟件層面預裝分子動力學專業模擬軟件。我國科研智能算力面臨多項

戰,亟需建立普惠的科研算力保障體系。挑戰層面,一是高端

AI芯片的生產和購買受限,影響算力供給。二是國內智能算力的技術產業生態較弱,應用門檻高。三是智能算力資源主要集中于頭部科技類企業,高校、科研機構和大量行業企業算力儲備相對有限。建議層面,一是建立針對高校、科研機構和行業企業的算力資源保障機制,實現算力資源的合理供給、動態分配與高效利用,保障科研智能領域計算需求。二是構建跨地區、跨機構的科研算力資源共享平臺,促進科研機構與產業界的協同創新。三是實施科研算力成本效益評估,優化資源投入與產出,加速科技成果的產業轉化。(二)科研數據—驅動科研智能創新發現科研數據是指科學研究和產業研發活動產生的原始數據、中間數據、結果數據和分析數據等,主要包括觀測數據、實驗數據、記錄數據、調查數據、模擬數據及科研文獻等內容。高質量的科研數據是科研智能的基礎,規科研數據管理是科研智能開展的前提。科研智能數據相較

傳統的行業數據,有如下特點。一是數據來源和類型更加多樣。數據來自儀器設備、傳感器、仿真模擬、文獻等,4科研智能(AI4R&D)—人工智能驅動的研發新范式數據格式和語義差別較大。二是數據質量要求高。數據的客觀性、準確性、完備性、分辨率等質量要求很高,這會直接影響到計算結果的可信度。三是數據量更大。實驗觀測數據、仿真模擬數據等不僅規模巨大且增長快速,遠超普通商業化

據。四是維度更高。例如氣象、地理、生物數據涉及時間更加復雜。間、物種等多個維度,結構在科研數據領域,公開數據集對于推動科研創新具有重要意義。國外方面,公開數據集資源豐富、體系成熟,已成為全球科研工作者開展研究的重要基礎設施。美國通過一系列項目推動科研領域公共數據集的建設、共享及應用,如美國國家生物信息中心(NCBI)成為全球醫療

AI研究人員的首選數據源,其數據可在亞馬遜云平臺和谷歌云平臺上便捷訪問。在氣象領域,美國國家海洋和大氣管理局(NOAA)的數據是氣象大模型研發的重要支撐。材料科學方面,“材料項目”(TheMaterialsProject)經過三十年發展,已成為該領域的標桿性數據庫。數據資源的長期積累為科技突破奠定了重要基礎,如

AlphaFold2在蛋白質結構預測領域的成

很大程度上得益于蛋白質數據庫(PDB)的長期數據積累。我

方面,近年來在科研數據建設及共享方面也取得了顯著進展。全國已建成

50多個國家級行業科技數據中心和

200多個地方科技數據中心,形成覆蓋多領域的科學數據中心體系。、天文、電磁、流體、氣象、生命科學等領域已具備一

規模的公開數據集。表

1國外科研領域主要公開數據集(中國信通院根據公開資料收集整理)5科研智能(AI4R&D)—人工智能驅動的研發新范式領域數據持有單位WorldwideProteinDataBank(wwPDB)全球蛋白質結構庫(PDB)人類基因庫(EMBL)洲分子生物學實驗室(EMBL)歐洲生物信息研究所(EBI)、瑞士生物信息研究所(SIB)及蛋白質數據庫(UniProt生命科學美國國家生物醫學研究基金會(NBRF)成立的蛋白質信息資源(PIR)美國國家醫學圖書館生物信息技術信息中心(NCBI)日本國立遺傳學研究所美國國家醫學圖書館生物信息技術信息中心(NCBI)美國杜克大學DNA序列數據庫(Genbank)DNA數據庫(DDBJ)生物醫學文獻書目數據庫(PubMed)高通量材料計算數據庫(AFLOW)劍橋結構數據庫(CSD)英國劍橋晶體數據中(CCDC)美國西北大學放量子材料數據庫(OQMD)無極晶體結構數據庫(ICSD)德國波恩大學材料計算數據庫(MaterialsProject)金屬和合金晶體數據庫(CRYSTMET)美國加州伯克利大學材料科學加拿大渥太華大學國際衍射數據中心國際衍射數據中心的粉晶數據庫(JCPDS)開放晶體結構數據庫(COD)密度泛函理論的材料數據集(JARVIS-DFT)英國劍橋大學美國國家標準與技術研究院(NIST)歐

中期天氣預報中心(ECMWF)ERA5大氣再分析數據集海洋再分析數據集(HYCOM)海洋生物化學數據集海軍研究實驗室(NRL)美國航天局地球科學GLORYS12再分析數據SST衛星觀測數據法國麥卡托英國氣象局歷史氣候觀測和模擬(ICAR-ENSO)

氣候與應用前沿研究院

ICAR地球表面氣候預測數據(EarthNet)/國際自動機工程師學會斯坦福大學汽車流體ShaetAhmodyAerodynamics英偉達周期山(PH-RANS、ERCOFTAC)圓柱繞流數據集(CylinderinCrossflow)慕尼黑工業大學/6科研智能(AI4R&D)—人工智能驅動的研發新范式頂蓋驅動方腔流動(CFDBench)/我國公開數據集建設不足,優質領域數據未能得到有效利用。一方面領域覆蓋度有限,數據集建設不完善且質量

待提升。例如,盤古、風烏、伏羲等國內氣象大模型的研發

依賴國外公開數據集,而非國內數據集。另一方面在科研與行業企業中已積累的大量領域數據公開意愿不高,導致大量的優質數據資源處于“靜默”狀態。我國需加強數據集建設與共享,推動科研智能產業高效發展。我國需建立自己的科研數據戰略,系統規劃科研領域數據建設計劃,推動以國家重點實驗室、重點行業企業為代表的機構,積極開放共享數據。一是圍繞公開數據集建設進行戰略布局。建立健全科研領域公開數據集體系,在時空、區域氣象等新興和特色領域進行系統布局。二是建立科研數據共享激勵機制,讓數據貢獻成為研究貢獻的一部分。通過合理的措施,鼓勵機構以及個人將共享數據,持續豐富公開數據集的資源。同時加強對數據的安全保護,避免濫用。三是構建統一的科研數據空間,匯聚數據促進數據共享。促進跨機構、跨領域的數據整合與優化,為科研工作者和技

開發者提供更加便捷、高效的數據服務。(三)開發工具鏈—全鏈路打造科研智能開發工具從人工智能框架的構建到算法的集成,再到開發套件與領域模型的推出,科研智能開具鏈的逐步完善,為科研人員提供了全流程支持。這些工

不僅降低科研門檻,提高研發效率,還加速科研成果的轉化與應用。通過持續優化與創新,科研智能開發工具鏈7科研智能(AI4R&D)—人工智能驅動的研發新范式正逐步成為推動該領域發展的核心引擎。1.AI框架—構建核心架構,支撐高效算法實現AI框架是一組用于開發、訓練和部署人工智

模型的工具、庫和接口,它提供了一個結構化的環境,使

發者能夠更加高效地構建、測試和優化

AI算法和應用,當前主流的

AI框架主要有TensorFlow、PyTorch、PaddlePaddl和

MindSpore。為更有效地支持科研智能(AI4R&D),傳統

AI框架需要具備高效求解科學計算任務的基礎能力。一是支持科研智能算子庫,通過提供標準化接口和高度優化共性數學運算單元,如高階微分、傅里葉變換、分數階微分、積分、線性代數、復數運算等科研智能專用算子,降低科研計算程序的復雜度。二是提供科研智能計算庫,通過實現跨領域共性基礎計算庫,如微分方程求解計算庫、幾何形狀定義計算庫、方程符號化定義計算庫、物理信息神經網絡

PINN求解方法計算庫等,提升跨學科多領域典型數理方程求解效率。三是面向科研智能的作業調度優化,通過高階自動微分變換和編譯優化技術,實現異構混合架構靈活高效計算,整體提升科研計算任務計算速度。當前

PyTorch和

TensorFlow已經成為全球范圍最主流的

AI框架。PyTorch基于動態計算圖且接口簡潔易用,適合科研探索的快速原型開發及頻繁迭代,在學術界廣受歡迎。TensorFlow具備強大的分布式計算能力和完善的工態系統,當前在工業界廣泛應用,支持成熟的部署解決方

。兩者均提供科研智能算子庫、科研智能計算庫和科研智能計算加速等相關能力。此外,谷歌推出的

JAX框架具8科研智能(AI4R&D)—人工智能驅動的研發新范式備自動矢量化和即時編譯等先進特性,計算性能出色,適用于科學計算和機器學習任務,且支持高階自動微分,有利于科研智能領域的模型開發。國內

PaddlePaddle和

MindSpore作為領先的人工智能框架,均將科研智能作為重點方向進行了

配和優化,目前已具備豐富的算子庫和高階自動微分等能力現有

AI框架未能完全適配科

智能需求。PyTorch在大規模部署時運行效率相對較低,工業級部署支持相對較弱。TensorFlow缺少基礎算子體系,科學計算所需的高階自動微分功能可擴展性不足。JAX處于發展初期,尚未形成成熟生態。國內框架對算子支持不完全,尚無法滿足科研智能發展的需求。為推動科研智能的深入發展,我國需構建更高效、統一的科研智能

AI框架。一是高性能計算優化。框架需要兼容不同類型的國產化硬件資源,如

GPU、NPU等不同類型的

AI芯片,提供高效計算解決方案。同時,提升分布式計算能力以支持大規模計算任務。二是支持跨領域算法和應用。框架應支持特定領域(如地球科學、材料科學等)的算法庫和開發工具,為各領域科研人員提供通用的開發和應用環境,提

靈活的接口和擴展能力,支持跨學科的協同研究及應用。三富生態系統建設。擴展生態系統,提供第三方庫和工具,以及融合已有科學計算領域的算法庫和工具,滿足更廣泛的科研需求。建設活躍的社區,促進科研工作者交流分享,推創新和進步。9科研智能(AI4R&D)—人工智能驅動的研發新范式2.算法庫—匯聚智慧結晶,賦能科研創新突破科研智能算法庫是指面向特定領域科學計算

題,基于

AI框架算子能力開發的一系列高效、穩定的算法集合。算

庫注重易用性、性能及可拓展性,其核心價值主要體現在

下兩方面:一是聚焦對領域單點問題的改進和固化。使用算

庫中經過優化的算法,科研人員能夠更加高效地解決復雜科學計算問題,推動科研成果的產出。二是強調提供最優算法選擇。通過收錄該領域最頂尖的算法,強調提供最優的算法選擇,為科研人員提供便捷、高效的工具,助力科研工作的深入開展。高校、

研院所及企業紛紛推出面向多個各領域的科研智能算法庫。國外方面,布朗大學、麻省理工學院紛紛推出算法庫支持科研智能底層算法的實現。如

DeepXDE充分利用數據和物理知識雙驅動,解決傳統方法難以求解的復雜問題,支持物理信息神經網絡(PINN)和深度算子網絡(DeepONet)等方法。國內方面,深勢科技、之江實驗室等研究機構專注于算法庫的研發,聚焦分子動力學、量子力學、空氣動力學等特定領域的研究,解決該領域計算求解問題。如

DeePMD基于神經網絡擬合第一原理數據的多體勢能表示和分子動力學深度學習,支持

DeepPotential(DP)系列模型,可用于多體勢能表示和分子動力學模擬。表

2國內外典型科研智能

法庫(中國信通院根據公開資料收集整理)算法庫介紹開發者DeePMD-kit基于深度學習的原子尺度模擬算法庫。適深勢科技10科研智能(AI4R&D)—人工智能驅動的研發新范式用于大規模原子及分子動力學模擬。基于機器學習對于低精度的

DFT泛函進行優化。支持

DeePHF、DeePKS方法。神經微分方程和運算符不確定性量化的DeePKS-kit北京科學智能研究院布朗大學、華中科技大學NeuralUQ算法庫。支持算法不確定性

PINN(如貝葉斯

PINN等),不確定性

DeepONet等用于求解微分方程的深度學習算

。支持多種數據驅動和物理信息融合的算法,DeepXDENeuralPDESCiANN布朗大學包括

PINN、DeepONet和

P等。pONet麻省理工學院、都靈大學、渥太華大學、卡耐基梅隆大學等基于物理信息神經網絡(PNs)的偏微分方程求解的算法庫。使用人工神經網絡進行科學計算和物理信息約束的算法庫。支持

PINN算法進行科學計算以及偏微分方程

(PDE)的求解和發現。麻省理工學院我國在科研智能算法庫領域也面臨著原創不足等挑戰。我國在基礎理論創新方面存在不足,物理信息神經網絡(PINN)、傅里葉神經算子(FNO)和深度算子網絡(DeepONet)等經典的底層算法多由國外研究機構提出。我國算法庫的數量較少且影響力不足,國內深勢科技、之江實驗室等機構在特定領域(如分子動力學、量子力學、空氣動力學等)積極開展研究,并開發出

DeePMD、NeuralUQ等算法庫,但與國際先進水平相比仍有明顯差距。因此,我國仍需進一步鼓勵算法原始創新,提升我國科研智

算法庫的自主性和核心競爭力。3.開發套件—簡

科研流程,推動智能化進程科研智能開發套

是指針對特定科研領域,基于

AI框架開發的端到端工具集。開發套件提供標準化接口和用戶界面,覆蓋模型開11科研智能(AI4R&D)—人工智能驅動的研發新范式發全流程,能夠快速用于解決科研問題。相較于科研智能算法庫,開發套件的產品化程度更高。一方面,開發套件通過全流程整合有效提升了科研效率。科研人員無需在多個工具間切換,使用開發套件可一站式完成數據處理、模型開發、評

及部署等工作,縮短研發周期,加速成果產出。另一方面發套件降低了科研人員對計算機專業知識的依賴。開發套件

供操作界面及案例資源,降低了非計算機背景科研人員的使用門檻。科研人員可以更加聚焦科研問題本身,無需花費大量時間精力在人工智能模型調參等技術環節。國內外已形成一系列成熟的科研開發套件。國外方面,形成了相對活躍的開源社區生態。高校、研究機構及企業以

PyTorch為基礎,貢獻了針對特定科學領域的開源套件,如英偉達推出用于流體仿真的

Modulus和用于氣象預測

Earth2Studio,上述工具成熟度較高且已被廣泛應用。國內方面,形成了相對自給自足的生態系統。國內開發套件通常由

AI框架企業提供,如百度和華為基于自身

AI框架能力,向各領域延伸形成工具套件,已覆蓋生物計算、量子計算、流體仿真、地球科學、電磁仿真、化學仿真等領域。表

3我國代表性科學套件(中國信通院根據公開資料收集整理)領域套件名稱公司百度功能描述基于飛槳深度學習框架的科學計算工具庫,提供了豐富的物理模型和

AI方法,支持流體力學、電磁學等領域的仿真與優化。地球科學、材料科學、流體仿真PaddleScieMindEarth地球科學華為支持短臨、中期

、長期天氣以及海12科研智能(AI4R&D)—人工智能驅動的研發新范式洋領域的各類預報。支持航空航天、船舶制造以及能源電力等行業領域的

AI流場模擬。流體仿真MindFlowMindElec華為華為支持數據建構

轉換、仿真計算、結果可視化以及端到端的

AI電磁仿

。電磁仿真PaddleQuantumMindQuantum百度華為提供量子線路設計、量子算法實現和量子經典混合優化等功能,支持多種量子模擬器后端,助力量子計算研究與應用開發。量子計算面向生物計算,支持蛋白質結構預測和分子動力學模擬,為藥物研發提供高效工具

,加速新藥篩選和設計過程。MindSPONGEPaddleHelix華為百度生物計算支持多體系(有機/無機/復合材料化學

)、多尺度任務(微觀分子生成/預測、宏觀反應優化)的化學仿真。化學MindChemistry華為開發套件存在易用性低、功能覆蓋不全等問題。一是使用門檻仍舊較高,用戶需要具備較強的領域知識

編程能力,進而限制了套件的廣泛使用。二是功能覆蓋不全面。一方面覆蓋場景有限,開發套件處于發展初期,往往針對具體科學問題設計,支持的場景較為有限。另一方面覆蓋環節不足,存在功能欠缺。如針對高溫合金材料研發的套件,僅提金成分設計與性能預測環節,缺少特定工藝條件下的合金

為模擬、疲勞壽命預測等能力,這會限制套件在實際工程項目的使用。三是標準化程度低,開發套件之間缺乏統13科研智能(AI4R&D)—人工智能驅動的研發新范式一的接口和數據格式標準,增加了用戶遷移和比較的成本,不利于科研工作的連續性和數據共享。4.領域模型—AI融合知識,加速應用

踐落地領域的模型主要分為兩大類,一類是領域專用模型,針對特定科學問題設計和優化;另一類是基于大語言模型(LLM)的科研模型,利用自然語言處理能力輔助科研工作、完善自動化流程。產學界已經研發出面向多個領域解決特定問題的專用模型。材料科學領域,AI技術結合高通量計算,打破尺度和計算模擬限制,加速材料篩選,促進靶向設計新材料,完成材料和器件的全鏈條優化,為新能源、環境保護、信息技術等產業提供了強大的材料基礎。氣象領域,通過

AI技術對大量氣象觀測和模擬數據進行分析,識別復雜大氣模式,提升天氣預報精度與效率,加強對臺風、暴雨等極端天氣事件的預測能力,輔助氣候變化研究。流體仿真領域,AI提升了復雜流體動力學問題的模擬和求解效率,對湍流、液體混合等復雜流體進行流動模擬優化、實時仿真,廣泛應用于航空航天、汽車制造等領域。電磁仿真領域,AI模型能夠快速模擬和優化復雜電磁場分布,提升仿真和設計效率。以電磁兼容性分析為例,AI能夠預測和識別潛在干擾問題,優化電路設計,確保電磁設備的性能和可靠性。生命科學領域,AI模型能夠分析復雜的生物數據,如蛋白質結構預測因組分析等,加速新藥發現和個性化醫療方案的制定,解

傳統方法耗時長、成本高的問題。業內典型領域專業模型詳見附錄一。14科研智能(AI4R&D)—人工智能驅動的研發新范式大語言模型為科研領域帶來新的輔助手段。大語言模型與科研相融合正在成為新方向,目前大語言模型主要應用于科研助手和流程自動化。科研助手方面,大語言模型結合領域知識,不僅可以提供研究假設、科研方向供科研人員參考,還可以作為科研知識助手,為科研人員提供即時的信息查詢和。流程自動化方面,大語言模型可以幫助提高實驗效率、減

人為誤差,實現更精準、可重復的實驗管理。典型場景包括輔助決策和實驗設計、任務調度智能加速和實驗室管理等。大語言模型與領域專業模型的深度融合正推動科研領域實現重大突破。大型語言模型擅長發現并整理科學領域的難點問題,領域專業模型則負責完成復雜的計算任務,兩者結合可有效提升人機交互能力,加速科學研究的進程,有望在特定領域取得突破性進展。例如,卡耐基梅隆大學研發的

AI系統

Coscientist能夠自主完成從信息檢索到實驗執行和數據分析的整個流程,該系統成功設計并合成了阿司匹林、對乙酰氨基酚和布洛芬等常見藥物分子。同時,Coscientist在不到四分鐘內成功設計鈀催化交

偶聯反應的實驗方案,并成功復現了這一重要的復雜化學反學獎。該研究曾獲諾貝爾化三、科研智能應用發展情況基礎科學研究領域技術的應用促進了新理論、新算法的發現與驗證,逐步拓

科學研究的邊界。產業研發創新領域,AI技術通過加速新藥研發、優化材料篩選、提升工業設計效率等方式,提15科研智能(AI4R&D)—人工智能驅動的研發新范式升產品研發效率為產業升級與變革提供強有力的技術支撐。(一)基礎科學研究—開展前沿探索,推動科學邊界拓展科研智能在基礎科學領域展現出

闊的應用前景。目前,國內外高校和科研機構都在積極探索

AI與科學研究的深度融合,在過去5年,AI+科學研究的相關成果連續入選《Science》雜志評選的十大突破。AI賦能科學研究主要體現在以下四個方面:一是

AI輔助科學文獻研究。科研人員借助

AI能夠高效地分析和挖掘海量的科學文獻,提取關鍵信息,識別研究趨勢。例如,北京國際科技創新中心使用知網華知大模型打造了開放科學平臺,集成了知網智研助手、學術問答、智能寫作三大

AI工具,為學術和技術創新人員提供了全方位的知識服務。二是

AI指導和加速科學實驗。通過數據分析和機器學習,AI能夠優化實驗設計,減少不必要的實驗次數,顯著提高實驗效率。如

DeepMind通過深度強化學習技術對托卡馬克等離子體進行精準磁控,將等離子體控制精度提升至

65%,為核聚變研究帶來了重要突破。三是

AI啟發新理論和算法發現。AI的模式識別和預測能力有助于科研人員發現新的科學規

,提出創新性的理論。如物理學家利用神經網絡發現了質子中隱性內含粲夸克的存在證據,這一發現可能會引發量子色動力學理論的重大更新

。四是

AI優化和加速科學計算。傳統數據海量數據時會遭遇“維度災難”問題,AI技術可以提高復雜科學計算的效率,解決傳統方法難以處理的問題。如

DeepMind發布的

AlphaFold3可預測地球所有生物分子結構,16科研智能(AI4R&D)—人工智能驅動的研發新范式準確率比現有方法高

50%,成為首個在生物分子結構預測方面超越基于物理工具方法的

AI系統。表

42019年至

2023年

Science雜志評選的十大

學突破20232022202120202019人工智測蛋白質結人類歷史上首張黑洞照片問世減肥藥

GLP-1詹姆斯韋伯太新冠疫苗點亮希望之光有望戰勝肥胖空望遠鏡抗體療法在減緩阿爾茨海默病方面取得進展發現可能導致多發性硬化的病毒CRISPR首次成功治愈兩種遺傳性血液病抗新冠強效藥出現與丹尼索瓦人“面對面”黑死病如何改

迷幻藥物可

“精英控制員”谷歌宣布實尋找天然氫源的熱潮變歐洲人基因

治療創傷后

控制艾滋病病現“量子霸權”的新見解應激障礙毒在全球機構中系統性改變業早期科學家的待遇單克隆抗體

AI首次精準預

腸道微生物治療傳染性

測蛋白質三維

對抗營養不驚人的巨型細菌疾病結構良基因編輯工具

CRISPR首次獲得臨床勝利接近美洲遠古

200萬年前環人類定居的歷

DNA重現古科學家反對種

小行星撞擊族歧視,支持

地球及其帶多樣性史真相老生態系統來的影響體外胚胎培地球的碳泵正

更易于耕種的

養為早期發

全球變暖趨勢

最遙遠天體在減速運行多年生稻育研究打開新窗戶加劇的特寫巨型黑洞合并產生的星際信號在無聲轟鳴首次在土壤中提取到古人類

DNA人類首次行星防御實驗成功現快速射電

“缺失環節”來源的微生物?第一次

,有藥世界最古老狩

物可以治療“洞察”號首次揭示火星內部結構AI輔助天氣

RSV疫苗取得預報的發展

突破進展獵場景面世大多數囊性纖維化病例粒子物理學的標準模型

首個室溫超導埃博拉患者終于有了希望抗擊瘧疾的新

創造性人希望

能的快速發出現了“裂縫”體面世百億億次超級

美國通過具有

核聚變實現

鳥類具有驚人

AI戰勝多人計算時代的來

里程碑意義的

歷史性突破的智力撲克17科研智能(AI4R&D)—人工智能驅動的研發新范式臨氣候法(二)產業研發創新—構建核心驅動力,加速產業升級變革科研智能在多個產業領域中取顯著成效。新藥研發領域,AI

可加速藥物發現和研發過程。如西安交通大學第一附屬醫院基于盤古藥物分子大模型,研發出超級抗菌藥肉桂酰菌素。AI

減少了人工對小分子化合物的篩選計算量,加快了藥物分子的篩選過程,突破了醫藥研發“雙十定律”的瓶頸,使先導藥的研發周期從數年縮短至數月,研發

本降低約

70%。電池材料研發領域,AI

可輔助篩選和預測高

能材料。通過多尺度模擬預測材料性能,優化實驗設計,提升實驗效率。如深勢科技在電解液材料研發領域,通過正向設計與篩選優化的方法,有效提升金羽新能開發高能量密度電池電解液的效率,研發周期由原來的

14

個月縮短至

6

個月。航空航天仿真測試領域,AI

助力評估航空器設計方案的可行性和性能。如中國商飛上海飛機設計研究院基于昇騰

AI

開發了業界首個三維超臨界機翼流體仿真大模型“東方·翼風”,能高精度模

大飛機全場景飛行狀況,用時僅為原來的千分之一。電磁仿真領域,AI

可實現高效手機電磁仿真。如華為聯合東南大學打造了金陵·電磁腦基礎模型,基于AI

方法進行大規模陣列電磁仿真,將仿真效率平均提升

10

倍以上。工業設計領域

AI

可提升設計效率并降低成本。中國科學院沈陽自動化研究所與上汽大眾合作開發了“基于

AI

和知識圖譜的焊18科研智能(AI4R&D)—人工智能驅動的研發新范式裝夾具智能設計軟件”,通過知識圖譜和生成式AI提升設計效率80%以上,設計成本降低至原來的一半,實現需求到制造的一站式交付服務。工業制造領域,AI可提升生產效率與產品質量。如中冶京誠推出“鋼智通”專家系統通過大語言模型提

智能決策進行生產流程優化,能耗降低

1%,廢品率降低

0.,整體管控效率提升

10%。四、科研智能生態建設情況隨著人工智能與科學研究、產業研發的深度融合,產業界與學術界也逐漸形成日益緊密的合作,逐步構建起多元化產業生態體系,為科研智能的健康發展提供了有力支撐。(一

產業組織中國人工智能產業發展聯盟(AIIA)發起成立“科學智能(AI4S)工作組”,為產學研用各界搭建開放的交流合作平臺,前期已組織例征集、供需對接、報告編制等工作,后續會重點圍繞新材料、地球科學等重點領域開展工作。(二)社區建設華為在科研智能領域積極構建了一系列

業且富有活力的社區,旨在推動

AI技術的廣泛應用與深入發展。MindFlowSIG社區專注于昇思

MindFlow為科研人員、教師及學生提供了高效易用的

AI計算流體仿真套件。MindESIG社區聚焦于昇思

MindEarth,為廣大用戶帶來高效便捷

AI地球科學套件。MindElecSIG社區緊密圍繞實際生產中的各類電磁應用場景,在昇思

MindSpore框架下積極19科研智能(AI4R&D)—人工智能驅動的研發新范式探索和研究基于

AI的電磁正問題及反問題,致力于開發高效精準的AI電磁模型。MindSPONGESIG充分利用昇思

MindSpore的優勢。聚焦

AI計算生物領域,在為科研人員、教師及學生提供高效易用的AI計算生物軟件。深勢科技的

DeepModng開源社區提供開源的科學智能廣場(AIS-Square)共創平

,支持科學計算、數據、軟件模型和工作流的開發。百度飛槳

河社區匯集豐富的

AI原生應用,提供零門檻的開發工具,促進全球科研人員的合作。中山大學牽頭,北京航空航天大學、華為、百度等單位配合,共同建設

AI科學智算群智協作社區,整合多方資源,建數據庫與課程,促開放協作,為科學智算發展助力。(三)科研賽事百度持續推出飛槳黑客松、AI4S共創計劃、大灣區杯—百度賽道等科學智能賽事,聚焦

AI4S前沿模型復現,貢獻

AI4S模型或案例

50余個。深勢科技提供真實的科學場景和數據舉辦

AI4SCup系列比賽。華為舉辦“開源之夏”賽事聚焦科研智能,推出基于圖像深度學習的無線電信號識別項目,旨在推動

A與無線電技術融合,培育科研智能創新人才。中山大學牽頭舉辦

首屆“大灣區杯”粵港澳AI4S科技競賽,北京航空航天大學、浙江大學、百度、華為等單位整體協同,針對人工智能科學計算問題設置

3個賽道與

24個賽題,賽題涉及

AI4S的通用范模型,包括科學計算、流體、生物醫藥、分子、金融、社會

、電磁、化學、交通等多個領域的典型應用。和鯨科技舉辦數字醫療算法應用創新大賽等

500余場專業數據科學20科研智能(AI4R&D)—人工智能驅動的研發新范式競賽,覆蓋氣象、醫療等

20余類行業。(四)會議交流北京科學智能研究院舉辦科學智能峰會,圍繞

I4S基礎設施共建、典型應用領域等話題進行深入探討。

度聯合高校舉辦全國智能流體力學研討會等會議,與高校師

共同探索

AI4S的未來。以“科學智算(AI4S):交叉與賦能”為主題的

CCF秀湖會議在蘇州舉辦,北京航空航天大學專家就多智能體科學智算模式進行學術報告,介紹了群體智能研究近期研究成果。首屆“人工智能科學計算學術研討會”上產學研各界對于人工智能推動科學計算劇變式創新的高度關注,通過匯聚全球人工智能科學計算領域的專家和先行者,打造科學智算支撐基礎科學探索和交叉前沿發現的新興社區生態。中國計算機大會CNCC2023舉辦的科學智算平臺技術前沿探討論壇會上北京航空航天大學、華為和百度等專家學者共同探討科學智算的最新研究方向及產業動向。(五)教學培訓深勢科技支持舉辦

AI4S系列主題的哥倫布訓練營活動,提供20余門課程資源、2000余篇實訓案例等國內外優質的

AI4S教學資

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論