聯系方式
總機:0510-85195508
業務:0510-85162150
人事:0510-85102511
郵箱:info@mail.nsccwx.cn
傳真:0510-85167598
郵編:214000
地址:江蘇省無錫市濱湖區吟白路1號研創大廈
關注我們
導讀:
如何具象化一個天文量級的數字?銀河系中約 4000 億顆恒星,便是最直觀的參照。當 “億” 成為計量基準,人類得以觸摸宇宙尺度的宏大。SWDOCKP2 計算框架與“神威”超級計算機深度耦合,實現了虛擬篩選性能的量級式躍升 — 其篩選規模從早期的十萬、百萬、千萬級別,跨越至宇宙尺度,日篩 1.9萬億配體,這一數值相當于 5 個銀河系的恒星總量!
依托國產神威超級計算機系統的強大算力,北京生命科學研究所/清華大學生物醫學交叉研究院黃牛課題組聯合山東大學、清華大學和國家超級計算無錫中心協同攻關,成功構建并運行了新一代性能可移植虛擬篩選框架SWDOCKP2。該框架實現了每日1.9萬億個蛋白質-配體分子對接的理論計算速度,將基于結構的虛擬篩選能力推向了接近整個人類蛋白質組的覆蓋規模。此項里程碑成果已在高性能計算領域頂級學術會議——第 37 屆超級計算國際會議(SC25: The International Conference for High Performance Computing, Networking, Storage and Analysis)上報告,并獲得廣泛關注。
新藥研發耗時漫長、投入巨大,而虛擬篩選技術已成為縮短早期發現流程的關鍵。然而,隨著“按需合成”虛擬化合物庫規模從百萬級爆發式增長至百億甚至千億級,計算壓力呈指數級上升。據估算,在傳統算力平臺上,對370億規模的化合物庫進行一次篩選,需耗費數周時間和數千萬元成本,這構成了技術普惠的核心瓶頸。
面對這一全球性挑戰,國家超級計算無錫中心主動布局,致力于將超級計算的極致性能轉化為解決生命科學重大問題的實際能力。
聯合團隊以經典軟件UCSF DOCK3.7為基礎,針對 “神威” 超級計算機架構進行深度移植、重構與優化,開發了全新的虛擬篩選軟件SWDOCK。實測表明,其單核組性能可達商用CPU單核的13倍。借助新一代神威超算15% 的算力,SWDOCK 僅用 663 秒便完成 5.4 億配體分子的虛擬篩選,理論對接速度達每日 700 億配體,躋身國際同類工作領先水平。
然而,面向未來,人類蛋白質組規模的篩選需求與化合物庫的指數增長,呼喚著進一步的突破。為此,聯合團隊持續攻關,在SWDOCK的基礎上,推出了全面升級的SWDOCKP2框架。2025 年 11 月,在美國圣路易斯召開的 SC25 會議上,團隊以論文《Trillion Ligands per Day: Performance-Portable Virtual Screening via Compound Database Optimization and Multi-Target Docking》作專題報告,系統介紹性能可移植的跨平臺虛擬篩選框架SWDOCKP2。該框架可調度新一代神威超級計算機系統,同時對接 8 個蛋白質靶標結構,實現每日 1.9 萬億個蛋白質–配體對的理論篩選速度,較此前領先水平提升一個數量級。
1. 多靶標并行:能量網格融合結合三線性 SIMD 插值算法優化
針對蛋白質組規模篩選中 “多同源蛋白、多功能構象” 的并行對接需求,SWDOCKP2 創新提出 “多靶標并行處理 ” 策略。通過“能量打分網格對齊融合”即將多個受體的能量打分網格在空間上對齊,融合為 “4D 網格”,深度挖掘 SIMD 并行能力,大幅提升數據局部性與 DMA 通信效率。相較于逐個靶點獨立對接,該方案顯著降低 I/O 與構象匹配的計算開銷,同時嚴格保持對接結果一致性;優化三線性 SIMD 插值算法,在保障精度的前提下進一步提升計算效率,目前已支持最多 8 個受體結構或構象的同步對接。
2. 構象系綜重構使能“早淘汰” 機制
在配體小分子側,團隊對化合物構象系綜數據庫進行精細化重構。通過對構象基礎單元(confs)的排序與歸并,將對接打分階段的迭代量降低近一半。同時,引入 “早淘汰” 機制,在對接過程中實時識別并剔除存在明顯空間沖突的高能量構象,避免無意義的高開銷冗余計算;提出構象打分緩存方案,將高頻訪問的 confs 打分預存于本地設備存儲器(LDM),進一步加速對接流程。受體與配體雙重優化,有效壓縮冗余計算并提升計算效率,為萬億級篩選奠定堅實基礎。
3. 跨平臺兼容:從神威走向通用 CPU
SWDOCK 最初專為神威異構架構深度優化,但藥物設計與計算化學領域大量研究依賴通用對稱多處理器(SMP)平臺(如 x86 服務器)。為打破平臺壁壘,團隊在 SWDOCKP2 中引入基于 OpenMP 的 AthreadS 兼容層。通過 pthread 啟動CPE 集群線程,其上運行 OpenMP 線程模擬 CPE ;利用線程棧與線程本地存儲模擬 LDM,以編譯器內置數據復制函數替代 DMA 指令,在通用處理器上模擬神威平臺的編程模式。該設計使得針對神威架構優化的應用可快速移植至通用 CPU 平臺,大幅提升代碼性能可移植性,為開源學術社區貢獻核心技術支撐。
本研究由山東大學軟件學院段曉輝研究員、清華大學計算機系/北京生命科學研究所聯合培養博士后沈成、北京生命科學研究所/清華大學生物醫學交叉研究院博士生陳高偉共同作為第一作者。段曉輝研究員、清華大學/國家超級計算無錫中心主任楊廣文教授、山東大學劉衛國教授以及北京生命科學研究所/清華大學生物醫學交叉研究院黃牛研究員為共同通訊作者,團隊還包括多位高校學者、博士后及研究生。
2025年,相關工作已由段曉輝研究員在中國計算機學會全國高性能計算學術大會(CCF HPC China 2025)作大會特邀報告,并入圍“CCF HPC China 2025 超算年度最佳應用”;由沈成博士在SC25會議、“探索計算化學、生物物理與生物科學的前沿交叉”研討會以及第三屆高性能計算青年論壇暨科學智能大模型研討會上作報告。歷次報告均收獲與會專家的熱烈討論與高度認可。
在SWDOCKP2框架實現萬億級篩選能力的背后,是國家超級計算無錫中心運維團隊對“神威?太湖之光”系統長達近十年的持續優化與堅實保障。在蛋白質組數據集的生產任務中,面對計算任務帶來的極端計算與數據壓力,運維團隊通過精細化算力調度與任務管理,實現了對超大規模計算資源的動態分配與高效利用,保障了長期、高負載作業的穩定執行。
在存儲與I/O層面,團隊針對虛擬篩選中頻繁的大規模文件讀寫場景,設計了高性能并行文件系統優化方案,顯著提升了化合物庫加載與結果寫入效率。同時,通過全鏈路性能監控與調優,運維團隊與研發團隊緊密協作,持續優化從計算節點到存儲系統的整體性能,確保系統在極端負載下仍保持高可用性與低延遲。
此外,運維團隊還提供了跨平臺部署支持與系統級容錯保障,為SWDOCKP2在神威超算及未來擴展至其他計算平臺奠定了堅實的運行基礎。這些底層系統保障與性能優化工作,不僅是項目順利推進的關鍵支撐,也為超算在生命科學等領域的深度應用樹立了運維標桿。
目前,國家超級計算無錫中心已初步向國內外科研學術機構及藥物研發企業開放以SWDOCKP2 虛擬篩選為核心的藥物發現計算平臺,旨在打破算力資源與技術壁壘,匯聚全球創新力量,加速潛在治療靶點的挖掘與先導化合物的篩選進程,助力攻克各類疑難疾病,推動全球創新藥物研發進入高效、普惠的新階段。未來,中心將繼續與國內優勢單位共建聯合機構,為氣象氣候、生命科學、新材料、人工智能等領域提供定制化解決方案,推動科技創新和產業創新深度融合,為經濟社會發展注入強勁科技動力。