中新社合肥4月7日電 (記者 張俊)記者7日從安徽省量子計算工程研究中心獲悉,中國第三代自主超導量子計算機“本源悟空”近日完成全球首次運行十億參數級AI大模型微調任務。
本次任務由本源量子計算科技(合肥)股份有限公司(簡稱“本源量子”)、合肥綜合性國家科學中心人工智能研究院等聯合攻關完成的。實驗結果顯示,在參數量減少76%的前提下,AI大模型訓練效果反而提升8.4%。這一成果不僅驗證了量子計算助力實現大模型輕量化的可行性,更為破解大模型“算力焦慮”開辟了新路徑。
大模型微調是指在通用大模型的基礎上,通過進一步訓練特定領域數據,使其適應醫療診斷、金融風控等專業場景。傳統低秩微調面臨性能瓶頸、泛化能力有限等問題,量子計算憑借其疊加態和糾纏態特性可同時探索海量參數組合,提升大模型微調的效率。
本源量子副總裁竇猛漢介紹,團隊創新設計了一種量子加權張量混合參數微調的方法,將模型權重轉化為量子神經網絡與張量網絡混合架構,前者通過量子門操作提取高維非線性特征,張量網絡則壓縮參數規模。
在“本源悟空”的量子芯片上,AI大模型單批次數據可生成數百個量子任務并行處理。實驗數據顯示,優化后的模型在心理咨詢對話數據集上訓練損失降低15%,數學推理任務的嚴格準確率從68%提升至82%。合肥綜合性國家科學中心人工智能研究院副研究員陳昭昀表示,這是量子計算首次“真機實戰”AI大模型任務,證明現有硬件已能初步支撐大模型微調。
截至目前,“本源悟空”超導量子計算機全球訪問已覆蓋139個國家和地區,完成35萬個量子運算任務,涵蓋流體動力學、金融、生物醫藥等多個行業領域。(完)