首頁  ?  財經  ?  經濟觀察

小模型打敗大模型?患者挑戰專家?醫療AI需要冷思考

2025-03-03 08:58:13

來源:第一財經微信公眾號

  在優質醫療資源稀缺的背景下,AI大模型的介入無疑正在改變傳統的行業競爭格局和醫患關系。

  本月以來,多地公立和私立醫院紛紛官宣接入DeepSeek并開啟本地化部署,瑞金、中山、協和等頭部大三甲醫院接踵發布醫療垂直領域的大模型。而DeepSeek的開源路徑,不僅打破了技術“黑箱”帶來的應用鉗制,也讓“技術平權”的思路正植入醫療生態中。

  但熱潮之下也需要冷思考。醫療場景的嚴肅性、復雜性和低容錯性,使得醫院、醫生、患者與AI的磨合之路,注定道阻且長。

  悖論似乎正在增多:當普通患者、基層醫生通過AI獲取海量知識時,理論上有助于分級診療和精準醫療,但AI幻覺增加了醫患間的沖突和不信任;大模型給醫生減負也減輕了醫院管理成本,但大模型的實施和維護成本高昂;生態開放降低了醫療大模型的入局門檻,但大模型的迭代需要大量高質量數據,強者恒強的故事仍在上演。

  此外,開放式創新能否找到容他性知識產權保護機制和產業生態?在生態開放下,患者隱私和診療的準確性又由誰來兜底?

  醫療“百模大戰”迎來新入局者

  “醫療機構自身投入行業大模型訓練的趨勢,正變得越來越明晰。”優實資本董事長邢杰在接受第一財經采訪時說。

  有數據顯示,2024年涌入醫療領域的AI大模型公司已經過百。今年,國產推理大模型DeepSeek-R1推出后,掀起新一輪醫療行業大模型研發和應用熱潮。如邢杰所言,通用大模型領域的“百模大戰”在DeepSeek的V3和R1發布后喧囂褪去、格局已定,但醫療行業大模型的“百模大戰”正在迎來新入局者、曾經的AI應用“保守派”——醫療機構。

  邢杰表示,在這背后的一個核心的原因在于大模型研發進入到第二個階段,也即從預訓練通用模型進入到后訓練推理模型主導的階段。醫院尤其是在某些專病領域掌握權威數據資源又具備一定臨床轉化能力的“大三甲”醫院逐漸意識到:后訓練推理模型階段的訓練成本遠低于預訓練階段,用于強化學習訓練推理模型的數據量也遠低于預訓練階段。

  2月中旬以來,多家大型公立醫院宣布大模型研發的最新成果。

  上海交大醫學院附屬瑞金醫院發布單模態大模型——“瑞智病理大模型”(RuiPath);復旦大學附屬中山醫院發布心血管專病大模型“觀心”稱其則結合多模態數據深度推理能力;北京協和醫院官宣“協和·太初”罕見病大模型進入臨床應用階段。第一財經了解到,該模型采取“數據+知識”雙輪驅動的“小樣本學習”模式并結合了大模型的強推理能力。

  但相較于科技企業、醫療AI公司和互聯網醫療企業,這些大醫院的研發投入更為謹慎,通常從單模型、單病種或特色病種入手。

  “行業大模型研發是個循序漸進的過程,目前在醫療影像診斷等領域,AI診斷的成熟度和準確性之高,業界已經基本達成共識。所以,醫院大都選擇從文字或影像等單模態入手來訓練細分行業模型,這樣難度較低?!毙辖苷f。

  當前,在診療方面,醫療機構所訓練的小模型大體可分為兩類:一類是綜合考慮訓練數據量、算力、與真實醫療場景中的適配度以及所需解決的實際醫療問題,而自研的模型;另一類是在如DeepSeek等通用大模型開源基礎上,“蒸餾”并予以本地化部署的專用模型。

  京東健康探索研究院(JDH XLab)首席科學家王國鑫對第一財經表示,對于前者,盡管DeepSeek讓業界看到了通過算法優化和深度推理能力,可以以一種更具性價比的方式實現大模型訓練,但模型“小樣本學習”或者說實時學習的能力其實并不容易達成。在出現顛覆式訓練方式之前,模型訓練對于算力以及對于高質量、大體量的數據需求,仍然迫切。

  對于后者,“大家有時候低估了大模型落地對于醫院自身軟硬件卓越程度的要求。”王國鑫舉例說,比如醫院算力消化情況、信息化基礎設施投入等,這些都關乎大模型能發揮真實效力。

  有醫院人士告訴第一財經,由于算力受限,醫院需要將大模型上數據部署在云平臺上,而非醫院內置服務器上。出于醫療數據隱私安全考慮,在大模型上問診的患者無法直接跳轉醫院門診預約平臺,需要重新使用真實ID進行注冊和預約,或者通過醫務人員的人工介入,幫助患者與醫院建立真實診療關系。如何讓大模型診療與線下就診渠道更“絲滑”?仍待醫院信息化的持續變革。

  小模型打敗大模型?

  在接受第一財經采訪時,DCCI-未來智庫與FutureLabs-未來實驗室首席專家胡延平表達了一個觀點:鑒于行業特殊性,醫療大模型的發展或是一個從“專用”到“通用”的過程。

  現階段,一方面,“很難說醫療領域擁有了所謂的通用大模型”,相反“越通用,可能在某個特定的方向能力越不突出”;另一方面,行業對大模型的泛化功能需求不太迫切,但更需要使用病理大模型提升檢查效率,通過專病模型切實提升診斷準確率。

  前述受訪醫院人士表達了類似看法。她舉了一個例子:此前,OpenAI宣稱通過“強化微調”技術,使通用型大模型O1為罕見疾病診斷提供了全新的解決方案。在官方示范案例中,O1模型從數百篇關于罕見疾病的科學病例報告中提取出一系列疾病信息,并據此預測可能引發遺傳疾病的基因。

  該醫院人士認為,在前述案例中,所有疾病表型已知,相當于大模型在擁有了完整版的患者信息后,再進行決策,這是一種純知識映射。而更貼近現實診療環節的模式,則是在醫患雙方都不知曉疾病種類的情況下,自由地進行人機交互。這一點已有垂類大模型可以做到。

  一種普遍存在的業界看法是,部分通用大模型或能實現個別精準診斷,但個案的成功并不代表模型具備特定疾病精準診斷的能力。

  “不過,這并不代表‘小模型打敗大模型’。”胡延平認為,原因有兩點:其一,專用(垂類)模型的訓練離不開通用模型,或者說專用模型往往是在幻覺較低、推理能力較強的通用模型基礎上微調、后訓練或者模型蒸餾而成的;其二,專用模型的準確度從50分提升到70分容易,甚至目前已有不少專用模型宣稱其疾病診斷能力達到80~90分。但再往上,專用模型的性能提升會遇到瓶頸。這時候就需要通用大模型的三個能力進行賦能——通識能力、思考推理能力以及多模態能力。

  邢杰也認為,從疾病診斷來說,通常需要患者影像數據、檢查檢驗數據、聲音數據、文本數據等多模態數據以進行交叉驗證,所以多模態大模型始終是行業趨勢。

  王國鑫表示,多模態的推理模型可以視為AI未來在絕大多數醫療場景中應用的根本技術。唯其如此,AI才能逐漸具備類似于人的能力,進入數字人階段,乃至實現所謂的“強人工智能”,而不僅僅是一個對話工具。目前,在很多醫院場景下,小體量、單模態和專病大模型的應用,更多是延續“AI改造原有的技術鏈路”的思路,而非“訓練AI重新創造一種生產模式”。

  生態開放

  多名受訪業界人士均提出,無論是如互聯網醫療企業、AI醫療企業等先入局者,還是如醫院等后入局者,均需要進行生態合作和數據開放。

  “回到一個基本的邏輯,醫療行業在某種意義上就是一個數據驅動型行業。大模型和AI醫生的訓練過程需要大量醫療數據。但現在醫療數據不僅量少,而且質量欠缺。所以,醫院間要合作、醫院要與互聯網醫院合作,還要和患者端合作。”王國鑫說。

  此外,王國鑫稱,大模型天生具備“去ID化”特質,脫敏后的醫療數據往往可以達到更具精度的訓練成果,加之目前數據安全和隱私計算等技術日趨成熟,醫療數據的生態開放在大模型訓練上,有實現的可能性。

  但醫院的顧慮顯然更多?!白鳛橐粋€專業工具而言,醫療機構訓練的疾病診斷大模型并不具備開源的背景和基礎。因為醫學診療的執行權不能交給AI工具。對于大模型生成推薦方案,需要醫生的審核和決策。如果實現大模型的參數開放,大模型的數據和知識來源將不再可控,如果因為產生‘AI幻覺’,不僅患者診療結局可能受到影響,大模型研發單位的聲譽和口碑也可能被殃及。”有受訪醫生表示。

  所以,“可信、互信”是開源第一步。正如其他行業已出現的相關治理思路,邢杰認為,在很多醫療機構都開始訓練自已的小、中、大細分行業模型的情況下,會出現幾個權威的或官方的醫療健康行業AI模型評測體系,以驗證各家行業模型的性能指標,如疾病診斷的準確度、穩定性等。在此背景下,醫療行業模型會逐步走向一個優勝劣汰的階段。

  醫療機構也能從開源中獲益。鑒于目前一些醫療機構訓練出的小模型或專病模型,在某些疾病診療領域已顯露出比通用模型更高的準確性和實用價值,邢杰認為,即便后續出現了全行業、更有權威性的行業通用模型,這些專病模型也有足夠的價值與這些行業通用模型展開各種合作,細分領域優質數據永遠是模型訓練的稀缺資源。

  而從現階段來看,醫療機構的數據開放依然推進艱難。相比之下,企業側的開源生態已初露端倪。

  今年,在DeepSeek開源后,國內多家科技公司相繼宣布實施大模型開源。在醫療AI行業,包括在AI制藥、AI診斷等細分賽道上,企業的開源動作雖然不多,但已經開始有。

  比如,京東健康近日官宣旗下“京醫千詢”醫療大模型成為國內醫療行業首個全面開源的垂類大模型。對此,王國鑫表示,目前無論是大模型技術還是醫療AI行業,都在發展的早期階段。此時,開源和透明的合作方式能夠快速推動技術的使用和接納,培植行業生態。

  患者挑戰專家?

  當DeepSeek所引發的“技術平權”浪潮席卷醫療領域,不僅醫療服務供給側的生態競爭格局出現變化,醫患關系也正悄然發生改變。

  近日,廣東一名醫學博主在社交媒體上發帖表示,自己為病人開出治療方案,對方查詢DeepSeek后反饋有問題,自己“氣得又查了一遍醫學指南”,結果發現醫學指南更新了。為此,他無奈自嘲:感覺“天塌了”。

  于是在醫生群體中,“一石激起千層浪”,有的醫生產生了危機感,有的醫生則認為大模型的診斷結果“大而全,但不一定有用”,有的醫生譴責AI幻覺,還有的醫生認為大模型可以訓練基層醫生、提升診療同質化水平。

  在胡延平看來,“患者挑戰專家”不失為一件好事。長期以來,醫療市場是個醫患雙方信息高度不對等的市場,患者知識儲備的增強,既能倒逼醫生提升專業能力,也能在一定程度上避免過度診療,或者因觀念、利益等因素選擇并不是最有利于患者的治療方案。

  從更宏觀的維度,胡延平認為,AI大模型的應用也有利于醫療的“去中心化”,賦能基層醫療,并幫助互聯網醫療等市場化主體參與到醫療市場的競爭中,從而減少優質醫療資源的壟斷和稀缺問題。

  他認為,誠然如“醫生有了AI,變懶了”“病人有了AI,不找醫生”等現象,確實有可能發生,但從更長周期來看,大模型能夠讓優質醫療資源更普惠和可及。

  在受訪專家中,無論是“技術審慎主義者”還是“技術樂觀派”均認為,目前距離“AI開處方”還言之過早。

  持審慎態度的受訪專家認為,醫學診療的執行權不能交給AI工具,醫生需要對患者負責,醫生問診過程也是與患者情感交互過程,可以給予患者更個性化的診療方案,更勿寧說,AI幻覺還難以抑制。

  持樂觀態度的受訪專家則認為,當AI成為一個被醫患雙方廣泛認可的技術之后,有關AI處方權、AI診療支付價格標準問題等,均會被監管層重視并予以解決。但目前還處于技術發展的初期,醫療大模型的應用場景還有待拓寬。

  而要想提升醫患雙方對AI技術的信任程度,核心之一在于抑制AI幻覺。

  邢杰分析說,大模型“幻覺”產生主要有六點原因:一是訓練數據偏差;二是作為概率模型,大模型不可能實現100%精準;三是在泛化過程中會產生幻覺;四是大模型訓練數據通常是非實時的;五是對話長度和上下長度都可能導致幻覺問題;六是在反饋微調過程中,不同公司的偏好也會帶來一定幻覺。

  王國鑫認為,AI幻覺可以得到抑制。“一定要把診斷流程的推理過程白盒化,這不僅僅是讓醫生隊伍產生信任,更重要的是讓技術有進步。”

  在他看來,今天的大模型技術,還是一個“學生”,但可以通過拉長推理過程,使其自己反復校驗,從而達到一個更好的結果。換言之,在技術層面,AI幻覺不是不能解決的問題,AI會無限逼近那個準確性。

  第一財經 吳斯旻

  • 相關閱讀
  • 李文輝代表:建好用好綠色氫基能源平臺促低碳轉型

      中新網長春3月3日電 (高龍安 金喬)近年來,新能源產業成焦點,特別是在儲能、電動汽車、電池等行業受到的關注度更高。全國人大代表、國家電投集團吉林能投白山分公司設備部主任李文輝2日接受記者采訪時表示,綠色氫基...

    時間:03-03
  • 深圳發布三個工作方案 全力培育優良營商環境

      中新網深圳3月3日電 (記者 索有為)深圳市政府新聞辦2日舉行主題為“進一步優化市場化、法治化、國際化營商環境”的新聞發布會,正式發布2025年深圳市優化市場化、法治化、國際化營商環境三個工作方案,展現深圳始終...

    時間:03-03
  • 巴菲特:關稅如同“戰爭行為”,或將損害消費者利益

      中新網3月3日電 (張乃月)綜合美媒2日報道,美國知名投資人巴菲特罕見就貿易政策發表評論,認為特朗普政府的懲罰性關稅可能引發通貨膨脹,并損害消費者利益。資料圖:巴菲特?! “头铺厝涨敖邮苊绹鐐惐葋啅V播公司(CBS...

    時間:03-03
  • 美財長回應通脹擔憂:預計通脹率將“迅速”回到2%目標

      中新網3月3日電 (張乃月)據彭博社2日報道,美國財政部長貝森特預計,美國通脹率有望“迅速”回到美聯儲設定2%的目標?! ∝惿乇硎?,“未來6到12個月中,隨著我們放松管制、開采更多美國能源,并推動延長2017年的減稅政...

    時間:03-03
  • 廣州海事部門服務新能源汽車海運實現重大突破

      中新網廣州3月3日電 (郭軍 陳秀慧 黎舒婷)3月1日,在廣州海事部門的保障下,廣州港南沙港區外貿班輪“GREEN QINGDAO”輪裝載著68輛國產新能源汽車,緩緩駛離港口,開啟了前往巴西的航程。此次運輸采用了中遠海運特運48英...

    時間:03-03
  • 中國“土豬”從瀕臨滅絕到搖身變“金豬”

      數智風向標  政策保種 科技賦能  中國“土豬”從瀕臨滅絕到搖身變“金豬”  借助科技的力量,中國“土豬”正闖出一條路來?! ?月23日,黨的十八大以來第13個指導“三農”工作的中央一號文件發布,其中提出“推...

    時間:03-03
  • 3月3日央行開展970億元7天期逆回購操作

      中新網3月3日電 據央行網站消息,為保持銀行體系流動性充裕,2025年3月3日中國人民銀行以固定利率、數量招標方式開展了970億元逆回購操作。具體情況如下:截圖自央行網站...

    時間:03-03
  • 投資領域掀起大模型“淘金熱”,AI的“財商”有多高?

      投資者跟著AI理財,機構平臺加速布局上線新產品,財富管理迎來變革  投資領域掀起大模型“淘金熱”,AI的“財商”有多高?  閱讀提示  隨著國產AI大模型爆火,財富管理方式迎來變革,“理財問AI”成了投資者追尋財富的...

    時間:03-03
  • 20余家泰國旅行商考察壯鄉旅游資源 冀深化文旅合作

      中新社南寧3月2日電 (張廣權)泰國旅行商廣西踩線活動暨2025廣西旅游年產品對接會2日在南寧舉行?! ∵B日來,來自泰國的20多家旅行社以及網紅博主深入壯鄉考察,親身探尋體驗廣西旅游資源?!  皬V西各地旅游資源豐...

    時間:03-02
免責聲明:本網對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。 本網站轉載圖片、文字之類版權申明,本網站無法鑒別所上傳圖片或文字的知識版權,如果侵犯,請及時通知我們,本網站將在第一時間及時刪除。
主站蜘蛛池模板: 一级一级人与动毛片| 国产精品亚洲片在线| 亲密爱人之无限诱惑| 蜜桃成熟时2005| 天天躁夜夜躁狠狠躁2021a| 久久午夜无码鲁丝片| 男人都懂的网址在线看片| 国产男人午夜视频在线观看| 中文字幕亚洲一区二区三区| 欧美精品18videosex性欧美| 国产午夜av秒播在线观看 | 免费观看a级毛片| 777四色米奇欧美影院| 性XXXXBBBBXXXXX国产| 久久中文字幕2021精品| 欧美视频免费一区二区三区| 国产午夜影视大全免费观看| 福利视频导航大全| 成人精品一区二区三区中文字幕 | 97sese电影| 日韩avdvd| 亚洲狠狠色丁香婷婷综合| 韩国护士hd高清xxxx| 国产精品一区二区四区| 两个人看的www在线视频| 欧美大BBBBBBBBBBBB| 亚洲综合国产一区二区三区 | 亚洲AV无码国产精品色| 精品成在人线av无码免费看| 国产区视频在线| 国产亚洲欧美在在线人成| 少妇挑战三个黑人惨叫4p国语| 亚洲啪啪AV无码片| 综合图区亚洲欧美另类小说| 国产精品日本亚洲777| 两只大乳奶充满奶汁| 日日噜噜噜夜夜爽爽狠狠视频| 免费看男阳茎进女阳道动态图| 91高清完整版在线观看| 女的扒开尿口让男人桶| 一本色道无码道dvd在线观看|