Taiwan Society of Emergency Medicine
Taiwan Society of Emergency Medicine
|
本會期刊
台灣急診醫學通訊
第八卷第六期 點閱次數:155 PDF下載次數:2 急診醫學的增強智慧:在大型語言模型時代重塑醫師的決策角色
傅為剛1、劉博期1、林彥克2,3 1高雄醫學大學學士後醫學系 2高雄醫學大學附設中和紀念醫院 急診外科主任 3高雄醫學大學附設中和紀念醫院 外傷及重症外科主治醫師 前言 近年來,人工智慧(artificial intelligence, AI)技術迅速發展,逐漸成為全球科技研究與產業應用的焦點。自 2012 年卷積神經網路(convolutional neural network, CNN)在電腦視覺領域取得突破性進展以來,深度學習的演算法能力持續躍升,並在語言處理領域隨著大型語言模型(large language models, LLMs)的問世而變得更為成熟。這些技術已在多個產業帶來結構性改變,醫療領域亦不例外,甚至引發部分專家對於「醫師是否可能被取代」的討論。 2024 年,史丹佛大學 Jonathan H. Chen 醫師團隊發表一項引人注目的研究[1],探討 LLM 在臨床診斷推理中的表現。研究結果顯示,單獨使用 LLM 所獲得的診斷分數,竟高於醫師在 LLM 輔助下的表現,以及醫師依循傳統資源進行推理的結果,而醫師在 LLM 協助下的分數僅較使用傳統資源高出約兩個百分點。若僅看結論,確實容易令人憂心。然而,深入分析研究方法可發現:輸入 LLM 的臨床案例均是由醫師事先整理、結構化後的內容,因此該結果並不能直接推論 LLM 能在無人監督的情況下正確處理複雜、原始的臨床資訊。然而,這項研究揭示的真正重點並非「AI 將取代醫師」,而是未來醫療人員如何有效學習與掌握 LLM 的特性,並將其整合進臨床流程,以提升診斷效率、決策品質與醫療安全。換言之,LLM 的發展迫使醫師重新思考自身角色:從單純提供醫療知識轉變為善用數位工具、維持專業判斷、確保醫療品質的整合型臨床決策者。 內容 在當前的急診醫學環境中,醫療人力的長期短缺與病患就診量持續攀升已成為常態化的挑戰。急診醫師除需迅速處置各類急重症、穩定患者生命徵象外,亦必須面對患者與家屬因疾病不確定性所引發的高度焦慮情緒。除此之外,繁複且耗時的醫療文書作業亦大幅增加臨床負擔,進一步壓縮醫療人員可投入於直接照護的時間。在此背景下,研究者與臨床醫師開始探索大型語言模型於急診醫療流程中的應用,以期透過人工智慧工具降低行政負擔、優化臨床決策並提升整體醫療效率。 從幾篇回顧性的文獻可以總結出,沿著病人從症狀出現到離開急診的流程,AI 幾乎在每個環節都可扮演輔助角色[2-4]。症狀初起時,對話式系統可用自然語言與民眾互動,釐清主訴與危險徵象,協助判斷該自我觀察、門診追蹤、直接就醫或呼叫救護車;啟動緊急醫療服務後,自然語言模型能從 119 通話與救護紀錄中萃取關鍵資訊並評估重症風險,事先通知接收醫院。抵達急診時,機器學習模型結合主訴、生命徵象與既往紀錄,輔助緊急嚴重指數(emergency severity index, ESI)分級與預測住院、ICU 或惡化機率,提醒分診與醫師及早處置。醫師問診與身體檢查階段,LLM 可自動閱讀過去龐雜病歷並生成重點摘要,亦可把醫病對話轉寫為病歷草稿,減少文書時間。進入檢查與治療後,影像 AI 協助標示顱內出血、氣胸等急症影像,預測模型整合檢驗與臨床資料估算敗血症、再返急診與死亡風險,LLM 則整理鑑別診斷與相關指引,提供決策參考。在觀察與留院前,AI 依照病程變化發出惡化預警,並自動生成交班與轉入摘要;出院時,則可依病人語言與理解程度產生個人化衛教與警示症狀說明,出院後再透過簡訊或聊天機器人主動追蹤高風險個案。 儘管願景美好,文獻一致提醒急診醫師必須正視 AI 目前的多重侷限[2-4]。首先,目前多數工具仍停留在概念驗證或單一院所回溯分析的階段,缺乏經過多中心、前瞻性臨床試驗所支持的實證。再者,深度學習與 LLM 具有典型的「黑箱」特性,臨床醫師往往難以理解其建議背後的推論過程;更棘手的是,LLM 有時能以極為流暢的語言給出看似合理的說明,但內容卻可能摻雜錯誤資訊,甚至虛構檢查結果或文獻來源。此外,AI 模型高度仰賴訓練資料的品質與代表性,若某些族群(例如兒科病人、少數族裔或社經弱勢者)在資料中被低度呈現,模型表現即可能產生系統性偏差;電子病歷內若本身充斥錯誤或不完整紀錄,亦會導致「垃圾進、垃圾出(garbage in, garbage out)」的結果。最後,臨床亦需留意模型老化(model drift)現象:隨著疾病譜、診療準則或人口結構的改變,原本表現良好的模型可能逐漸失準,因此必須仰賴持續監測與動態更新。另外,有研究指出,從實務角度而言,若臨床醫師最終仍需花費相當時間逐條核對與修正 AI 產生的內容,工作重心只是從「輸入」轉為「校對」,總體時間與心力負擔未必真正減輕,甚至可能因對內容真偽的持續懷疑而進一步惡化[5]。 結語 面對這波科技浪潮,急診醫學界建議應將 AI 視為增強智慧(Augmented Intelligence),意即它應是醫師的副駕駛而非替代者。未來的急診醫師不需成為程式設計師,但必須具備AI 素養,了解模型的運作原理與極限,才能在臨床上安全地駕馭這項工具 。最終,AI 的成功整合需要臨床醫師積極參與開發與監管,確保Human-in-the-loop,讓科技在提升效率的同時,不犧牲醫療的人性與溫度 。 參考資料 1. Goh, E., et al., Large Language Model Influence on Diagnostic Reasoning: A Randomized Clinical Trial. JAMA Network Open, 2024. 7(10): p. e2440969–e2440969. 3. Preiksaitis, C., et al., The Role of Large Language Models in Transforming Emergency Medicine: Scoping Review. JMIR Med Inform, 2024. 12: p. e53787. |