當前位置: 華文問答 > 健康

理想醫療演算法的六大特征

2022-01-28健康

編輯/綠蘿

臨床醫生越來越多地借助演算法工具做出重要的醫療保健決策,這些工具利用大量復雜數據,其程度遠遠超過人類思維的推理能力。例如,研究人員開發了演算法,可以從以前患者的大量數據中學習,以預測新患者在手術後出現並行癥的風險。

然而,雖然現有的指導方針已到位,確保以清晰、標準化的方式向醫療保健界報告此類演算法,但仍缺乏評估這些演算法的框架。

佛羅裏達大學的研究人員提出了一個理想演算法的框架,包括 6 個要求:可解釋、動態、精確、自主、公平糊可重復性。並提出了一個理想的演算法清單並將其套用於高參照演算法。

該評論文章以「 Ideal algorithms in healthcare: Explainable, dynamic, precise, autonomous, fair, and reproducible 」為題,於 2022 年 1 月 18 日釋出在【 PLOS Digital Health 】上。

為了最大限度地發揮其優勢,演算法必須包括 6 個要求:

  1. 可解釋:能夠闡明患者的各種特征,及其醫療狀況在確定結果時的相對重要性,而不會混淆因果關系;
  2. 動態:能夠根據患者特征的即時變化調整預測;
  3. 精確:能夠充分利用以足夠高的分辨率收集的數據,以可靠地捕捉患者不斷變化的狀況;
  4. 自主:能夠以最少的人工輸入學習和返回結果;
  5. 公平:能夠解釋任何隱含的偏見和社會不平等;
  6. 可重復性:能夠與研究界廣泛共享以進行驗證。

醫療保健中的理想演算法具有 6 個理想特征:可解釋、動態、精確、自主、公平糊可重現。

醫療保健中理想演算法的清單。

理想演算法是可解釋的

可解釋的演算法傳達了特征在確定輸出中的相對重要性。知情的患者、勤奮的臨床醫生和嚴謹的調查人員想知道演算法預測是如何做出的。這裏建議使用預測性、描述性、相關性 (PDR) 框架來實作最佳可解釋性。

演算法的預測準確性通常被大多數臨床醫生和科學家描述和輕松解釋。然而,預測準確性的一個被低估的方面可能會影響模型輸出的可解釋性:在某些情況下,預測誤差因類別而異。

檢查相關性可以解決預測和描述準確性之間的權衡。PDR 是一個簡單而有效的框架,用於評估和討論所有使用者特定的機器學習解釋,而不會混淆可解釋性和因果關系。

理想的演算法是動態的

動態演算法透過時間序列或序列建模捕捉生理訊號和臨床事件的時間變化。當演算法旨在改進臨床試驗設計、統計調整或患者登記策略時,單個時間點的靜態預測就足夠了。當演算法旨在隨著條件的發展而增強即時的臨床決策時,演算法應在新數據可用時使用新數據進行動態預測。

在對快速變化的條件進行建模時,演算法動態性尤其重要。這些模型可能對研究目的、早期預測和早期資源使用決策有用,但它們不能執行隨著新數據可用而更新預測的關鍵功能。

動態演算法在評估隨時間變化的效能和可解釋性方面面臨挑戰。在某些情況下,演算法學會預測臨床醫生下一步將采取的行動,而不是生理事件。此外,當以連續或幾乎連續的方式進行預測時,沒有評估模型效能的標準。在這裏,建議在幾個預定的離散時間點評估標準模型效能指標。

在動態演算法中使用時間序列測量與理想演算法的下一個要求有關:精度。

理想的演算法是精確的

精確演算法使用與生理變化率成比例的數據收集率和復雜性與目標結果相匹配的機器學習技術。精度很重要,因為人類疾病是復雜且非線性的。簡單的加法模型通常表現出較差的預測效能。

在許多醫療保健環境中,出於臨床目的,通常會從多個來源定期記錄高度精細的數據。例如,危重患者的臨床監測通常不僅包括生命體征和實驗室測量,還包括對精神狀態、疼痛、呼吸力學和活動能力的評估。

相反,當演算法的輸入相對於其套用而言過多時,由於過度擬合,通用性會受到影響。最佳方法透過使用維持高效能所需的最少變量來平衡預測準確性和輸入復雜性。這可以透過稀疏回歸方法來完成。生成簡約模型雖然有可能損害預測效能,但具有提高輸入特征描述準確性的額外優勢。

理想演算法是自主的

自主演算法以最少的人工輸入執行。除了所有無監督機器學習演算法共享的訓練和測試自主權之外,醫療保健中的自主演算法可以在使用者最少的輸入的情況下實作。

對於許多輸入特征與結果具有復雜關聯的臨床場景,自主演算法具有增強決策制定的巨大潛力。預測手術後並行癥的風險就是其中之一。

自主的潛在優勢也適用於演算法訓練。監督機器學習演算法使用由人類標記的訓練數據,然後對新的、未見過的數據進行分類或預測;在無監督學習中,演算法根據輸入數據的結構和分布生成自己的標簽,發現模式和關聯。深度學習模型透過從原始數據中自主學習特征表示來避免耗時的手工特征工程。除了效率和實用主義之外,自主學習還具有效能優勢,正如遊戲行業所證明的那樣。

理想的演算法是公平的

公平演算法評估和減輕隱性偏見和社會不平等。從理論上講,演算法利用數學公式和函數來產生客觀的結果,從而防止主觀因素帶來的偏見和不公平。在實踐中,許多演算法都在有偏差的源數據上進行訓練並產生有偏差的輸出。在醫療保健領域,單中心源數據可能不成比例地代表某些人口統計數據。

透過對人口統計和社會經濟變量進行評估校準,可以評估演算法偏差。如果觀察到的結果與演算法預測的男性而不是女性的概率相匹配,則該演算法表現出對女性的偏見。

已經描述了促進演算法公平性的其他幾種方法。應該隨著時間的推移重新評估模型,以確定研究人群、醫療保健系統和醫療實踐的時間變化是否影響了特征和結果之間的關系。這種現象,概念漂移,透過幾種機制破壞演算法效能,包括演算法偏差。

理想演算法是可重現的

可重現的演算法經過外部和前瞻性驗證,並與學術界共享。可重復性是任何科學探究的關鍵要素,對於機器學習演算法尤其重要,因為它建立了可信度和可信度。在成功實施臨床之前,「黑匣子」演算法必須贏得患者、臨床醫生和研究人員的信任。

演算法可重復性存在幾個主要障礙。著名的 EHR 平台並不是為了適應跨機構和平台的演算法可伸縮性而設計的。這產生了一個「分析瓶頸」,研究人員必須在機構孤島內處理、協調和驗證大量數據。許多研究人員不具備在如此大的計算規模下工作的必要資源,更不用說跟蹤哪些數據用於不同的研究並評估數據重用對統計偏差的影響。此外,用於在擁有自己的演算法管道和工具的研究組之間共享多個大型醫療保健數據儲存庫的雲資源有限。

聯合學習提供了透過協作機器學習確保演算法的外部有效性、通用性和可重復性的機會,而無需數據共享。

理想演算法框架在醫療保健領域的套用

為了確定醫療保健演算法的突出範例,在這裏,回顧了醫學 AI 中參照率最高的 20 篇文章,這些文章在 Nadri 及其同事的文獻計量分析中確定。在這 20 篇文章中,有 8 篇描述了一種演算法。所有 8 種演算法都符合精度標準,其中 6 種演算法是自主的,5 種是公平的,4 種是可解釋的,3 種是可重復的。動態性不適用於任何演算法。這些發現為提高醫療保健演算法的自主性、公平性、可解釋性和可重復性提供了機會。

高度參照的人工智能演算法根據其可解釋性、動態性、精確性、自主性、公平性和可重復性進行分級。

結論

雖然人類疾病的廣度和復雜性損害了假設演繹推理和啟發式決策的有效性,但機器學習應用程式可以相對輕松地解析高復雜性和大容量數據。已建立的指南描述了報告演算法醫療保健應用程式的最低要求;描述理想演算法的最大潛力同樣重要。研究人員建議理想演算法有 6 個需求,在此處提供的清單中表示:可解釋、動態、精確、自主、公平糊可重復性。透過實作這些目標,醫療保健演算法可以為患者、臨床醫生和研究人員帶來最大的潛在利益。

論文連結:https:// doi.org/10.1371/journal .pdig.0000006

相關報道:https://www. eurekalert.org/news-rel eases/939799