|
剛剛,AI醫械注冊審查指導原則發布(附全文)时间:2022-03-10 【转载】 阅读 來源:國.家藥監局器審中心 剛剛,國.家藥監局器審中心發布《人工智能注冊審查指導原則》,全文如下: 人工智能醫療器械注冊審查指導原則 本指導原則旨在指導注冊申請人建立人工智能醫療器械生存周期過程和準備人工智能醫療器械注冊申報資料,同時規范人工智能醫療器械的技術審評要求,為人工智能醫療器械、質量管理軟件的體系核查提供參考。 本指導原則是對人工智能醫療器械的一般要求。注冊申請人需根據產品特性和風險程度確定本指導原則具體內容的適用性,若不適用詳述理由。注冊申請人也可采用其他滿足法規要求的替代方法,但需提供詳盡的支持資料。 本指導原則是在現行法規、強制性標準體系以及當前科技能力、認知水平下制定的,隨著法規、強制性標準體系的不斷完善以及科技能力、認知水平的不斷發展,本指導原則相關內容也將適時調整。 本指導原則是供注冊申請人、審評人員和檢查人員使用的指導文件,不涉及行政審批事項,亦不作為法規強制執行,應在遵循相關法規的前提下使用本指導原則。 本指導原則作為數字醫療(Digital Health)指導原則體系的重要組成部分,采用和遵循醫療器械軟件、絡安.全、移動醫療器械、醫療器械人因設計、醫療器械獨立軟件生產質量現場檢查等相關指導原則的概念和要求。 本指導原則是人工智能醫療器械的通用指導原則,其他含有或涉及人工智能技術的醫療器械指導原則可在本指導原則基礎上結合具體情況進行有針對性的調整、修改和完善。 一、適用范圍 本指導原則適用于人工智能醫療器械的注冊申報,包括第二類、第三類人工智能獨立軟件和含有人工智能軟件組件的醫療器械(包括體外診斷醫療器械);適用于自研軟件的注冊申報,現成軟件組件參照執行,不適用于外部軟件環境。 本指導原則也可用作人工智能醫療器械的體系核查參考。質量管理軟件若采用人工智能技術實現其功能或用途,亦可參考本指導原則的適用要求。 二、主要概念 (一)人工智能醫療器械 本指導原則所述人工智能醫療器械是指基于“醫療器械數據”,采用人工智能技術實現其預期用途(即醫療用途)的醫療器械。 醫療器械數據是指醫療器械產生的用于醫療用途的客觀數據,如設備產生的醫學圖像數據(如X射線、CT、MRI、超聲、、光學等圖像)、醫用電子設備產生的生理參數數據(如心電、腦電、血壓、無創血糖、心音等波形數據)、體外診斷設備產生的體外診斷數據(如病理圖像、顯微圖像、有創血糖波形數據等);在特殊情形下,通用設備(非監管對象)產生的用于醫療用途的客觀數據亦屬于醫療器械數據,如數碼相機拍攝的用于皮膚疾病診斷的皮膚照片、健康電子產品采集的用于心臟疾病預警的心電數據等。基于醫療器械數據包括醫療器械數據的生成、使用等情況,其中使用情況含單獨使用醫療器械數據,或者以醫療器械數據為主聯合使用非醫療器械數據(如患者主訴信息、檢驗檢查報告結論、電子病歷、醫學文獻等)。 人工智能是指機器表現出與人類智能相關行為的能力,通常是指通過感知周圍環境做出合理行動以達到預期目標的計算機軟件或系統。機器學習是指與人類學習行為相關的人工智能,通常是指通過整理現有數據和/或獲取新數據以提升性能的計算機軟件或系統。機器學習雖是人工智能的子集,但卻為人工智能的核心領域,當前二者對于醫療器械而言含義基本相同,故本指導原則從醫療器械安.全有效性評價角度出發對二者不做嚴格區分,統一采用人工智能進行表述。 基于非醫療器械數據的醫學人工智能產品,或者采用人工智能技術實現非醫療用途和非醫療器械功能(詳見醫療器械軟件指導原則)的醫療器械均非人工智能醫療器械。醫學人工智能產品是否按醫療器械管理,根據相應分類界定指導原則進行判定,必要時申請醫療器械分類界定。 (二)人工智能醫療器械類型 從醫療器械軟件角度,人工智能醫療器械可分為人工智能獨立軟件和人工智能軟件組件,故其類型劃分可參考醫療器械軟件指導原則相關維度。 人工智能醫療器械從用途角度可分為輔助決策類和非輔助決策類。其中,輔助決策是指通過提供診療活動建議輔助用戶(如醫務人員、患者)進行醫療決策,如通過病灶特征識別、病灶性質判定、用藥指導、治療計劃制定進行輔助分診、輔助檢測、輔助診斷、輔助治療等,相當于用戶的“助手”。反之,僅提供醫療參考信息而不進行醫療決策即為非輔助決策,包括流程優化、診療驅動,前者如成像流程簡化、診療流程簡化等,后者如成像質量改善、成像速度提高、自動測量、自動分割、三維重建等,相當于用戶的“工具”。此外,輔助決策和非輔助決策從實時性角度均可細分為實時和非實時,前者風險通常高于后者。 人工智能醫療器械從功能角度大體上可分為處理功能、控制功能、安.全功能。其中,處理功能又可分為前處理功能和后處理功能,前處理功能是指采集人體解剖、生理信息生成醫療器械數據過程的處理功能,如成像流程簡化、成像質量改善、成像速度提高等;后處理功能是指利用醫療器械數據生成診療信息或進行醫療干預過程的處理功能,如診療流程簡化、自動測量、自動分割、三維重建、病灶特征識別、病灶性質判定、用藥指導、治療計劃制定等。控制功能是指控制/驅動醫療器械硬件運行的功能,如閉環控制、機械臂運動控制等。安.全功能是指保證醫療器械安.全性的功能,如風險預警、急停控制等。 人工智能醫療器械從算法角度具有多種類型劃分維度。從學習策略角度可分為有監督學習和無監督學習,前者需要對訓練數據進行標注,如線性回歸、邏輯回歸、決策樹、樸素貝葉斯、K近鄰、支持向量機等經典回歸、分類算法,后者無需對訓練數據進行標注,如K均值、主成分分析等經典聚類、降維算法,前者對于數據標注的要求高于后者。從學習方法角度可分為基于模型的算法和基于數據的算法,前者采用統計模型、規則推理等方法,后者主要采用大數據方法,前者對于訓練數據量的要求低于后者。從可解釋性角度可分為白盒算法和黑盒算法,前者特征提取需要人為干預,可與現有醫學知識建立關聯,后者自動完成特征提取,難與現有醫學知識建立關聯,前者可解釋性優于后者。 上述類型劃分維度相互交叉,例如:前處理和后處理均可采用不同類型的人工智能算法實現輔助決策、非輔助決策用途,有監督學習和無監督學習既可采用基于模型的算法、基于數據的算法,又可采用黑盒算法、白盒算法。同時,同一維度亦不存在嚴格的劃分界線,例如:在用途方面,通過圖像識別技術進行流程優化則需考慮診療驅動相關要求,自動測量結果若為醫療決策重要指標(如血流儲備分數FFR)則屬于輔助決策范疇;在功能方面,控制功能、安.全功能可與處理功能相結合,前處理過程可包含后處理功能;在算法方面,某些算法既可用于有監督學習又可用于無監督學習,有監督學習和無監督學習可結合為半監督學習;基于模型的算法亦需數據的支持,基于數據的算法亦可生成模型;白盒算法和黑盒算法可組合使用成為灰盒算法。 同樣,人工智能醫療器械從成熟度角度可分為成熟和全新兩種類型,其中成熟是指安.全有效性已在醫療實踐中得到充分證實的情形,全新是指未上市或安.全有效性尚未在醫療實踐中得到充分證實的情形。人工智能醫療器械的算法、功能、用途若有一項為全新則屬于全新類型,反之屬于成熟類型。 人工智能醫療器械可同時采用多種、多個人工智能算法,在前處理、后處理過程中實現輔助決策、非輔助決策用途。因此,注冊申請人需結合人工智能醫療器械的預期用途、使用場景、核心功能以及所用算法的類型特點、技術特征、組合形式開展相應產品質控工作,以保證產品的安.全有效性。 (三)人工智能算法更新 人工智能算法特別是基于數據的算法,具有快速迭代更新的特性。人工智能算法更新屬于軟件更新范疇,故遵循軟件更新的基本原則及要求:人工智能算法更新若影響到人工智能醫療器械的安.全性或有效性則屬于重大軟件更新,應申請變更注冊;反之,人工智能算法更新若未影響到人工智能醫療器械的安.全性和有效性則屬于輕微軟件更新,通過質量管理體系進行控制,無需申請變更注冊,待下次變更注冊時提交相應注冊申報資料。 人工智能算法更新可分為算法驅動型更新和數據驅動型更新。其中,算法驅動型更新是指人工智能醫療器械所用算法、算法結構、算法流程、算法編程框架(詳見后文)、輸入輸出數據類型等發生改變,通常屬于重大軟件更新。此外,算法重新訓練即棄用原有訓練數據而采用全新訓練數據進行算法訓練,亦屬于算法驅動型更新。 數據驅動型更新是指僅由訓練數據量增加而發生的算法更新。數據驅動型更新是否屬于重大軟件更新原則上以算法性能評估結果(基于相同的測試集和算法性能評估指標)為準,算法性能評估結果若發生顯著性改變則屬于重大軟件更新,即算法性能評估結果與前次注冊(而非前次更新)相比存在統計學差異,反之屬于輕微軟件更新。 人工智能醫療器械其他類型的算法更新、軟件更新以及重大軟件更新判定原則詳見醫療器械軟件指導原則、醫療器械網絡安.全指導原則。 軟件版本命名規則原則上應涵蓋算法驅動型更新和數據驅動型更新,明確并區分重大軟件更新和輕微軟件更新,其中重大軟件更新列舉常見典型情況。軟件版本命名規則的基本要求詳見醫療器械軟件指導原則、醫療器械網絡安.全指導原則。 三、基本原則 (一)基于算法特性 人工智能技術從發展驅動要素角度是基于模型/數據和算力的算法,其中模型/數據是人工智能技術的基礎,算力是人工智能技術的保證,算法是人工智能技術的核心。 由于算力所用計算資源本身不屬于監管對象,計算資源的監管要求取決于其所屬的計算平臺類型。故從監管角度出發,人工智能醫療器械安.全有效性評價基于其預期用途、使用場景、核心功能,以算法特性為核心重點關注其泛化能力,以模型/數據為基礎重點關注其質控情況,同時從風險管理角度兼顧算力不足與失效的影響。 人工智能算法的類型不同,其算法特性、適用場景也不同,評價重點亦有所側重;同時,不同類型的人工智能算法可組合使用,需結合各算法特性和算法組合形式進行整體評價。因此,注冊申請人需結合人工智能醫療器械的預期用途、使用場景、核心功能選擇與之相適宜的人工智能算法或算法組合,基于算法特性并結合風險管理開展相應驗證與確認工作。 以深度學習為例,其是指通過訓練具有多個隱層的神經網絡而獲得輸入輸出映射關系的人工智能算法,亦是基于海量數據和高算力的黑盒算法,既可用于有監督學習又可用于無監督學習。因此,對于采用深度學習技術的人工智能醫療器械,基于其預期用途、使用場景、核心功能,重點關注其算法泛化能力、數據質控、可解釋性等問題,同時,深度學習若與其他類型的人工智能算法組合使用,還需基于各算法特性重點關注算法組合的整體評價問題。 人工智能新算法研究處于深入發展階段,如基于小樣本數據、基于弱標注數據、基于非結構化數據、黑盒算法透明化等算法。人工智能醫療器械若使用人工智能新算法,亦需基于算法特性并結合風險管理開展相應驗證與確認工作,以保證產品的安.全有效性。 (二)風險導向 人工智能醫療器械的風險水平亦可用軟件安.全性級別進行表述,軟件安.全性級別越高,其生存周期質控要求越嚴格,注冊申報資料越詳盡,同時由于全新類型的潛在未知風險多于成熟類型,故需結合成熟度予以綜合考慮,具體要求詳見醫療器械軟件指導原則。 人工智能醫療器械的軟件安.全性級別可基于產品的預期用途、使用場景、核心功能進行綜合判定,其中預期用途主要考慮用途類型、重要程度、緊迫程度等因素,使用場景主要考慮使用場合、疾病特征、適用人群、目標用戶等因素,核心功能主要考慮功能類型、核心算法、輸入輸出、接口等因素。亦可根據風險管理所確定的風險等級進行判定,軟件安.全性級別與風險等級的分級可以不同,但二者存在對應關系,因此可根據風險等級來判定軟件安.全性級別,但應在采取風險控制措施之前進行判定。 人工智能醫療器械的主要風險從算法角度包括過擬合和欠擬合,其中過擬合是指算法對于訓練數據過度學習而將非普遍規律作為重要特征,欠擬合是算法對于訓練數據學習不充分而遺漏重要特征,均會降低算法泛化能力。從用途角度,輔助決策主要包括假陰性和假陽性,其中假陰性即漏診,可能導致后續診療活動延誤,特別是要考慮快速進展疾病的診療活動延誤風險,而假陽性即誤診,可能導致后續不必要的診療活動;非輔助決策從算法設計目標能否得以實現角度,亦可參考輔助決策分為假陰性和假陽性。此外,進口人工智能醫療器械還需考慮中外差異風險,如人種、流行病學特征、臨床診療規范等差異。 注冊申請人應結合人工智能醫療器械的預期用途、使用場景、核心功能開展風險管理活動,采取風險控制措施將風險降至可接受水平,并貫穿于人工智能醫療器械全生命周期過程。 (三)全生命周期質控 注冊申請人應結合質量管理體系要求,參考軟件、人工智能相關標準和良好工程實踐,建立人工智能醫療器械生存周期過程,開展與軟件安.全性級別相匹配的產品質量保證工作,將風險管理、可追溯分析貫穿于生存周期全程,形成記錄以供體系核查。 上市前開展充分、適宜、有效的驗證與確認活動,保證算法泛化能力滿足用戶需求,識別可預見風險并將其降至可接受水平,明確產品使用限制(含技術限制,下同)和必要警示提示信息。上市后持續開展算法泛化能力研究,同時結合用戶投訴、不良事件和召回等情況識別前期未預見的風險,并采取有效的風險控制措施將風險降至可接受水平。此外,根據產品更新需求,經評估后實施更新活動,開展與之相適宜的驗證與確認活動,保證算法泛化能力持續滿足用戶需求。 四、人工智能醫療器械生存周期過程 人工智能醫療器械生存周期(又稱生命周期)過程可基于軟件生存周期過程予以建立,具體要求詳見醫療器械獨立軟件生產質量管理規范及其現場檢查指導原則。 考慮到有監督深度學習是當前人工智能醫療器械的主流算法,故本指導原則以有監督深度學習為例詳述人工智能醫療器械生存周期過程質控要求,主要包括需求分析、數據收集、算法設計、驗證與確認、更新控制等階段。其他類型的人工智能算法可參照執行,不適用內容詳述理由并予以記錄。 (一)需求分析 需求分析以用戶需求與風險為導向,結合產品的預期用途、使用場景、核心功能,綜合考慮法規、標準、用戶、產品、數據、功能、性能、接口、用戶界面、網絡安.全、警示提示等需求,重點考慮數據收集、算法性能、使用限制等要求。 為保證數據質量和控制數據偏倚,數據收集需考慮數據來源的合規性、充分性和多樣性,數據分布的科學性和合理性,數據質控的充分性、有效性和準確性。數據來源在合規性(如個人信息保護法)基礎上保證充分性和多樣性,以提高算法泛化能力,例如:根據產品的預期用途和使用場景盡可能多采集數據,如來源于多家、多地域、多層級的代表性臨床機構,以及多家、多種、多參數的代表性采集設備。數據分布的科學性和合理性需結合目標疾病流行病學特征予以考慮,包括但不限于疾病構成(如分型、分級、分期)、人群分布(如健康、患者,性別、年齡、職業、地域、生活方式)、統計指標(如發病率、患病率、**、死亡率、生存率)等情況,以及目標疾病并發癥與類似疾病的影響情況。數據質控的充分性、有效性和準確性需結合數據采集與數據標注的人員、設備、過程等影響因素予以考慮,具體要求詳見后文。 算法性能需結合醫療實際和產品定位,綜合考慮假陰性與假陽性、重復性與再現性、魯棒性/健壯性、實時性等性能指標的適用性及其要求,兼顧不同性能指標的制約關系,如假陰性與假陽性等。同時,結合當前醫療水平情況,考慮金標準或參考標準的確定依據、實現方法和質控要求,以保證算法性能評估的準確性,必要時納入數據收集過程。 使用限制需考慮產品禁用、慎用等場景,準確表述產品使用場景,提供必要警示提示信息。 (二)數據收集 數據收集基于合規性要求,主要考慮數據采集、數據整理、數據標注、數據集構建等活動的質控要求,以保證數據質量和算法訓練效果。 1.數據采集 數據采集需考慮采集設備、采集過程、數據脫敏等質控要求,并建立數據采集操作規范。數據采集亦可使用歷史數據,需結合樣本規模、采集難度等影響因素合理選擇數據采集方式。若適用,數據采集需經倫理委員會批準。 采集設備質控包括采集設備的兼容性和采集特征等要求。兼容性基于數據生成方式(直接生成、間接生成)考慮采集設備的兼容性要求,如采集設備的名稱、型號規格、制造商、性能指標等要求,若無需考慮兼容性要求詳述理由并予以記錄。采集特征考慮采集設備的采集方式(如常規成像、增強成像)、采集協議(如MRI成像序列)、采集參數(如CT加載電壓、加載電流、加載時間、層厚)、采集精度(如分辨率、采樣率)等要求。 采集過程質控包括人員管理、采集流程、采集質量評估等要求。人員管理考慮采集人員、審核人員的選拔(如職稱、工作年限、工作經驗、所在機構,若有國外人員則需明確其資質要求)、培訓(如培訓材料、培訓方案)、考核(如方法、頻次、指標、通過準則、一致性)等要求。采集流程考慮人員職責、采集步驟、結果審核等要求。采集質量評估考慮評估人員、評估方法、評估指標、通過準則等要求,并記錄評估結果。 數據采集若使用歷史數據,需列明采集設備及采集特征要求,并開展數據采集質量評估工作。 采集的數據應進行數據脫敏以保護患者隱私,數據脫敏需明確脫敏的類型(靜態、動態)、規則、方法以及脫敏內容的確定依據。 脫敏數據匯總形成原始數據庫,不同模態的數據在原始數據庫中需加以區分(下同)。原始數據庫需考慮樣本規模的充分性、樣本多樣性等問題。 2.數據整理 數據整理基于原始數據庫考慮數據清洗、數據預處理的質控要求。數據清洗需明確清洗的規則、方法、結果,數據預處理需明確處理的方法(如濾波、增強、重采樣、尺寸裁剪、均一化等)、結果。數據整理所用軟件工具(含腳本,下同)均需明確名稱、型號規格、完整版本、制造商、運行環境,并進行軟件確認。 數據經整理后形成基礎數據庫,需明確樣本類型、樣本量、樣本分布等信息。樣本類型以適用人群為單位可分為單一數據、數據序列(由多個單一數據組成,如結構序列、功能序列、時間序列)。樣本量需考慮樣本規模的充分性,明確樣本總量及其確定依據。樣本分布需考慮樣本的科學性和合理性,依據適用人群、數據來源機構、采集設備、樣本類型等因素明確疾病構成的數據分布情況。 3.數據標注 數據標注作為有監督學習數據質控的關鍵環節,需建立數據標注操作規范,明確標注資源管理、標注過程質控、標注質量評估等要求。 標注資源管理包括人員管理和基礎設施管理。人員管理考慮標注人員、審核人員和仲裁人員的選拔(如職稱、工作年限、工作經驗、所在機構,若有國外人員則需明確其資質要求)、培訓(如培訓材料、培訓方案)、考核(如方法、頻次、指標、通過準則、一致性)等要求。基礎設施管理考慮標注場所(真實場所或模擬場所,模擬場所可根據產品實際情況調整模擬程度,詳述調整理由并予以記錄)、標注環境條件(如空間、照明、溫度、濕度、氣壓)、標注軟件(名稱、型號規格、完整版本、制造商、運行環境、軟件確認)等要求。 標注過程質控包括人員職責(如人員資質、人員數量、職責分工)、標注規則(如臨床指南、專家共識、專家評議、文獻分析)、標注流程(如標注對象、標注形式、標注輪次、標注步驟、結果審核)、分歧處理(如仲裁人員、仲裁方式)、可追溯性(如數據、操作)等要求。 標注質量評估包括評估人員、評估方法、評估指標、通過準則等要求,并記錄評估結果。 數據經標注后形成標注數據庫,樣本類型可分為數據塊(如圖像區域、數據片段)、單一數據(由多個數據塊組成)、數據序列(由多個單一數據組成)。標注數據庫的樣本量、樣本分布等要求及風險考量與基礎數據庫相同。 數據標注可使用自動標注軟件,但自動標注結果不得直接使用,應由標注人員審核后方可使用;同時,自動標注軟件亦需明確名稱、型號規格、完整版本、制造商、運行環境等信息,并進行軟件確認。 4.數據集構建 基于標注數據庫構建訓練集(用于算法訓練)、調優集(若有,用于算法超參數調優)、測試集(用于算法性能評估),明確訓練集、調優集、測試集的劃分方法、劃分依據、數據分配比例。訓練集原則上需保證樣本分布具有均衡性,測試集、調優集原則上需保證樣本分布符合真實情況,訓練集、調優集、測試集的樣本應兩兩無交集并通過查重予以驗證。 為解決樣本分布不滿足預期的問題,可對訓練集、調優集小樣本量數據進行擴增,原則上不得對測試集進行數據擴增,對抗測試(詳見后文)除外。數據擴增需明確擴增的對象、范圍、方式(離線、在線)、方法(如翻轉、旋轉、鏡像、平移、縮放、濾波、生成對抗網絡等)、倍數,在線擴增亦需予以記錄,擴增需考慮數據偏倚的影響及風險,如部分數據擴增倍數過大、數據擴增倍數不均衡等。若采用生成對抗網絡(詳見后文)進行數據擴增,需明確算法基本信息以及算法選用依據。 數據經擴增后形成擴增數據庫,需列表對比擴增數據庫與標注數據庫在樣本量、樣本分布(注明擴增倍數)等差異,以證實擴增數據庫樣本量的充分性以及樣本分布的合理性。 (三)算法設計 人工智能算法作為人工智能醫療器械的核心,其設計主要考慮算法選擇、算法訓練、算法性能評估等要求。對于黑盒算法,算法設計應開展算法性能影響因素分析,同時建議與現有醫學知識建立關聯,以提升算法可解釋性。 1.算法選擇 算法選擇提供所用算法的名稱、類型(如有監督學習、無監督學習,基于模型、基于數據,白盒、黑盒)、結構(如層數、參數規模)、輸入輸出數據類型、流程圖、算法編程框架、運行環境等基本信息,并明確算法選用依據,包括選用的理由和基本原則。 若組合使用集成學習、遷移學習、強化學習等,亦需提供算法基本信息以及算法選用依據。 2.算法訓練 算法訓練需基于訓練集、調優集進行訓練和調優,考慮評估指標、訓練方式、訓練目標、調優方式、訓練數據量-評估指標曲線等要求。 評估指標建議根據用戶需求進行選擇,輔助決策可選擇敏感性、特異性等指標,非輔助決策可選擇圖像質量、測量準確性等指標。訓練方式包括但不限于留出法和交叉驗證法,若組合使用聯邦學習亦需明確算法選用依據,并提供算法基本信息。訓練目標根據醫療情況詳述目標確定依據,提供受試者工作特征(ROC)曲線或其衍生曲線、混淆矩陣及其衍生參數等證據予以證實。調優方式明確優化策略和實現方法。訓練數據量-評估指標曲線用于證實算法訓練的充分性和有效性,若無法提供則需詳述理由并提供替代證據。 3.算法性能評估 算法性能評估作為軟件驗證的重要組成部分,需基于測試集對算法設計結果進行評估,綜合考慮假陰性與假陽性、重復性與再現性、魯棒性/健壯性、實時性等適用評估要求,以證實算法性能滿足算法設計目標,并作為軟件驗證、軟件確認的基礎。亦可基于第三方數據庫開展算法性能評估。 同時,開展算法性能影響因素分析以提升算法可解釋性,詳述影響算法性能的主要因素及其影響程度,如采集設備、采集參數、疾病構成、病變特征等因素,基于分析結果明確產品使用限制和必要警示提示信息。 此外,根據產品實際情況開展壓力測試、對抗測試等測試,以全面深入評估算法性能。 (四)驗證與確認 1.軟件驗證 軟件驗證是指通過提供客觀證據認定軟件開發、軟件更新某一階段的輸出滿足輸入要求,包括軟件驗證測試(單元測試、集成測試、系統測試)、設計評審等系列活動。 軟件驗證基于軟件需求予以開展,保證軟件的安.全有效性,并作為軟件確認的基礎。 2.軟件確認 軟件確認是指通過提供客觀證據認定軟件滿足用戶需求和預期目的,包括軟件確認測試(用戶測試)、臨床評價、設計評審等系列活動。根據產品實際情況,軟件確認方式可單一使用,亦可組合使用。 軟件確認測試基于用戶需求,由預期用戶在真實或模擬使用場景下予以開展,亦可基于測評數據庫(詳見后文)予以開展。 臨床評價基本原則詳見醫療器械軟件指導原則,基于核心功能或核心算法,結合預期用途和成熟度予以綜合考慮:非輔助決策類功能基于核心功能開展同品種醫療器械比對,全新的功能、算法和用途原則上均需開展臨床評價;輔助決策類功能基于核心算法開展同品種醫療器械比對,所選同品種醫療器械的臨床證據原則上需基于臨床試驗(含回顧性研究,下同),全新的功能、算法和用途原則上均需開展臨床試驗。具體要求詳見醫療器械臨床評價等通用指導原則,以及人工智能醫療器械臨床評價等專用指導原則。 同時,開展算法性能比較分析,若各類測試場景(含臨床評價)算法性能變異度較大,詳述原因并基于分析結果明確產品使用限制和必要警示提示信息。 **后,結合算法訓練、算法性能評估、臨床評價等結果開展算法性能綜合評價,針對訓練樣本量和測試樣本量過少、測試結果明顯低于算法設計目標、算法性能變異度過大等情況,對產品的適用范圍、使用場景、核心功能進行必要限制。 (五)更新控制 人工智能醫療器械若發生算法更新、軟件更新,均應當按照質量管理體系的要求,開展與算法更新、軟件更新的類型、內容和程度相適宜的驗證與確認活動,將風險管理、可追溯分析貫穿于更新全程,形成記錄以供體系核查。 對于算法更新,無論算法驅動型更新還是數據驅動型更新,均應開展相應驗證與確認活動,如算法性能評估、臨床評價等,以保證算法更新的安.全有效性。對于軟件更新,具體要求詳見醫療器械軟件指導原則、醫療器械獨立軟件生產質量現場檢查指導原則。 此外,算法更新、軟件更新均需考慮引入回滾機制,以保證醫療業務的連續性,特別是對風險較高的軟件。 總之,人工智能醫療器械所含的每個人工智能算法或算法組合,均需獨立開展需求分析、數據收集、算法設計、驗證與確認、更新控制等活動,同時考慮人工智能算法組合的整體評價要求,以保證產品的安.全有效性。 前期已開發的人工智能醫療器械若不滿足本指導原則的適用要求,應開展差距分析并予以記錄,明確產品使用限制和必要警示提示信息。必要時采取補救措施,以滿足質量管理體系要求,并保證產品的安.全有效性
編輯:小黃 |