慶祝商湯醫療完成過億元Pre-A輪融資。
作為國內AI龍頭商湯科技的副總裁、研究院副院長、商湯醫療CEO,張少霆在2018年加入商湯時,就是以“智慧健康負責人”的身份亮相的。
去年夏天,國內首個AI病理大模型PathOrchestra就出自商湯科技、西京醫院及清華大學的合作團隊,號稱“實現了全球最廣泛的臨床科研任務賦能,完成了人工智能病理研究領域從‘單模專病’到‘一模多病’的跨越式突破”。近日,國內通信技術龍頭華為參與發布“瑞智病理大模型RuiPath”,讓病理大模型再次受到公眾關注。
作為AI醫療大模型領域最具挑戰性的“明珠”,病理大模型為何讓龍頭頻頻駐足?近日,
商湯科技副總裁、研究院副院長、商湯醫療CEO張少霆
都知道DeepSeek,但什么是病理大模型?
與DeepSeek等通用大模型不同,病理大模型專注于解決病理科醫生面臨的臨床問題;但與宮頸癌篩查等專用模型也不同,病理大模型致力于解決多種臨床任務。資料顯示,PathOrchestra覆蓋肺、乳腺、肝臟、食管等20余種器官,賦能百余項臨床任務,是當時全球賦能臨床任務最廣的病理大模型。
AI病理診斷流程 所以,病理大模型并不是大家常說的“大模型”,它更接近傳統的預訓練模型,還不能像語言大模型一樣“大[*]四方”,還需要往下游任務深化。
病理大模型的優勢在于,它可以在長尾問題上減少對傳統數據收集和標注的需求,從而提高模型的訓練效率,更好地適配并解決子問題。
回過頭看,我們對病理領域的大模型研究是伴隨著技術范式的變化自然而然地發生的,經歷了三個階段。2018年起,專注于胃腸和宮頸TCT的單點應用;2021年起,與瑞金醫院合作將下游任務拓展到9種不同的疾病,在遷移學習方面取得了一定的成果;2023年起,開始嘗試訓練病理大模型,來覆蓋多達幾十種“長尾”疾病。
當下也還有很多病理切片需要醫生親自查看,例如腫瘤組織標本,需要根據病理切片進行十幾種不同疾病亞型的分類和判別。目前,將這類任務完全交給病理大模型還為時尚早,因為大模型目前只具備通用的“排兵布陣式”的陣法知識,缺少逐個擊破的作戰能力,如果每個亞型都存在一定出錯概率,十幾種亞型都同時正確的概率就低很多。
病理大模型不容易做,但能有效解決兩大問題
2023年是大模型技術突破之年,當年發布醫療大模型產品的醫療企業多達數十家,資本市場曾掀起一股AI醫療熱潮。但由于應用落地存在挑戰,這些醫療大模型在2024年的聲量明顯下降。如今,當以病理大模型為代表的專科大模型登場,它們面臨的挑戰似乎只多不少。
PathOrchestra是基于當時國內規模最大的數字病理圖像數據集訓練建立的,但僅僅數據量大是不夠的。如果我們回顧一下來自哈佛、微軟和斯坦福的那幾篇發表在雜志上的,就會發現數據的分布更為重要。例如,胃腸和宮頸TCT這兩個領域的數據量是巨大的,但是其中有多少是關于乳腺、肝臟等其他細分領域的數據?所以病理數字化程度越高、越廣泛,數據有足夠的覆蓋面,大模型才能均衡處理足夠多元的任務,而這是不容易平衡的。
而大模型能夠有效解決這兩個問題。在長尾問題上,大模型至少能提供比“沒有解決方案”更好的選擇;在泛化性上,大模型可以作為一個編碼器,提取病理圖像特征后再針對某個疾病的專項診斷模型進行優化,這種機制讓大模型能夠更好地總結病理數據的特征,從而具備更廣泛的疾病覆蓋能力。
不過,需要再次強調的是,病理大模型目前還無法像語言大模型那樣全面且直接地解決很多問題,更多是集中在科研領域。
醫院院長們怎么看待AI潮?
醫院是病理大模型等?颇P偷闹苯淤I方。在張少霆看來,公司去年參與的湖北省“‘小切片’守護大民生”工程,是病理AI模型落地的標志性事件。這場發生在湖北全省醫院的智慧化、數字化和AI化轉型,覆蓋了數百家基層醫院。這一事件也預示著,病理大模型落地應用似乎已經達到了突破的臨界點。
然而,醫院決策采購的核心考量之一是能否帶來增量收入。有時候說服決策層支持采購的難點在于,大多數AI醫療產品的賣點是幫助醫生更準確地診斷和節省時間,而不是直接為醫院帶來新增收入或快速回本,這也是之前AI醫療產品的推廣面臨困難的原因之一。
但從另一個角度看,通用大模型的醫療價值可能確實被夸大了。這些大模型的通用性能很強,在很多任務上實現了超出預期的效果,但幻覺問題也不可忽視。從某種角度來看,幻覺問題在通用領域或許并非壞事,因為模型可以像人一樣“編故事”,但在嚴肅領域,尤其是醫療領域,這可能是致命問題。
實際上,目前我們在上海瑞金醫院病理科應用于臨床、幫助醫生完成大量任務的還是商湯的專有模型,且效果已經經過了多年臨床驗證。
病理大模型的產業化還有多遠?
2023年,多個病理大模型的海外研究項目發表在及上,這表明,這一領域在學術界已經非;钴S,工業界也在進行一些嘗試。但需要澆一盆冷水的是,目前病理大模型的價值更多體現在學術界,而非產業界。
但是,病理大模型往往號稱能診斷幾十種疾病,這種復雜性很難在認證中被全面評估,很難通過NMPA或FDA的嚴格認證過程,所以產業化目前還是以病理專才模型為主。
另外,市場教育和生態鏈合作也是商業化的重要環節。目前,病理AI的普及程度還相對落后。病理科工作流相對復雜,其落地涉及到掃描儀廠家、AI廠家、存儲廠家等產業生態的聯動,更需要生態合作伙伴的精誠合作。例如在瑞金醫院,商湯主要負責AI研發,衡道病理負責部分信息化,華為主要提供存儲硬件,通力合作打造了瑞金智慧病理樣板。
當然了,從技術到商業,我們常常高估一年的變化,卻低估十年的變化,所以大家可以給這個行業多一些耐心。