本月初,ChatGPT Health 正式上線,並與 Apple Health 及多個數據提供者進行整合。然而,《華盛頓郵報》的科技專欄作家在將其 Apple Watch 數據提供給 ChatGPT 後,結果並不理想。他發現 ChatGPT Health 對 Apple Health 數據的解讀不一致且不準確。
作為一名每日佩戴 Apple Watch 的用戶,該作家 Geoffrey A. Fowler 很好奇十年來的數據能揭示什麼。他加入了短暫的等候名單,並授權 ChatGPT 存取其 Apple Health 應用程序中的 2,900 萬步和 600 萬次心跳測量數據。隨後,他請求 ChatGPT 對其心臟健康進行評分,結果卻是 F 級。他感到非常不安,於是決定去跑步,並將 ChatGPT 的報告發送給自己的醫生。醫生告訴他:“不,這並不正確。”事實上,他的心臟病風險相當低,以至於保險公司可能不會支付任何額外的心血管健康測試,以證明這一人工智能的評估有誤。
Fowler 指出,ChatGPT 的評分似乎與其對 Apple Watch 健康數據的幾個誤解有關。例如,ChatGPT Health 將其負面評價的主要依據放在 VO2 max 指數上,儘管 Apple 表示其 VO2 max 數據僅為估算值。這樣的數據對於追踪趨勢有幫助,但獲得準確的數據需要專業設備。此外,Fowler 在更換 Apple Watch 後,靜息心率的變化並不是實際變化,而是傳感器和測量工具更新的結果,但這一因素似乎並未被 ChatGPT 考慮在內。
另一個問題是回答的不一致性:當他再次詢問相同的心臟健康評分問題時,分數突然上升到 C 級。反復詢問後,分數在 F 和 B 之間波動。Fowler 發現,ChatGPT 在不同的對話中經常忘記關於他的關鍵信息,包括性別、年齡和一些近期的生命體徵。儘管它能存取近期的血液檢測結果,但有時卻未能在分析中使用這些資料。
對於曾經使用過 AI 聊天機器人的人來說,這些問題可能不會感到意外。然而,作為一個旨在提供健康知識的產品,這樣的情況特別令人擔憂。
據 9to5Mac 報導,Apple 據傳正在開發一個 AI 驅動的「Health+」服務,預計在今年稍後推出。而 ChatGPT Health 的早期報告清楚地顯示,達到 Apple 預期的質量水平可能非常困難。但如果 Apple 能夠做到這一點,Health+ 可能會迅速成為 AI 健康領域的重要參與者。




