Binghamton 大學研發可語音導航的機械導盲犬系統

賓漢頓大學的研究人員開發了一個機械導盲犬系統,能與用戶進行對話,提供實時導航協助及雙向溝通。這個系統利用大型語言模型,幫助視障用戶抵達目的地,同時描述沿途的環境和障礙物。與傳統的導盲犬不同,這款機械導盲犬能在出發前解釋路線,並在行進過程中持續更新信息。

這項研究建立在早期工作的基礎上,當時的機械導盲犬能夠根據物理信號作出反應,例如牽引繩的拉扯。最新版本新增了對話能力,允許用戶透過語音命令與系統互動。研究人員張世奇表示:「我們展示了機械導盲犬的一個方面,這點比生物導盲犬更先進。真正的狗最多能理解大約 20 個指令,但對於機械導盲犬,只需將 GPT-4 結合語音命令,便能擁有強大的語言能力。」

這個系統引入了兩個關鍵功能:計劃語言化和場景語言化。在開始旅程之前,機械導盲犬會概述可能的路徑和預估的旅行時間。在導航過程中,它會實時描述環境,幫助用戶更好地理解周遭情況。張世奇指出:「這對視障或盲人來說非常重要,因為沒有視覺的情況下,情境和場景的意識相對有限。」

為了測試系統,研究人員招募了七名合法視障參與者,讓他們在大型室內辦公環境中導航。機械導盲犬首先詢問用戶想去的地方,然後呈現路徑選項。一旦選擇了路徑,機械導盲犬便逐步引導用戶,提供口頭反饋,例如走廊描述和障礙警示,直到抵達目的地。

參與者後來被要求根據可用性和有效性評估系統。結果顯示,使用者更喜歡包含出發前解釋和實時敘述的綜合方法。模擬研究也支持這些發現,顯示對話式導航提升了導航信心和控制感。與機械導盲犬的溝通似乎增強了信任感和整體用戶體驗。

研究人員表示,未來的工作將專注於提高自主性,並擴展導航範圍,超越室內空間。計劃包括在更複雜的環境中測試系統,並啟用更長距離的旅行。張世奇表示:「他們對這項技術和機械人的未來感到非常興奮,詢問了許多問題。他們真心看到了這項技術的潛力,希望能看到這項技術的實際應用。」

這項研究的目標是使機械導盲犬成為日常生活中實用的輔助工具,結合移動支持與智能通信。該研究在人工智能 AAAI 大會上發表。

AI 內容聲明:本文由 AI 工具輔助撰寫初稿,經 TechRitual 編輯團隊審閱、修訂及事實查核後發佈。如有任何錯誤或需要更正,歡迎聯絡我們

Henderson
Henderson 是 TechRitual Hong Kong 科技編輯,專注報導智能手機、消費電子產品、SIM 卡及流動通訊市場。自加入 TechRitual 以來,累計撰寫數千篇科技報導及產品評測,內容同步發佈至 SINA 及 Yahoo Tech 等主要平台。部分文章由 AI 工具輔助撰寫,經編輯團隊審閱及事實查核後發佈。