Cerebral Valley 黑客團隊打造 20 美元開源智能眼鏡

上週末的一場 36 小時黑客松活動引發了一項重要的創新,可能會讓開源社區顛覆智能眼鏡行業。一支由五人組成的團隊成功打造了一款價格僅為 20 美元的智能眼鏡,名為 Open Glass,該眼鏡能夠將視覺和聽覺與 AI 聊天機器人相連,例如 Meta 的 Llama 3。

上週六早上,Scott Fitsimones 前往舊金山市中心與 Nik Shevchenko 會面,當時他並不知道接下來的 36 小時將與他一同參加 AI 黑客松,共同打造一款新設備。當時,Fitsimones 認為他要取回的是 Shevchenko 製造的 AI 項鍊,他被描述為舊金山蓬勃發展的 AI 可穿戴設備運動的領導者。到了週末結束時,他們的團隊贏得了黑客松比賽,並有大約 1500 人在等待名單中預訂他們的開源智能眼鏡。

Fitsimones 表示:“我對這次黑客松一無所知,這真是一個很巧合的機會。”他說:“然後,你知道,我們開始對最初的原型進行改進和構建。”根據他的團隊成員所說,Shevchenko 參加黑客松時已經知道他想要為某種智能眼鏡建造硬件元件(Shevchenko 沒有回應 Gizmodo 的採訪請求)。他與解決該項目最困難的軟件挑戰的 Stepnan Korshakov 一起參加比賽。這兩位與 Fitsimones、Shreeganesh Ramanan 和 Jatin Gupta 組成的團隊一起成為了冠軍。

在一個俯瞰著灣區蔚藍海水和綠山的寬敞房間裡,軟件工程師們坐在舒適的沙發上,旁邊擺滿了 La Croix 飲料。Cerebral Valley 經常舉辦這樣的黑客松活動,匯聚了舊金山蓬勃發展的 AI 初創企業圈。Shevchenko 是少數使用焊接筆而不是筆記本電腦的人之一,而團隊的其他成員則繼續著軟件開發工作。在週六晚上的某個時刻,Shevchenko 離開活動現場去 3D 打印 Open Glass 的電腦外殼。

經過大約 36 小時的努力,Shevchenko 和團隊自豪地展示了一副便宜的太陽眼鏡,右側突出一個黑盒子。這款眼鏡配備了一個每五秒拍攝一次照片的相機,以及一個不斷進行語音轉錄的麥克風。這樣就可以收集照片和文字的數據庫,以反映你的視覺和聽覺所感知的事物。按下眼鏡側面的按鈕,你可以向 Meta 的 Llama 3 聊天機器人提問有關自己生活的問題。

在演示過程中,AI 回答了一些問題,例如:“那個人叫什麼名字?”,“我把鑰匙放在哪裡了?”,以及“這些水果有多少卡路里?”這項技術對許多人來說都有用處,但對視力不佳或聽力不佳的人尤其有幫助。儘管在演示過程中眼鏡的語音轉文字功能出現了一個錯誤,Shevchenko 的團隊仍然在黑客松比賽中獲得了第一名。他們得到了 Meta 和 Groq 的高層的認可,以及 Hugging Face 的 CEO Clem Delangue 的評判。幾個小時之內,Shevchenko 的創業思維迅速啟動,他創建了一個預訂該原型版本的等待名單。

儘管目前市場上已經有其他智能眼鏡,例如 Meta 的 Ray-Bans,但它們並不是開源的,也不像這麼便宜。Open Glass 提供了一個相對便宜的套件,允許開發人員選擇他們想要使用的 LLM(聊天機器人)並決定眼鏡的功能。例如,並非每副 Open Glass 都需要拍照或不斷記錄音頻。這為智能眼鏡提供了一個價格合理、可修改的選擇,以前這種設備的價格昂貴且功能有限。

Ramanan 在一次電話訪問中表示:“你可以將它連接到 OpenAI,你可以將它連接到 Gemini。”他說:“這主要是關於擁有混合和匹配所有最佳選項的能力,然後創建自己有趣的應用和框架。”智能眼鏡還沒有像其他可穿戴設備那樣普及起來。然而,多模態 AI 模型的進步使得現在是智能眼鏡的一個令人興奮的時刻。很容易想像到,像 OpenAI 的新 GPT-4 Omni 這樣可以同時處理視頻、音頻和文本的技術可以應用於這樣的眼鏡中。甚至 Google 在最新的 AI 演示中展示了新的 Google 眼鏡的原型。Open Glass 希望通過讓開源社區獲得這項技術,促進該領域的更大創新。

智能眼鏡一直存在隱私問題。Meta 的 Ray-Bans 並不會不斷錄製音頻和視頻,以將你的生活變成一個數據庫,這可能是一件好事。但在矽谷有一個不斷增長的 AI 設備愛好者社區,他們對不斷記錄自己生活以創建終極個人助理的想法很感興趣。從舊金山的初創企業中冒出了戒指、項鍊,現在又有了眼鏡,所有這些都對這種潛力充滿好奇。

儘管開源技術將使開發人員能夠以更本土化的方式創新這些想法,但隱私和成本仍然是需要解決的重大問題。這些問題對於這項技術的早期開發者來說很重要,但更重要的是使其變得有用。

一些非技術人員可能會購買 Open Glass,僅僅是為了使用一副便宜的智能眼鏡。該團隊仍在研究產品,但似乎它將預先內置大型語言模型並配有相應的移動應用程序。實際設備的價格還有待確定,但所有的源代碼在 GitHub 上都可以免費獲得。

Open Glass 的故事證明了舊金山蓬勃發展的 AI 初創企業文化。開源社區可能會在智能眼鏡等技術上實現重要突破。從實用角度來看,它還可以為非技術人員提供一副價格與一張電影票相當的智能眼鏡。

______

最全面,最真心的「手機開箱」即睇: 手機、平板真心評測
更多 SIM Card 評測請即睇:電話卡速度測試比較
更多手機消息:https://www.techritual.com/category/news/mobile-handheld/

此文章發佈於 TechRitual 香港 - 日本電話卡
十斗
十斗https://www.techritual.com/author/tenten/
十斗在知名大學取得了計算機科學與工程學位,並在學術研究方面表現出色。她的研究領域包括人工智能、機器學習和數據科學。一斗為十升,一升為十合,一合為十分之一升。謝靈運言天下才學一石,曹植占八斗,以此讚譽。後用以比喻才學極高。