Meta 加大了在其社交媒體平台引入人工智能工具的力度,而其最新的人工智能探索專案涉及將生成式 AI 圖像帶到 Instagram 的故事功能中。
Meta 的生成式 AI 副總裁 Ahmad Al-Dahle 在 Meta 的替代品 Threads(前身為 Twitter)上宣布了這個新的 AI 工具。目前該功能正在美國進行推出,目前尚不清楚這個工具何時將對其他國家的 Instagram 用戶開放。
這項新功能允許用戶通過生成 AI 背景來重新設計他們的 Instagram 故事,以增強圖像效果。在故事攝像頭(在應用程式的主頁上向右滑動)上,現在會出現一個新的圖標,位於現有的「添加文字」按鈕旁邊,用戶可以點擊該圖標,通過輸入提示詞(例如「被小狗圍繞」和「在火山爆發的邊緣」)來生成新的背景,如果你感到冒險的話。
一旦你分享了你的 AI 創作,你的故事上會顯示一個「試試看」貼圖,這樣你的追隨者就更容易第一次使用這個編輯工具了。
Meta 在其社交媒體平台上推出了各種基於人工智能的功能,以迎頭趕上 Google 和 ChatGPT 等平台。從目前的情況來看,該公司並不打算減緩其人工智能創新的步伐。
有趣的是,補助計劃的部分資金將來自前 Google 首席執行官兼主席 Eric Schmidt。作為 Altman 的熱情支持者,Schmidt 迅速成為 AI 悲觀論的代表人物,他聲稱危險的 AI 系統即將到來,而監管機構在準備方面做得不夠。這並不完全出於利他主義的心態,Protocol 和 Wired 的報導指出,作為一位積極的 AI 投資者,Schmidt 如果美國政府實施他提出的增強 AI 研究的藍圖,他將從商業上獲得巨大利益。
從這個角度來看,這種捐贈可能被視為一種虛偽的示好。Schmidt 的個人財富估計約 240 億美元,他還向其他與倫理關聯較少的 AI 項目和基金注入了數億美元,包括他自己的項目。當然,Schmidt 否認這是真實情況。
Intel CEO Pat Gelsinger 在紐約的一次發佈會上表示:“我們已經看到了生成式 AI 的激動人心,這是 2023 年的主角。”他在該活動上宣佈了 Gaudi3 和其他專注於 AI 應用的晶片,並補充說:“我們認為 AI 個人電腦將成為即將到來的一年的主角。”這也是 Intel 新的 Core Ultra 處理器(也在週四宣佈)將發揮作用的地方。
Intel Core Ultra 和新一代 Xeon 處理器Intel 還宣佈了針對 Windows Notebook 電腦和個人電腦的 Core Ultra 晶片,以及新的第五代 Xeon 伺服器晶片。兩者都包含一個名為 NPU 的專門的 AI 部分,可以加快運行 AI 程序的速度。
這是傳統處理器製造商的最新跡象,包括 Intel 的競爭對手 AMD 和高通,他們正在重新定位他們的產品線,並向投資者警示 AI 模型可能導致對晶片需求激增。
Google Gemini 的重大擴張將使您的日常工作任務中出現更多 AI 工具。該公司展示了其以 Gemini AI 模型為動力的企業世界愿景,稱其可以惠及各種規模的企業,並對開發人員帶來巨大的推動力。
Google 最近推出了三種不同用途和產品的 Gemini 版本——Ultra、Pro 和 Nano。Nano 已經搭載在該公司的 Pixel 8 Pro Android 智能手機上,而 Pro 的「特別調整」版本則用於 Google Bard。該公司現在正在將 Gemini Pro 擴展給開發人員,讓企業可以為該技術創建和構建自己的用例。
Google Gemini Pro
Google 表示,Gemini Pro 將通過其新的 Google AI Studio 建構生態系統免費使用,但在一定限制內,同時也將提供「具有競爭力的價格」以提供更多功能,並提供多種對開發人員友好的功能。
Gemini Pro 是在 Google 的第五代 TPU v5p 上進行訓練的,將首次推出 32k 文字上下文窗口,未來版本將擴展此功能,並包括功能調用、嵌入、語義檢索和自定義知識基礎和聊天功能等特點。
該模型最初只接受文本作為輸入,並僅生成基於文本的結果,但 Google 還推出了一個獨立的 Gemini Pro Vision 平台,該平台也接受圖像作為輸入。
Google AI Studio
對於那些想要親自參與的人,該公司推出了 Google AI Studio,這是一個免費的基於瀏覽器的開發工具包,可以通過您的 Google 帳戶訪問。有了 Gemini 動力的聊天機器人和搜索代理可以在無代碼或低代碼環境中快速構建。
使用 Google AI Studio,用戶可以快速開發提示,並獲得用於應用程序開發的 API 密鑰,該工具可以從您的 Google Drive 帳戶中提取文本和圖像,以幫助 Gemini 創建結果,例如為房地產經紀人編寫房屋描述。
Google AI Studio 在全球 180 多個國家支持 38 種語言,每分鐘的配額為 60 個請求,Google 稱這比其他免費提供的服務多 20 倍,並且「適用於大多數應用程序開發需求」。
完成後,用戶只需點擊「獲取代碼」按鈕,將其工作轉移到他們選擇的 IDE 中(包括 JavaScript、Python、cURL 等),使用提供的一系列快速入門模板之一,或直接轉移到 Vertex AI。
當您的企業需要一個完整的 AI 解決方案時,Google 的 Vertex AI 平台現在將提供對 Gemini Pro 的「廣泛和深入的支持」,Google Cloud 首席執行官 Thomas Kurian 指出,還將提供超過 120 個開源和第三方 AI 模型。
用戶可以在 AI Studio 和 Vertex AI 之間切換,實現增強的自定義功能,同時使您的企業保持對其數據的完全控制,這些數據可用於調整和優化 Gemini,使其完全符合您的業務需求,同時保持信息的安全和私密性。
Vertex AI 還將提供一系列新模型,包括 Imagen 2,這是 Google 的最新圖像生成模型,現在可以提供逼真的圖像,以及文字渲染和標誌生成等功能,非常適合廣告或市場營銷活動。
Gemini Pro 現在對全球開發人員開放,Google 還表示其更強大的 Gemini Ultra 將在「明年初」推出。
Google 宣佈推出 MedLM,這是一個針對醫療行業進行了精細調整的模型家族。基於 Google 開發的 Med-PaLM 2 模型,該模型在數十個醫學考試問題上表現出「專家級」的水平,MedLM 現已提供給 Google 雲的美國客戶使用(在某些其他市場上處於預覽階段),這些客戶已通過 Google 的全面管理的 A.I. 開發平台 Vertex AI 獲得白名單。
目前有兩個可用的 MedLM 模型:一個更大的模型,專為 Google 描述的「複雜任務」而設計,以及一個更小的、可微調的模型,最適合「跨任務擴展」。
「通過與不同組織合作試點我們的工具,我們了解到,對於特定任務來說,最有效的模型因使用情境而異,」 Google 的工程和研究副總裁 Yossi Matias 在今天的公告之前向 TechCrunch 提供的一篇博客文章中寫道。「例如,對話摘要可能最適合由一個模型處理,而搜索藥物可能更適合由另一個模型處理。」
當 Ray-Ban Meta 智能眼鏡推出時,它們並沒有我們承諾的許多令人印象深刻的 AI 功能。現在,Meta 終於向用戶推出了這些功能,但它們仍處於測試階段,僅在美國可用。
在 Meta Connect 2023 的發布會上,我們被告知 Ray-Ban Stories 智能眼鏡的後續型號將獲得一些我們期望的改進,包括稍微更好的相機和揚聲器,以及一些意外的 AI 整合。
不幸的是,當我們實際測試這些規格時,它的 AI 功能只限於非常基本的指令。您可以指示它們拍照、錄視頻或通過 Messenger 或 WhatsApp 與某人聯繫。在美國,您還可以與基本的對話式 AI(例如 ChatGPT)進行對話,但這仍然不值一提。因為兩個重要的承諾功能即將到來:Look and Ask 和 Bing 整合。
Look and Ask 本質上是一個可穿戴式語音控制的 Google Lens,並具有一些 AI 增強功能。當佩戴智能眼鏡時,您可以說「嘿 Meta,看一下…」,然後提出關於您所看到的問題。AI 將使用相機掃描您的環境,以便能夠對您的查詢提供詳細答案。在官方常見問題解答中,您可以問的問題包括「我可以用這些食材做什麼?」或「這些花需要多少水?」或「將這個標誌翻譯成英文」。
為了幫助 Meta 眼鏡在使用對話式和 Look and Ask 功能時提供更好的信息,現在這些規格也可以通過 Bing 訪問互聯網。這意味著規格可以獲取更即時的數據,讓它能夠回答有關當前正在進行的體育比賽或附近最受好評的餐廳等問題。
這一切聽起來非常科幻,但不幸的是,這些近乎神奇的功能還有一個限制。目前,新功能(就像現有的對話式 AI 一樣)仍處於測試階段。
因此,眼鏡可能無法回答您的某些問題,提供不準確的答案,或者根本無法找到答案。此外,正如 Meta 在其常見問題解答中解釋的那樣,您在測試期間拍攝的任何經過 AI 處理的照片將由 Meta 存儲並用於訓練其 AI。因此,您的 Look and Ask 照片並不私密。