Home Blog

Samsung Galaxy A54 獲 One UI 8.5 Beta 2 更新 印度推送

Samsung 近日將 One UI 8.5 Beta 2 更新擴展至 Galaxy A54,繼 Galaxy S23 系列、Galaxy Z Flip5、Galaxy A36 及 Galaxy A35 之後,進一步涵蓋這款中階機型。該更新固件版本為 A546EXXUJZZD9,下載大小約 500MB,目前已在印度地區推送。

One UI 8.5 Beta 2 更新日誌

更新修復了進入藍牙設定時自動掃描失效的問題,提升相機功能穩定性;同時修正快速面板中亮度及音量調整中斷的狀況,並優化 Direct Voicemail 功能,預設使用 Samsung TTS 引擎。 | 更新內容 | 描述 | |———-|——| | 藍牙設定 | 修復進入藍牙設定時自動掃描不運作的問題 | | 相機功能 | 提升穩定性 |

| 快速面板 | 修復亮度及音量調整中斷問題 | | Direct Voicemail | 優化功能,預設使用 Samsung TTS 引擎 | 若已加入 One UI 8.5 Beta 計劃,用戶可前往「設定 > 軟件更新」手動檢查更新。Samsung Galaxy A54 現有優惠包括 128GB 6GB RAM 版本售 US$112.92,約 HK$880;128GB 8GB RAM 版本售 US$170.

51,約 HK$1,330。

規格價格
128GB 6GB RAMUS$112.92,約 HK$880
128GB 8GB RAMUS$170.51,約 HK$1,330

新能源車後視鏡輕微碰撞維修費近 5,700 元人民幣中國

近日,一宗新能源汽車維修案例引發廣泛熱議。一位車主因輕微碰撞導致後視鏡損壞,維修費用高達 5700 元人民幣,約 HK$6193,令人對新能源汽車常規配件維修價格產生質疑,不少車主感嘆買得起、修不起。

後視鏡高度整合導致維修成本激增

據當事車主張先生介紹,其車輛在小區倒車時視線受阻,車身一側後視鏡不慎碰撞上車庫立柱。起初他以為僅為簡單外殼及鏡片損傷,預計百元內可修復,但送至 4S 店檢測後結果遠超預期。這款新能源汽車的後視鏡並非傳統機械配件,而是高度整合電動調節、自動折疊、加熱除霧及盲區監測等多項智能功能。 車身外觀損傷輕微,但碰撞已導致內部精密電子元件受損。由於一體化集成設計,該配件無法單獨更換鏡片或外殼等單一部件,只能整體更換總成。

同時因配件需特別調配,整套維修最終定價 5700 元人民幣,約 HK$6193,維修週期長達近一週。

FCC 禁中國實驗室測試美國市場智能手機等電子設備

美國聯邦通訊委員會(FCC)一致通過一項提議,將禁止所有中國實驗室為進入美國市場的智能手機、相機頭、電腦等電子設備進行測試和認證。FCC 設定兩年過渡期,將逐步撤銷中國實驗室的認證資格。FCC 在聲明中透露,目前約 75% 的美國電子產品在中國完成測試。提議生效後,FCC 將不再承認來自「未與美國簽署《相互認可協議》或其它同等互惠貿易協議」國家的實驗室和測試機構。

政策細節與過渡安排

與此同時,FCC 計劃在美國本土或與美國有互惠協議國家的實驗室建立綠色通道,簡化「受信實驗室」的審批流程。FCC 主席表示,美國不應讓外國競爭對手名單上的實體,來測試和認證電子設備。去年 5 月,FCC 曾收緊對中國、俄羅斯等國家測試機構的認證,截至目前,已撤銷 23 家海外實驗室的資格。 分析指出,這一禁令將直接衝擊大量依賴中國測試機構的美國科技企業。由於中國擁有成熟的測試基礎設施和規模效應,大量電子設備製造商選擇在中國進行認證。

一旦禁令落地,相關企業將不得不重新調整認證流程,轉向美國本土或其他國家的實驗室。這可能增加成本並延長產品上市時間,對供應鏈構成挑戰。

NVIDIA B300 伺服器中國成交價升至 700 萬 元人民幣 近翻倍

NVIDIA B300 AI 伺服器在中國大陸市場的成交價已攀升至每台約 700 萬元人民幣,約 HK$763 萬,相當於約 100 萬美元,較去年底的約 400 萬元人民幣幾近翻倍。作為參考,搭載 8 塊 B300 GPU 的同款伺服器在美國市場售價約 55 萬美元,較去年底的 50 萬美元僅小幅上漲。中國市場高出近一倍的價差,凸顯供需失衡。

B300 規格優勢支撐高價

價格上漲已促使部分資金有限的 AI 企業從採購轉向租賃。據悉,B300 伺服器一年期租賃合約的價格已升至每月 19 萬元人民幣,且仍需排隊等待資源釋放。支撐市場定價的是 B300 的硬體規格,該產品配備 288GB HBM3e 高帶寬記憶體,在 FP4 精密度下可提供 14 petaFLOPS 計算能力,是目前英偉達可用於 AI 推論任務的最強晶片之一。 下表列出 B300 主要規格:

規格項目細節
記憶體288GB HBM3e 高帶寬記憶體
FP4 計算能力14 petaFLOPS
應用場景AI 推論任務

H200 對華出口的不確定性同樣推高 B300 價格。雖然美國政府已批准 H200 的對華出口許可,但雙方在具體條款上仍有分歧,至今回未實現實際出貨。這一局勢使 B300 在市場上變得更為稀缺。 中國本土 AI 晶片廠商正逐步加強競爭力。華為已制定明確的產品迭代路線圖,計劃在 2026 年至 2028 年間分階段推出四款昇騰系列晶片,包括 2026 年第一季度的昇騰 950PR。

目前,海光、寒武紀、阿里平頭哥等廠商亦在同步推進 AI 訓練與推論晶片的迭代。

飛機起飛前 40 分鐘即停辦理值機 因乘客行李重量需重算

搭乘飛機出行時,多家航空公司建議乘客提前 2 小時到機場辦理值機,有些國際航班甚至要求提前 3 小時。一旦錯過值機時間,即便已抵達機場,也無法登機,更遑論進入機艙門口,機場不會「通融」。南方航空的登機提示資訊,圖片截取自南航官網。這並非機場或航空公司不講人情,而是因為起飛前有大量準備工作,其中某些步驟必須在乘客和行李數量確定後才能進行。 ### 機艙重量平衡與「艙單」的關鍵角色

最重要的「艙單」檢查,飛航員和空姐在起飛前要做的事各不相同,但都指向同一東西方——艙單。飛航員需將艙單數據輸入飛機電腦,並憑此向塔台申請起飛,然後按指示排隊起飛。製作艙單過程中,有一個關鍵步驟,需要航空公司或機場配載部門根據飛機型號、航程油耗、乘客數量(重量)、行李重量等資訊,對飛機載重平衡進行測算,確保飛機重心維持在安全範圍內。因此,這一步必須在乘客和行李重量完全確定後才能進行。

如果持續有乘客登機,乘客重量和行李重量就會變化,飛機載重平衡亦需重新測算。所以,航班在起飛前 30 分鐘(甚至更長時間)就不允許值機,否則會耽誤其他乘客的行程。 不容忽視的載重平衡與重心,乘客搭飛機時對「載重平衡」和「重心」沒什麼體感,但它們對航班飛行安全極為重要。例如,2002 年中國北方航空 6136 號航班空難(又稱五七空難),就與飛機重心變化有關。這次空難起因是有人縱火。

飛機機艙起火後,勉強可飛行一段距離。在這種緊急情況下,飛航員決定避開人口密集市區,飛向海上迫降,盡量避免地面人員傷亡。可機艙著火後,八名乘客因火勢未蔓延到機艙前部逃去,這些人成為飛機重心突然前移,飛機頭朝下直衝海面。 另外,2013 年美國國家航空 102 號航班,因為飛行過程中,貨艙內貨物未固定發生位移,導致整個飛機重心後移,釀成機毀人亡悲劇。根據 2016 年一項研究數據,77% 的飛行事故與飛機重心超出安全範圍有關,其中 57% 的事故會引致墜毀後果。

由於載重平衡和重心對飛行安全如此重要,因此給工作人員充足時間進行測算,合理安排行李、油量以及安置配重物就非常有必要了。 順便說一句,在購買機票時,如果飛機未坐滿,航空公司也不會讓乘客完全自由選座,避免所有乘客都選到飛機的某一側,或集中在前部、後部的狀況發生。而且在飛機飛行過程中,即便前面座位空著,機組人員通常也不會讓乘客隨意更換座位。例如 2015 年,曾發生乘客不按票面座位入座,堅持要換到右前的座位,引起其他乘客效仿,最終影響飛機載重平衡。

乘客又不稱體重,怎麼知道重量?既然載重平衡這麼重要,機組人員怎麼知道我們和行李的重量?畢竟登機時,只有隨身的行李會過一下秤,人和隨身行李是不會稱重的。答案也很簡單,就是估算。載重平衡和重心固然重要,但並不要求分毫不差。根據中國民用航空局《航空器重量與平衡控制規定》中的劃分,我們乘坐的航班大多屬於「大客艙航空器」。對這類飛機,可使用乘客和行李的「標準平均重量」來估算。

因為飛機越大、乘客越多,用標準平均重量估算的結果就越準。 | 類別 | 標準平均重量 | |——|————–| | 成人的標準平均重量(包含衣物和手提行李) | 75 千克 | | 兒童的平均重量 | 38 千克 | | 嬰兒 | 10 千克 | 《航空器重量與平衡控制規定》中對標準平均乘客重量的規定 當然,本國規範使用的「標準平均乘客重量」在其他國家和地區不一定適用。

例如根據美國疾病控制與預防中心(CDC)的數據,美國成年男性的平均體重 90.63 磅(199.8 磅),女性 77.47 磅(170.8 磅),再加上衣物和行李重量,就遠遠超過 75 公斤了。另外,有些航空公司對手提行李的尺寸和重量作出限制,一方面當然是為了確保行李能放進機艙行李架中。另一方面也是為了防止乘客隨身攜帶過重行李,影響重量的估算。 最後一分鐘限值,飛機雖在起飛前 30 分鐘至 1 小時就停止值機,但可能會出現一些特殊情況。

例如有些辦理完值機的乘客,可能在機場免稅店逗留,飛機艙門關閉前還未到達登機口。在登機口即將關閉時,機場會廣播這些乘客的名字以作提醒。但如果廣播後依舊未到,機長是有權下達關艙令直接起飛的,畢竟不能讓整個飛機的乘客都等。 這種情況下,飛機不一定需要重新測算載重平衡。有一個術語叫「最後一分鐘修正」,它指的是在艙單製作完成後、起飛前,航班可不用重新製作艙單,對載重進行微調。

包括對燃油重量調整、機組、乘客人員調整,以及貨物調整等。這種調整只需寫到艙單的備註欄,而且機長和負責載重平衡的相關人員確認核實、簽字即可。下圖就是某航空公司艙單上的「最後一分鐘修正」表格。 | 調整項目 | 調整值與最大燃油重量、最大起飛重量、最大著陸重量相關 | |———-|—————————————————-|

某航空公司艙單中「最後一分鐘修正」部分,這份艙單針對 A320-200 機型,最多可調整 6 名乘客或 500 公斤配重。如果改動的人數或配重太多,這就需要重新測算載重平衡,重新製作艙單了。這種情況會耽誤航班上其他乘客的時間,所以大家值機後也別忘了登機時間。 另外,在與飛航員溝通的過程中,也有一個值得注意的細節,如果人員到齊、貨物裝載完畢,飛機艙門也關閉了,跑道上沒有限制,可以申請提前起飛。

乘客前限制有點多,但說不定,你能趕上一次!

Alt 新加坡 2日 FUP 無限上網電話卡,穩定快速上網

根據測試,Alt 新加坡 2日 FUP 無限上網電話卡喺新加坡市區嘅平均下載速度達到 50Mbps,這個數值比同類產品平均水平高出 20%。使用「Singtel」網絡,網絡覆蓋率達到 95%,確保用戶即使喺高人流地區都能保持良好的上網體驗。這款電話卡喺每日1GB數據後會降速至128kbps,但仍可無限使用,適合短期旅客。

此產品設計方便易用,用戶只需插入SIM卡,打開漫遊即可自動啟用,無需複雜設置。它還支持熱點分享,能夠連接多部設備,適合需要同時上網的用戶。從技術角度睇,Alt 新加坡 2日 FUP 無限上網電話卡喺網速同易用性方面表現出色,但降速政策仍有改善空間。綜合數據顯示,產品適合短期使用,能夠滿足大部分用戶的基本需求。


Alt 新加坡 2日 FUP 無限上網電話卡 / eSIM
優惠碼:暫無
價格:特價 HK$28.00 (原價 HK$58.00,慳 HK$30)
購買連結https://anlander.com/products/alt-sg-2-fup

vivo X Fold6 規格曝光 內置 MediaTek Dimensity 9500 晶片 2 億像素主鏡頭 7,000mAh 電池

vivo 預計將在未來兩個月內發佈 X Fold6。如果公司遵循以往的發佈週期,這款摺疊手機可能會在六月登場。在官方確認之前,網上已流出新細節。去年十一月,vivo X Fold6 的初步規格曝光,顯示將配備 200MP 主相機及 Snapdragon 8 Gen 5 處理器。但最新洩漏指,這款摺疊機將改用 MediaTek Dimensity 9500 處理器。

規格細節曝光

據數碼聊天站爆料,vivo X Fold6 內置 8.02 英寸 UTG 屏幕,解析度達 2K,外置屏幕為 6.51 英寸。這與 vivo X Fold5 的 6.53 英寸外屏及 8.03 英寸內屏相若。後置相機組合包括 200MP 主鏡頭、50MP 潛望式長焦鏡頭及 50MP 超廣角鏡頭。內外屏幕均配備 20MP 前置相機。此外,機身內置 7,000mAh 電池,支持無線充電,並具備完整防水等級。

以下為主要規格對比表:

規格項目vivo X Fold6 (洩漏)vivo X Fold5
內置屏幕8.02 英寸 UTG, 2K 解析度8.03 英寸
外置屏幕6.51 英寸6.53 英寸
主相機200MP
長焦相機50MP 潛望式
超廣角相機50MP
前置相機內外各 20MP
電池容量7,000mAh (支持無線充電)
處理器MediaTek Dimensity 9500
防水等級完整防水

《時代》雜誌預測 2026 年十大具影響力 AI 公司 字節跳動、阿里雲、智譜上榜

《時代》雜誌本週發佈的 2026 年十大最具影響力 AI 公司(The 10 Most Influential AI Companies of 2026)榜單中,字節跳動、阿里雲及智譜上榜。除了這三家中國公司外,兩大 AI 明星初創公司 OpenAI 及 Anthropic、Alphabet(Google 母公司)、Amazon、Meta 三家美國科技巨頭,以及歐洲「AI 全村希望」Mistral 和開源模型平台 Hugging Face 亦榜上有名。

(來源:TIME)

中國科技巨頭的 AI 成就

對於字節跳動及阿里雲,《時代》雜誌特別強調它們在既有業務之外取得的 AI 領域成就。對於字節跳動,《時代》評價指,其業務樞紐仍是月活躍用戶約 7.7 億的抖音,但公司未來方向轉向 AI 助手「豆包」。其周活躍用戶已超過 1.55 億,並在今年 2 月春節期間單日活躍用戶突破 1 億,使中國成為全球最早實現 AI 助手大規模普及的國家之一。 阿里雲上榜原因,在於不到三年時間內成為「全球開源 AI 的核心力量之一」。

《時代》指出,阿里旗下「通義」系列模型累計下載量超過 10 億次,並衍生出超過 20 萬個派生模型,影響力早已超出中國市場,成為全球最受歡迎開源模型家族之一。《時代》進一步表示,中國科技巨頭正試圖將其開源模型領先優勢打造成一個全棧 AI 絲路國家。 智譜的上榜,不僅與其「全球大模型第一股」有關,更與中國前沿大模型及中國國產算力平台的相互成就有關。公司今年推出旗艦開源大模型 GLM-5,以及完全基於國產設備全流程構建的圖像生成模型 GLM-Image。

其中 GLM-5 在多項基準測試中性能與 Google、OpenAI 及 Anthropic 的旗艦大模型相當。《時代》評論指,智譜的成就顯示中國 AI 開發者可在不依賴任何西方技術的情況下參與前沿競爭。 其他上榜公司評語包括:OpenAI:令人驚嘆的估值增長速度,儘管面臨激烈競爭,仍是推動 AI 部署步伐的領頭羊。Anthropic:與美國政府就 Claude 模型使用方式的爭端,或令這家 AI 實驗室變得更強大。

Alphabet(Google):十年前已開始構建「人工智慧優勢」景觀,依賴 DeepMind 技術積累及 Gmail、YouTube、Waymo 等頂級入口,構建全球最廣覆蓋的全棧 AI 服務體系。Amazon:電商巨頭正成為人工智慧基礎的核心玩家,透過 Trainium 芯片及超大規模算力叢集佈局,爭奪 AI 時代最關鍵的基礎設施控制權。Meta:依賴全球最大社交數據資產,持續推動 AI 在廣告及內容生成場景商業化的行業風向標。

Mistral AI:作為歐洲 AI 行業代表,正成為歐洲政府及企業取代美國 AI 供應商的選擇。Hugging Face:公司運營著全球最大共享 AI 模型、數據集及應用儲庫。最新數據超過 200 萬個模型及 50 萬個數據集,使其有點像 AI 領軍領域的 GitHub。超過 30% 的財富 500 強公司在該平台上有帳戶。除 AI 模型外,Hugging Face 還積極進軍 AI 代理及機器人領軍領域。

美外交流委員會研判 DeepSeek V4 落後 7 個月

DeepSeek V4 發佈已經一週時間,期間三次降價或優惠,這款視覺大模型標誌著本代大模型佈局基本完成。相較去年 DeepSeek R1,這次 DeepSeek V4 發佈後爭議更多,主要因為沒有 R1 那種技術上領先的感覺,各種 AI 榜單上實際排名也落後於美國公司開發的 AI 大模型,主要為 Google、OpenAI 及 Anthropic 三家的頂級模型,如 GPT-5.

5、Opus 4.7 及 Gemini 3.1 Pro 等。 DeepSeek V4 距離最強 AI 還差多遠?這件事美國人也非常關注。日前美國外交關係委員會組織了 3 個高級研究員做了研究報告,他們得出的結論是 V4 符合美國領先中國 7 個月的判斷。

美國研究報告詳情

DeepSeek V4 沒有做到目前最頂尖的大模型,這一點 DeepSeek 自己也認識到,他們在論文中提到距離最先進的前沿模型大約 3-6 個月,與美國人判斷的落後 7 個月也差不了多少。DeepSeek 之前在研究報告中也指出過國內產 AI 大模型面臨的問題,一方面是算力的差距,一方面是世界知識的差距,最終都要燒錢去買 AI 算力資源,國內外公司還面臨著各種專利、制裁等環境。

這就導致了兩邊的基礎就不平等,DeepSeek V4 的 Pro 大模型也僅 1.6 萬億參數量,而 Opus 4.6、GPT 5.5 被認為是 5 萬億乃至 10 萬億級別的參數量,雙方的體量就無法比,性能有差距才是正常的。好消息是無論算力還是世界知識,這兩方面國內外公司還是在快速進步的,所謂實際實力的落後是可以追上的,至少差距不會太大。 以下為 DeepSeek V4 與美國頂級模型參數量比較:

模型參數量(萬億)
DeepSeek V4 Pro1.6
Opus 4.6約 5-10
GPT 5.5約 5-10

不管是 3-6 個月差距還是 7 個月差距,實際上並不能決定 DeepSeek V4 成敗與否,國內 AI 在開源及定價方面優勢很大,性能只有美國頂級大模型的十分之一乃至百分之一級別,普通人也能放心大膽用,這才是關鍵。

Rufus 4.14 版發佈 新增 Windows 11 靜默安裝模式 修復多項功能

備受矚目的開源 USB 製作工具 Rufus 近日發佈 4.14 正式版本,此前該版本已於上月進入測試階段。這次更新為 Windows 用戶帶來多項重大改進,包括靜默安裝功能、預設應用移除選項、Windows To Go 修復以及本地帳戶問題修復等。新版本引入無人值守「靜默」安裝模式,允許 Windows 系統自動部署至首位偵測到的磁碟上,無需用戶輸入任何資訊。

此功能主要針對高級用戶及深度玩家,能實現更快、更免人工干預的系統安裝過程。同時,更新新增在安裝過程中禁用特定Microsoft預設應用的選項,包括 Teams、Outlook 和 Copilot 等。對於不需要這些應用的用戶而言,此更新能加快電腦啟動速度,尤其有利於在低端硬件上運行 Windows 11 的用戶。

UEFI:NTFS 分區標籤改進與 Windows To Go 修復

此次更新透過強化 UEFI:NTFS 分區標籤,提升了 Windows 安裝過程的安全性。UEFI:NTFS 是一個輕量級引導載入程式,可讓 UEFI 系統從 NTFS 或 exFAT 分區啟動,即便硬件僅支援 FAT32 格式。它透過小型 FAT 分區載入 NTFS 驅動程式,隨後將控制權轉移至 NTFS 分區上的引導檔案,從而繞過傳統檔案大小及檔案系統限制。

更新還解決了新版 BCDBoot 導致的 Windows 11 25H2 版本 Windows To Go 介質建立錯誤。Windows To Go 是一項系統功能,允許從 USB 設備運行 Windows 系統,而 BCDBoot 則是命令行實用程式,用於配置引導檔案或引導配置資料。此外,本次更新修復了以空格字元開頭或結尾的本地帳戶建立時會導致的問題。 除了針對 Windows 的改進外,Rufus 4.

14 為所有對話框選項新增工具提示,改善用戶嘗試使用目標驅動器時的錯誤提示資訊,並增加對 El-Torito UEFI 鏡像提取的有限支援,主要用於戴爾 BIOS 更新 ISO 檔案。更新亦改善對新版 Bitdefender 隱藏虛擬磁碟的偵測及排除功能,因之前版本無法正確過濾這些檔案。下載地址:https://github.com/pbatard/rufus/releases/tag/v4.

14 https://rufus.ie/downloads/

Omdia 指 2026 年首季全球智能手機出貨量升 1% Samsung Apple 領先

市場研究機構 Omdia 最新報告顯示,在持續晶片短缺的背景下,2026 年第一季度全球智能手機出貨量預計僅同比增長 1%,總出貨量達到 2.985 億部。增長的主要動力來自廠商的「供應端預置」策略,即在元器件成本上升前,提前向渠道大規模壓貨,以鎖定相對有利的成本並確保供應。

品牌出貨排名與表現

從品牌表現來看,Samsung 重奪全球智能手機出貨量首位,一季度出貨量達 6540 萬部,同比增長 8%,市佔率約 22%。得益於需求強勁的 Galaxy S26 系列,以及近期上市的 Galaxy A37 和 Galaxy A57,從中高階到中階產品線齊拉動整體銷量。 Apple 以 6040 萬部的出貨成績位列第二,出貨量同比增長 10%,預計佔全球約 20% 市佔率。

報告指出,iPhone 17 系列整體需求保持強勁,其中 iPhone 17e 在歐洲和日本用戶市場反應高於預期。同時,摺疊機型 iPhone 17 Pro 和 17 Pro Max 在中國市場的需求較前代實現約 42% 顯著增長,進一步鞏固了 Apple 在高階市場的話語權。 小米(包括 Redmi 和 Poco 品牌)排名第三,一季度出貨量為 3380 萬部,對應約 11% 市佔率。

不過,在前五大廠商中,小米 Xiaomi 也是出貨量同比降幅最大的一家,年減幅達 19%,元器件成本上升對其利潤空間構成明顯壓力。 OPPO(包括 OnePlus 和 realme)以 3070 萬部出貨量位居第四,市佔率約 10%。vivo 則以 2130 萬部出貨量排名第五,市佔率約 7%。 展望後市,Omdia 分析師認為,供應端的「搶單」將為接下來的幾個季度帶來一定波動和調整壓力。

當前渠道庫存水位偏高,而終端消費需求普遍偏弱,將成為影響 2026 年下半年全球智能手機市場走勢的關鍵因素。報告提醒,短期內廠商可能需要在去庫存與維持利潤之間尋找新的平衡點,以應對不確定的市場前景。

55 歲老玩家因女兒話語重拾遊戲 指《Pragmata》女角似已故女兒

卡普空新作《知性存在》(Pragmata)近日在社交媒體上引發熱議。除了遊戲本身的黑客射擊玩法與獨特畫風,一位老玩家分享的親身經歷,讓這款作品在核心遊戲圈以外也產生強烈共鳴。這位網名為 TheRealDuke777 的玩家現年 55 歲,他在 Reddit 社群發帖稱,自己大學畢業後的 30 年內完全脫離電子遊戲。讓他重新拿起手柄的契機,是家庭的變故與喪女之痛。

2009 年,他年僅 8 歲的小女兒 McKenzie Erin 因先天性心臟問題引發感染不幸離世,這一打擊讓他沉淪在長達十數年的陰影中。直到 2024 年,在他 9 歲的小女兒 Ella 的鼓勵下,他才透過《狼群之夜》重新嘗試接觸遊戲,並隨後體驗了《浩格瓦之遺》與《死亡擱淺:救贖 2》。

預告片喚醒父女深層情感

真正讓這位老兵對《知性存在》產生特殊感觸的,是其預告片。在觀看影片時,小女兒 Ella 突然對他說,遊戲裡的女主角瑪莉安娜(Diana)長得非常像已故姐姐 McKenzie。正因這句話,他決定購買這款遊戲,並與 Ella 一起展開這段虛擬冒險。他在帖中坦言,在遊戲中與瑪莉安娜這一角色相處時,他彷彿能在其身上看到兩個女兒的重疊影像,這種體驗對他而言不僅是娛樂,更是一種心靈層面的「靈魂撫慰」。

這段故事在 Reddit 發佈後迅速傳播,吸引大批玩家留言致敬,許多熱心網友專門為他列出《雙人成行》、《替身:雙子辯說》等適合父女同樂的遊戲單。遊戲總監塚本容咲(Cho Yong-hee)在個人社交平台轉發了這一報導,並以「謝謝你(ありがとうございます)」作為回應。開發團隊透過細膩的人設,在無意間填補了一位父親心中長達 15 年的情感空洞,在核心的數位與程式背後,遊戲意外鏈接現實情感、探討生死的社會價值。

對開發者而言,成功或許可就在於這種來自玩家靈魂深處的認可。

NVIDIA RTX 3060 12GB 6 月復產 7 月上市 中國 2,000-2,500 元價位

根據博板最新消息,NVIDIA RTX 3060 12GB 系列晶片將於今年 6 月恢復生產,相關晶片即將陸續到貨。這批晶片主要面向各 AIC 產品廠商分銷,預計 7 月左右,各大產品品牌將啟動基於該晶片的顯卡量產,並陸續向市場推出現貨產品。七彩虹、華碩、微星、影馳等主要 AIC 產品商均會分配到一定數量的貨源,但各家實際配額存在差異,整體供應量相對有限。

RTX 3060 12GB 規格一覽

規格項目細節
顯示記憶體12GB GDDR6
架構Ampere
CUDA 核心3584 個
基礎時脈1320 MHz
加速時脈1777 MHz
TDP170 W
介面PCIe 4.0 x16

RTX 3060 12GB 是 NVIDIA 史上銷量最高的顯卡系列之一,憑藉 12GB 大顯存和出色的性價比,在 1080P 和 2K 遊戲市場一直擁有穩固的用戶基礎。這次復產並非單純的庫存清理,而是 NVIDIA 針對當前市場需求的策略性調整。在 2000-2500 元人民幣,約 HK$2180-2725 的價位區間,消費者對性能穩定、顯存充足且價格合理的顯卡需求尤其迫切。

不過,從成本端來看,RTX 3060 12GB 的物料成本較高,預估終端定價不會太低,與 RTX 5050、5060 相比,無論在性價比還是絕對性能上,復產的 RTX 3060 12GB 均存在一定優勢。綜合來看,這批 RTX 3060 12GB 的重新上市,將在一定程度上緩解中低端顯卡市場的供應壓力。如果終端定價合理且市場反應良好,不排除 NVIDIA 考慮更多經典型號復產的可能性;反之,若市場反應冷淡,則可能加速 NVIDIA 向新一代產品的全面過渡。

研究顯示早期人類主動避開瘧疾高風險區 改變遷徙路徑及演化格局

一項最新研究顯示,早期的現代人於數萬年前主動避開疟疾高風險地區,這不僅改變了他們的遷徙與定居路徑,亦深刻重塑了人類演化史上的種群格局與基因多樣性。研究由馬普地編人類學研究所、劍橋大學及多個機構合作完成,相關成果已刊登於《Science Advances》雜誌。 長期以來,科學界普遍認同,現代人並非源自非洲某單一「搖籃」,而是來自散佈於非洲各地、彼此聯繫且更為多樣的數個人群「拼圖」。

過往解釋多將氣候變化視為主導因素,用以說明這些人群何時、在何處定居以及如何互動。最新研究則指出,疟疾等傳染病同樣是塑造早期人類地理分佈與演化格局的重要力量。 疟疾是一種由按蚊傳播的寄生蟲性疾病,主要病原體為惡性瘧原蟲,可引致發熱、貧血乃至嚴重併發症,對人群結構構成強烈且持續的選擇壓力。研究團隊聚焦距今約 7.4 萬年至 5000 年前的關鍵時段——這時期既早於人類大規模走出非洲,亦早於農業出現徹底改變疟疾傳播態勢。

模擬疟疾風險重塑人類生境

為評估疟疾對人類分佈的長期影響,研究人員建構三大人類主要按蚊複合種群的物種分佈模型,並結合古氣候模擬與考古數據,估算不同時段東非至南非的潛在疟疾傳播風險。隨後,他們將此風險地圖與重建的人類「生境位」進行對比分析,以觀察人類活動範圍與高風險區域間的空間關係。 結果顯示,於過去至少 7.4 萬年,人類活動範圍內的疟疾風險水平明顯低於周邊地區,顯示人類「避開」高風險地帶。

研究指出,這意味著在人類歷史早期,高疟疾風險地區難以維持穩定的群體落腳,要嘛被有意規避,從而在地理上「隔開」不同群體。 這種看似零散的分離效應,在漫長時間尺度上深刻影響人群間的接觸、基因交流與遷徙路徑,最終促成今日人類所呈現的種群結構與遺傳多樣性格局。換言之,疟疾不僅是早期人類面臨的健康威脅,更是推動人類演化進程的一股隱性驅動力。 論文通訊作者、劍橋大學的安德烈亞·馬尼卡(Andrea Manica)教授表示,疟疾透過將人類社會「分裂」至不同景觀單元,參與塑造了現代人類的空間組織方式與種群結構。

在此框架下,氣候與地形等傳統因素已不足以單獨解釋人類能定居何處,傳染病風險同樣是決定人群生存空間邊界的關鍵要素。 來自馬普地編人類學研究所的埃莉諾·斯凱里(Eleanor Scerri)教授指出,此研究為理解人類演化開闢全新視角。在缺乏對應時期的古病原體基因組數據情況下,人們往往低估了疾病在我們「深層歷史」中的作用。最新成果透過環境建模與人類生境位重建的相結合,為系統探討疾病與人類演化的關係提供新框架。

研究團隊認為,隨著更多古環境與古 DNA 數據的積累,未來有望進一步分析疟疾等傳染病如何在不同地區、不同時間尺度上影響人類遷徙、落腳分佈及基因流動模式。這些工作將幫助我們更全面理解,現代人類為何以今日格局分佈於世界各地,以及疾病在此漫長演化進程中究竟扮演何種角色。

Meta 終止 Sama 合作 Ray-Ban 智能眼鏡涉大規模隱私洩露 外包商裁逾千名員工

Meta 近日終止與外包公司 Sama 的合作關係。此前,Sama 受僱利用 Ray-Ban 智能眼鏡收集影像數據,為 Meta 的生成式 AI 系統提供訓練資料。隨後,Sama 宣布裁員 1108 名員工,其中部分員工表示,他們因向媒體揭露審查視頻涉及大量高度隱私內容而遭「報復性」解僱。事件最早於今年 2 月曝光。 位於肯亞亞的薩的 Sama 員工向兩家瑞典報紙披露,他們的工作內容包括來自智能眼鏡的視頻標記簽註,而畫面中人物往往對自己被拍攝一無所知。

這些 Ray-Ban 智能眼鏡配備 AI 助手,需要持續錄製視頻,其中一部分用作 AI 訓練數據,再由人工標註員補充完善 AI 難以理解的內容。

隱私爭議與員工待遇問題

Meta 方面表示,其服務條款已向用戶說明相關數據使用方式,且眼鏡在啟用 AI 模式前須取得用戶明確授權。然而,多名 Sama 員工指,他們接觸的畫面不僅包括銀行帳戶等金融信息、私人聊天內容,還涉及裸體畫面及親密行為場景,明顯超出公司對常規數據收集的認知界線。在媒體調查報道發佈後,Meta 宣布取消與 Sama 的合作,並稱該公司「未能達到 Meta 的標準」。

Sama 隨即回應,指未收到任何關於其工作質量「不達標」的正式反饋。 同時,有員工透露,公司在推行升級的背景下,安排他們在無事可做的狀態下「坐班」,懷疑透過內部排查來鎖定向媒體爆料的「吹哨人」。Sama 並非首次捲入 AI 相關勞工及倫理爭議。這家總部設於舊金山的外部公司曾受 OpenAI 委託,為 2022 年正式亮相的 ChatGPT 提供訓練服務。為減少聊天機器人輸出有害內容,Sama 安排肯亞員工以每日不足 US$2(約 HK$15.

6)的酬勞,長時間審查並篩除極端衝擊性的文本與影像內容,相關工作被指對員工心理健康造成明顯傷害。 同年,Meta 與 Sama 亦面臨指控,被控透過具誤導性的招聘信息招募員工、構建變相人數龐大的虛假運作,並解僱試圖建立工會的勞工。除了勞工權益問題,此事件亦再次將智能眼鏡的隱私風險推上風口浪尖。早於 Google Glass 時代,其錄製能力就因可在公眾空間進行「隱形監控」而遭強烈反對。

如今,Meta 以更低調、貼近日常眼鏡外形的產品「重啟」這一品類後,仍有用戶被拍攝於法庭審訊過程中,也有人在警務行動中啟用錄製,更有學生被發現於考試中作弊使用智能眼鏡。 在可穿戴設備持續升溫的背景下,其他科技巨頭亦在加速佈局。報道指,Apple 公司目前正測試多達四種智能眼鏡設計方案,意圖在未來與 Meta 的 Ray-Ban 產品正面競爭。在 AI 與感測設備深度融合的趨勢下,如何在創新體驗與個人隱私、勞工權益之間取得平衡,正成為科技行業繞不開的核心難題。

追蹤科技 CEO 鄭浩回應全體員工開通社媒帳號:否認商業化 稱助 AI 時代能力訓練

科際科技(Science and Technology)CEO 張偉最近針對備受爭議的「要求全體員工開通社交媒體帳戶」一事作出正面回應。他明確表示,此舉核心在於發掘員工的綜合能力,助力團隊在 AI 時代維持競爭優勢,並公布已向首批達成目標的員工頒發現金獎勵。 據內部通告,張偉要求公司逾兩萬名員工均需在各大社交平台開通帳戶,並規定每人每天投入 15 分鐘拍攝影片,每日發佈 3 條內容,主要圍繞產品賣點、核心技術及創新點進行推廣。

張偉認為,科技人員雖擅長處理複雜參數,但在通俗化表達及用戶溝通上普遍存在短板。透過運營個人帳戶,員工可學習如何「講人話」,將深奧技術轉化為大眾易懂語言,並在互動中獲取反饋。

獎勵機制與初步成效

為配合該計劃推進,科際科技設立明確激勵機制:

粉絲數達成獎金
1 萬1 萬元人民幣,約 HK$10,900
5 萬5 萬元人民幣,約 HK$54,500
10 萬10 萬元人民幣,約 HK$109,000

張偉透過社交平台透露,目前已有兩名員工粉絲數破萬,各獲 1 萬元獎金。 針對外界對「全員工營銷」及「微商化」的質疑,張偉反駁稱,AI 時代單一能力極易被取代,掌握跨領域綜合能力的人才更能有效駕馭複雜系統。他強調,公司並非單純追求高粉絲量,而是看重員工在原有專業技能上發揮的表達與互動能力。他呼籲外界勿恐於看似不合理的規定,認為這是提升企業整體競爭力的重要嘗試。

Samsung 或成 Apple iPhone 18 系列唯一 OLED 屏幕供應商

Samsung 一直為所有配備 OLED 顯示屏的 Apple 智能手機提供面板,從首款引入該技術的 iPhone X 到最新的 iPhone 17 系列。不過,這家韓國科技巨頭並非一直都是唯一供應商;iPhone X 系列是例外,當時 Samsung 是獨家供應方。位於 Cupertino 的 Apple 亦曾從其他廠商如 LG Display 和 BOE 採購 OLED 面板,以減低供應鏈風險。

iPhone 18 系列或獨採 Samsung OLED

不過,Samsung 可能成為 Apple 下一代產品 iPhone 18 系列的獨家 OLED 供應商,這款系列預計將慶祝 iPhone 20 週年。據 The Korea Herald 新聞報道,Apple 或將 iPhone 18 系列的顯示屏全部向 Samsung 採購。若成真,這將是自 iPhone X 以來,Apple 首次將整個 OLED 面板供應交託單一廠商。

最近,一位爆料人士指 Apple 已要求 Samsung 為 iPhone 18 系列開發無偏光片且四邊曲面 OLED 面板。為免使用偏光片,Samsung 需採用其已掌握的顏色濾鏡封裝(COE)技術。不過,業界專家認為,此類顯示屏或未能及時投入量產。

Huawei Nova 15 Max 泰國發佈 配 8,500mAh 電池

華為正式確認推出全新 Nova 15 系列機款 Nova 15 Max,並將於泰國舉辦發佈活動。該機型設計相較 Nova 15 系列其他成員有所更新,華為已在 X 平台分享相關圖片及主要規格。其中最引人注目的是搭載 8,500mAh 大容量電池,後置 50MP RYYB 相機,並配備立體雙聲道揚聲器。圖片顯示 Nova 15 Max 可能提供三款顏色選擇,但暫無更多細節公開。

規格一覽

規格項目詳細內容
螢幕6.84 吋 AMOLED
處理器Kirin 8000
電池容量8,500mAh(支援 40W 快充)
後置相機50MP RYYB 主鏡頭
前置相機8MP

從設計及已確認規格來看,Nova 15 Max 疑似中國市場上月發佈的 Enjoy 90 Pro Max 改款版本。此前,華為已在中國於 2025 年 12 月推出 Nova 15、Nova 15 Pro 及 Nova 15 Ultra。

《時代》雜誌預測 2026 年十大最具影響力 AI 公司 字節跳動、阿里雲、智譜上榜

《時代》雜誌本週發佈的 2026 年十大最具影響力 AI 公司(The 10 Most Influential AI Companies of 2026)榜單中,字節跳動、阿里雲及智譜上榜。除了三家中國公司外,兩大 AI 明星初創公司 OpenAI 及 Anthropic、Alphabet(Google 母公司)、Amazon、Meta 三家美國科技巨頭,以及歐洲「AI 全村希望」Mistral 和開源模型平台 Hugging Face 亦榜上有名。

(來源:TIME)

中國科技巨頭 AI 成就備受肯定

對於字節跳動及阿里雲,《時代》雜誌特別強調它們在既有業務之外,在 AI 領域取得的成就。對於字節跳動,《時代》評價指,其業務樞紐仍是月活躍用戶約 7.7 億的抖音,但公司未來方向轉向 AI 助手「豆包」。其周活躍用戶已超過 1.55 億,並在今年 2 月春節期間單日活躍用戶突破 1 億,使中國成為全球最早實現 AI 助手大規模普及的國家之一。 阿里雲上榜原因,則在於不到三年時間內,成為「全球開源 AI 的核心力量之一」。

《時代》指出,阿里旗下「通義」系列模型累計下載量超過 10 億次,並衍生出超過 20 萬個派生模型,影響力早已超出中國市場,成為全球最受歡迎開源模型家族之一。《時代》進一步表示,中國科技巨頭正試圖將其開源模型領先優勢打造成一個全球 AI 絲路。 智譜的上榜,不僅與其「全球大模型第一股」有關,更與中國前沿大模型及中國國產算力平台的相互成就有關。公司今年推出旗艦開源大模型 GLM-5,以及完全基於國產設備全流程構建的圖像生成模型 GLM-Image。

其中 GLM-5 在多項基準測試中性能與 Google、OpenAI 及 Anthropic 的旗艦大模型相當。《時代》評論指,智譜的成就顯示中國 AI 開發者可在不依賴任何西方技術的情況下參與前沿競爭。 其他上榜公司評語:OpenAI:令人咋舌的估值增長速度,儘管面臨激烈競爭,仍是推動 AI 部署步伐的領頭羊。Anthropic:與美國政府有關 Claude 模型使用方式的爭端,或令這家 AI 實驗室變得更強大。

Alphabet(Google):十年前就開始構建「人工智慧優勢」景觀,依賴 DeepMind 技術積累與 Gmail、YouTube、Waymo 等級入口,構建全球最廣覆蓋的全棧 AI 服務體系。Amazon:電商巨頭正成為人工智慧基礎的核心玩家。透過 Trainium 芯片與超大規模算力叢集佈局,爭奪 AI 時代最關鍵的基礎設施控制權。Meta:依賴全球最大社交數據資產,持續推動 AI 在廣告與內容生成場景變革行業風向標。

Mistral AI:作為歐洲 AI 行業代表,正成為歐洲政府和企業取代美國 AI 供應商的選擇。Hugging Face:公司運營著全球最大公開 AI 模型、數據集和應用儲庫。最新數據超過 200 萬個模型和 50 萬個數據集,使其有點像 AI 領軍者的 GitHub。超過 30% 的財富 500 強公司在該平台上有賬號。除了 AI 模型,Hugging Face 還積極進軍 AI 代理和機器人領域。

| 公司 | 關鍵成就 | |——|———-| | OpenAI | 估值增長迅速,推動 AI 部署領先 | | Anthropic | Claude 模型爭端或強化其實力 | | Alphabet (Google) | 全棧 AI 服務體系廣泛覆蓋 | | Amazon | Trainium 芯片與算力叢集佈局 | | Meta | 社交數據推動廣告內容革新 |

| Mistral AI | 歐洲 AI 替代美國供應商選擇 | | Hugging Face | 超過 200 萬模型及 50 萬數據集儲庫 |

美國國家安全局測試Samsung Mythos模型 針對AI安全性能深度評估

據一名美國官員及另一名知情人士透露,美國國家安全局(NSA)一直測試 Anthropic PBC 新的人工智能模型在流行軟件中發現網絡安全漏洞的能力,其中包括自家產品。這名官員及這名知情人士表示,研究人員對 Mythos 模型的國家安全局官員搜尋潛在安全漏洞的速度及效率印象深刻。兩人均未獲授權公開討論此事,故要求匿名。 國家安全局在美國網絡間諜活動中處於核心地位,其內部人員形成的印象進一步表明,已在華盛頓華爾街領導層中引發對 Mythos 模型威脅強大的安全疑慮。

Anthropic 最初向少數機構發佈 Mythos,並強調它們優於黑客,利用這項技術找出其系統中的軟件缺陷。

發佈計劃生變

上週三新聞報導指,該公司高層在確認黑客能利用 Mythos 後,決定不向公眾發佈這一模型,而白宮亦反對該公司再向大約 70 家機構提供使用權限的計劃。美國國家安全局及 Anthropic 的發言人均拒絕置評。

DeepSeek GitHub 發佈多模態推理模型及技術報告

DeepSeek 在 GitHub 發佈了多模態推理模型及技術報告,標題為《Thinking with Visual Primitives(以視覺原語思考)》。該模型基於 DeepSeek V4-Flash(284B 總參數、推理時激活 13B 的 MoE 架構)構建,提出一種全新的多模態推理範式。報告指出,現有大型多模態模型存在一個被忽略的基本性瓶頸:「指代鴻溝」(Reference Gap),即模型能「看見」圖像內容,但在推理過程中用自身語言構建思維鏈時,無法精確對應左邊那個大而近中央的紅色

物體在密集場景中的位置視角對象,導致注意力偏移並得出錯誤結論。此前學界主流應對方向是提升感知分辨率,但報告認為「看見」和「能說」本質上是兩件事。

視覺原語推理核心創新

該模型的核心創新在於將點座標和邊界框嵌入推理過程本身,使其成為思維鏈的基本元素。模型在推理時每提取一個視覺對象,就同步輸出其座標。例如:「找到一隻熊 [452,23,804,411],正爬樹,排除,再往左下看,找到另一隻 [50,447,647,771],站在岩石邊緣,符合條件。」座標不再是事後標註的答案,而是推理過程中消除歧義的空間錨點。 以下為模型規格比較表:

模型總參數激活參數756×756 圖像視覺 KV 項目
DeepSeek V4-Flash284B13B (MoE)81
Claude Sonnet 4.6約 870
Gemini-3-Flash約 1100

架構層面,模型實現 7056 倍視覺壓縮,一張 756×756 圖像經 ViT 處理後生成 2916 個圖像塊 token,經 3×3 空間壓縮合併為 324 個 token,再通過壓縮稀疏注意力(CSA)機制將 KV 緩存進一步壓縮 4 倍,最終剩 81 個視覺 KV 項目。 訓練數據方面,團隊從近 10 萬個目標檢測數據集中篩選約 3.17 萬個高質量數據源,生成超過 4000 萬條訓練樣本,涵蓋計數、空間推理、迷宮導航和路徑追蹤四類任務。

後訓練採用先專家化、後統一個籠策略,分別訓練邊界框和點座標兩個專家人數模型,經強化學習迭代優化後通過在線籠統蒸餾合併為統一個模型。 實驗結果在 11 個基準測試上與 Gemini-3-Flash、GPT-5.4、Claude Sonnet 4.6 等主流模型對比。計數任務上,Pixmo-Count 精確匹配得分 89.2%,超越 Gemini-3-Flash 的 88.

2%,大幅領先 GPT-5.4 的 76.6% 和 Claude Sonnet 4.6 的 68.7%。最具代表性的差異出現在具身推理上:迷宮導航得分 66.9%,GPT-5.4 為 50.6%、Gemini-3-Flash 為 49.4%、Claude Sonnet 4.6 為 48.9%,提升約 17 個百分點;路徑追蹤得分 56.7%,GPT-5.4 為 46.

5%。報告同時指出當前局限性:模型需明確觸發詞才會啟用視覺原語機制,極細粒度場景下座標精確度有局限,跨場景泛化能力仍有提升空間。

TCL 創辦人李東生訪 Sony 推進家用娛樂業務全球整合

TCL 創始人兼董事長李東生率管理團隊日前拜訪 Sony 集團,與 Sony 集團總裁兼代理代表執行董事十時裕樹舉行董事會特別會議,雙方圍繞新建合資公司未來走勢進行實質溝通。此次高層互訪聚焦落實雙方在家電娛樂業務領域的全球整合細節。此次會議除推進雙方此前初步合資協議的重要一環外,也為未來合作奠基。2026 年 3 月 31 日,TCL 電子與 Sony 正式簽約,擬組建合資公司全面接管 Sony 全球家電娛樂業務,包括電視、音響等核心產品線。

李東生在會上通報綜合進度,指出雙方目前正加速在產品平台、供應鏈與製造體系三個維度的協同工作。據悉,該合資公司已初步確立中長期戰略方向,將核心目標鎖定在業務結構優化及高端市場佈局。

雙方高層共商全球競爭力提升

針對業務交接與未來運營,十時裕樹透露,合資項目目前已收到全球銷售體系及終端客戶的積極反饋。雙方管理層一致認同,此次業務整合旨在發掘各自在技術儲備與製造規模上的互補優勢,以期提升在全球市場的綜合競爭力。此次會議的高管還包括 Sony 方面的資深副總裁田中健二、Sony 電子副董事長木井一壽,以及 TCL 方面的通力科技股份 CEO 于廣儉、TCL 電子 CEO 盧曉勇等。

雙方強調,將持續深化合作,推動家電娛樂業務的全球擴張與創新。

Anthropic 融資估值達 9,000 億美元 Claude 美國下載量超 ChatGPT

Anthropic 正在洽談新一輪融資,估值有望突破 900 億美元,約 HK$7020 億。若交易成真,這家成立不到 4 年嘅公司將超越 OpenAI,成為全球最貴嘅 AI 獨角獸。900 億美元呢個數字意味住乜?放喺 A 股,佢比最貴嘅遊戲公司市值仲高;放喺矽谷,佢一腳踢翻 OpenAI 苦心經營咗十載嘅估值王座。更令人咋舌嘅係時間線:幾個月前,Anthropic 估值仲只係 600 億美元。

Google 同 Amazon 先後以 350 億美元估值注資,合共投咗高達 650 億美元。由 600 億到 900 億,不到一年,飆升 15 倍。 資本嘅瘋狂唔止講笑。當全球最精明嘅金主一窩蜂湧向同一個方向,背後一定有東西南北變咗。變化係乜?答案指向市場數據——根據 Sensor Tower 數據,ChatGPT 今個 4 月下載量同比增 132%。上個月更猛,同比升 413%,單月下載量暴增 563%。

同一時期,Claude 下載量一週激增 199%。喺多個國家,Claude 衝上 iPhone 免費應用排行榜頂峰。喺美國,Claude 單日下載量首次超過 ChatGPT。2 月 28 日,呢個應用衝上美國 App Store 免費榜首,並維持到 3 月 2 日,短短一週排名急升 20 多位。Claude 仲喺巴西、加拿大、德國、瑞典、挪威同瑞士嘅 iPhone 免費榜登頂。

OpenAI 內憂外患:Stargate 計劃水土不服

表面睇,OpenAI 依舊龐大。GPT 系列坐擁億萬用戶,Codex 剛掀起新一輪熱潮,Stargate 項目標榜要投 5000 億美元建算力基建。但美國嘅麻煩,往往先從內部爆發。如果用戶流失係皮肉之痛,咁 Stargate 嘅縮水就係斷腕之痛。據媒體調查,Stargate 項目實際進展遠不如 PPT 咁光鮮。5000 億美元、10 座核電站、人類通往未來嘅唯一道路——如今變咗一灘縮水嘅租賃合約。

英國項目停咗,挪威項目爛咗,德國巴伐利亞嘅浮動基地放棄咗。奧特曼話呢叫「靈活心態」,合作夥伴話呢叫「過河拆橋」。軟銀喺怒火、甲骨文喺算帳、Microsoft喺廢墟邊默默撿漏。 呢啲背後嘅潛台詞再清晰不過:當 OpenAI 開始推卸基建責任,佢就失去對物理世界嘅控制力。資金到位緩慢、算力中心選址、合作方協調——每個環節都喺磨。同時,OpenAI 正經歷一場靜默嘅人才流失。Dario Amodei——Anthropic 創辦人兼 CEO——本係 OpenAI 前研究副總裁。

佢帶走唔止自己,仲有一批 OpenAI 最核心嘅安全研究員。離開 OpenAI 時,佢直言:「與其留低嚟爭論別人嘅願景,不如帶上你信任嘅人,去實現自己嘅願景。」呢種出走未有停歇。過去兩年,OpenAI 對手團隊、安全團隊持續有魔鬼湧向 Anthropic。 一間公司最值錢嘅資產係乜?唔係用戶數,唔係估值,係嗰群能定義下一代模型嘅人。當呢群人選擇離開,方向就係答案。

Anthropic 由「安全實驗室」蛻變成「最貴獨角獸」,起家路徑同矽谷常規完全唔同。佢唔係燒錢搶用戶起家。起點係一篇關於 AI 安全嘅論文,賣點係「Constitutional AI」——用憲法約束模型行為。長時間,矽谷主流看法係:呢啲太理想主義,做唔大。之後,Claude 3.5 Sonnet 發佈。編程能力壓過 GPT-4o,長上下文化理解領先,幻覺率大幅降低。

開發者社區風向一夜轉變。Reddit、Hacker News、X 上到處都係同一句話:「我取消 ChatGPT Plus,換 Claude 咗。」唔係一個人咁講,係成千上萬人咁講。 更關鍵係企業端。AWS 上 Claude API 調用量過去半年翻咗唔止一倍。越來越多企業客戶開始將核心業務從 GPT 遷移到 Claude——唔係因為方便,而係因為好用。Google 睇到呢點,所以砸錢;Amazon 睇到呢點,所以都砸錢。

兩家巨頭合共 650 億美元,賭嘅唔係 Anthropic 嘅現在,而係佢定義下一代 AI 能力。 但 OpenAI 真係輸晒?先別急住寫輓志。GPT-5 系列迭代速度驚人。5.5 剛落地,後台日誌就冒出 5.6 影子。Codex 作為智能體工廠正全面起飛,開發者生態嘅護城河唔係一朝一夕攻破嘅。OpenAI 另一底牌係規模。億萬月活用戶、與Microsoft深度綁定、遍佈全球企業客戶——呢啲存量優勢唔會因為一輪融資新聞就蒸發。

歷史上,估值超越唔等於勝負已定。2012 年 Facebook 上市時,好多人覺得 Google 社交夢碎咗。十年後再睇,Google 搜索王國從未真係受威脅。AI 競爭嘅殘酷之處在於:今日嘅王座,下輪模型發佈後可能就唔作數。 拉遠視角,呢唔係一場「邊個贏邊個輸」嘅事,而係「AI 行業權力結構正被重寫」嘅事。兩年前,OpenAI 係唯一巨星。一年前,Google Gemini 開始追趕。

今天,Anthropic 衝到估值第一位。與此同時,xAI 喺燒錢、Meta 喺開源、開源 AI 喺追趕。贏家唔再得一個。AI 正從「一超獨霸」走向「群雄割據」。而喺呢場亂戰中,真係決定勝負嘅變量得一個——邊個先做出下一代模型。唔係邊個 PPT 更好睇,唔係邊個融資更多。AI 唔係魔法,係重工業。佢需要天文數字嘅電費、絕對嘅信譽、冷靜嘅財政紀律。Anthropic 嘅 9000 億估值,本質上係市場押注:下一個「iPhone 時刻」,可能唔喺 OpenAI 手上。

Elon Musk結作證指 Altman 曾保證 OpenAI 維持非營利

Elon Musk 結束了他在 OpenAI 訴訟中的作證。周四,他連續第三天出庭作證,並進行更長時間的陳述,試圖推動法院阻止 OpenAI 向營利性公司的轉型。 ### 法庭作證焦點 Elon Musk 正在起訴 OpenAI,指控該公司及其聯席創辦人兼 CEO Sam Altman、總裁 Greg Brockman 透過欺詐建立一個優先保障 AI 安全發展的非營利組織,從而獲得他 3800 萬美元的贊助及個人幫助,之後卻轉而創建營利性實體以攫取私利。

周四氣氛緊張的交叉詰問中,Elon Musk 作證稱,他當時知曉 OpenAI 轉型為營利性公司的早期討論,但曾從 Sam Altman 那裡得到保證,該組織將繼續維持非營利性質。 OpenAI、Sam Altman 及 Greg Brockman 的律師 William Savitt 在交叉詰問中追問 Elon Musk,是否閱讀過 Sam Altman 在 2017 年 8 月 31 日轉發的一份文件,該文件涉及 OpenAI 從非營利組織向受非營利機構監督的營利性結構轉型。

「我的陳述是,我沒有細讀,只看了標題。」Elon Musk 表示,他身穿深藍西裝、深藍領帶及白襯衫。有時,Elon Musk 對 William Savitt 的交叉詰問表達不滿。「很少有回答是完整的,特別是你總是打斷我的思路。」Elon Musk 說。 美國地區法官方 Yvonne Gonzalez Rogers 後來訓斥 William Savitt,原因是沒有讓 Elon Musk 完整回答問題,但同時回擊 Elon Musk 關於該律師「帶導性提問」的指控。

Elon Musk 被問及為何沒有更早起訴 OpenAI,以及他為何沒有察覺該公司會轉型為營利性實體。William Savitt 指出,其餘 OpenAI 創辦人曾向 Elon Musk 發送電郵,討論在某階段將 OpenAI 技術封閉或透過其盈利的可行性。「Sam Altman 和其他人向我保證,OpenAI 將繼續作為非營利組織運營。」Elon Musk 說。

Elon Musk 向法庭表示,現時的營利性公司已擁有 OpenAI 的資產。「這個營利性實體剝奪了絕大部分價值。它已經拿走了非營利組織的絕大部分價值。」Elon Musk 表達。在詰問中,Elon Musk 還承認他的公司 xAI 使用 OpenAI 來訓練其模型,並補充說:「使用其他 AI 來驗證自己的 AI,這是行業的標準做法。」Sam Altman 及 Greg Brockman 在 Elon Musk 作證的大部分時間裡坐在法庭內,神情專注地聆聽。

在接受兩個多小時的詰問後,Elon Musk 被允許退庭,隨後他的高級助手 Jared Birchall 出庭作證。

法國零售商 LDLC 售受損 RTX 5090 顯示卡 半價不設退貨

法國電子產品零售商 LDLC 近日上架一批瑕疵版 NVIDIA GeForce RTX 5090 顯示卡,售價介乎 1499 至 1699 歐元,約 HK$11692 至 HK$13242。目前上架的兩款分別為華碩 RTX 5090 TUF Gaming(1499 歐元,約 HK$11692)及微星 RTX 5090 Ventus 3X OC(1699 歐元,約 HK$13242),並明確標示售出後不退不換。

瑕疵產品規格與狀況

| 型號 | 售價(歐元,約 HK$) | 狀況描述 | |———————–|——————————-|———————————–| | 華碩 RTX 5090 TUF Gaming | 1499,約 HK$11692 | 外殼損壞,核心組件完整

| | 微星 RTX 5090 Ventus 3X OC | 1699,約 HK$13242 | 外殼損壞,核心組件完整 | 作為參考,同家零售商全新 RTX 5090 的起售價為 3249 歐元,而全新 RTX 5080 的售價亦在 1499 至 1699 歐元區間,即一張完全無法使用的瑕疵 5090,價格等同全新 5080。

LDLC 在產品頁面明確標註,這些顯示卡屬「非功能性產品」,損壞源於物流運輸過程中的物理損傷,可能包括 PCB 斷裂、撞擊變形等。 不過商家同時確認,顯示卡所有核心組件(GPU、顯示記憶體、VRM 供電等)均完整存在,受損前測試正常,且未經拆解。售出後條款更為嚴格,由於產品已明確標註為非功能性,購買後不接受任何退貨或換貨,LDLC 表示此類產品面向具備維修能力或組件回收需求的專業人士。

事實上,此類殘次顯示卡在國際市場亦可找到,且價格通常低得多,但往往存在核心組件被拆除的風險,GPU 晶片及顯示記憶體顆粒可能已被取走,購買者需自行處理。

調查指 41% 玩家因獨佔遊戲選購主機

過去數年,各大遊戲公司反覆宣稱「獨佔時代即將結束」,但最新行業分析顯示,獨特的第一方遊戲仍是玩家選購主機的主要驅動力。根據 Circana 研究機構數據,2026 年第一季度,約 41% 的受訪玩家將「獨佔遊戲」列為自己選擇特定平台的主要原因。雖然這一比例較去年下降 8 個百分點,但仍遠超其他因素,穩居首位。 排在第二位的選購理由是「朋友和家人使用同一主機」,突顯社交關係在遊戲體驗中的重要性。

由此可見,獨佔內容仍是相當一部分玩家決策的核心。

獨佔吸引力未減

分析師指出,儘管SONY積極將第一方作品移植至 PC,Microsoft亦長期調整獨佔策略,但玩家對獨佔遊戲的偏好並未消退。在 PS6、下代 Xbox 及任天堂新機等未來平台的競爭中,獨佔內容仍將承載玩家的核心期待。

OpenAI Codex 升級 零人手操控 Mac 全程製作影片

OpenAI 的智能體 Codex 此次直接挑戰 Claude Code。Codex 是 OpenAI 的程式碼生成模型,支持 GitHub Copilot 等產品,已成為全球開發者不可或缺的 AI 助手。這次更新意義重大。YouTube 創作者 Mike Russell 發佈了一段實測影片,結果令人震驚。他將自己的 Mac 完全交給 OpenAI 最新升級的 Codex,讓 GPT-5.

5 操控 Adobe Audition 修復音頻、使用 Photoshop 製作封面,再用 Adobe Firefly 生成 AI 視頻。從頭到尾,人類全程零操作。這不是 Demo 或 PPT,而是一位真正創作者將生產力工具全數交付 AI 的一次實踐。 OpenAI 聯創兼總裁 Greg Brockman 直言:「Codex 人人可用,電腦任務全可搞定!」的確,一個寫程式碼的工具,突然要搶走所有人的鍵盤。

AI 大 V 數萬表示,一下午、一句話,Codex 就幫自己開發了一款完整遊戲。最驚人的是 Codex 處理素材的方式:他提供了一個包含上千張圖片的素材夾,並未說明篩選方法。Codex 自動將每個檔案夾的圖片整合成一張總覽圖,還帶檔案名。這一來,只看一張圖就能掌握所有素材風格,選中後直接調用檔案即可。這個操作實在令人震驚,讓他直呼 Codex 太猛了! 網友直呼,Codex 終於迎來自己的「Claude Code 高光時刻」——一個複雜的完整 Mac 應用,集成了攝影頭、麥克風、錄屏,它一次就搞

定了。用過 Codex 的網友,根本停不下來!

Codex 從程式碼助手蛻變電腦經理

過去大家對 Codex 的認知很淺——就一個寫程式碼的工具。它能幫補全函數、調試 bug、生成腳本,是程式員的副駕駛。這次升級直接把邊界炸開。OpenAI 官宣裡最核心的一句話:Codex 現支持 Slack 集成和 Google Workspace 全家桶集成。翻譯成人話就是——它不只寫程式碼,還能讀你的郵件、回 Slack 訊息、操作你的 Google Docs 和 Sheets。

這句話,讓 OpenAI 的野心藏不住:它不再把 Codex 定位為開發者工具,而是——通用電腦操控 agent。 就在昨天,Codex 突然官宣一大波更新。它能跨 Slack、Gmail、Calendar 自動總結變化、做數據分析、輔助決策。可以整理研究材料、製作電子表格和演示文稿。可數據導出、標記變更的內容,起草解讀報告。還能標準對比多個選項、跟蹤風險採取措施。

OpenAI 聯創 Greg Brockman,這位黑了 20 年終端、視代碼如生命的頂級黑客,親自宣布:「我徹底愛上 Codex App,它已取代我用了 20 年的終端。」開發者懂的,這是什麼分量。 如此強大的更新,讓奧圖曼直發帖叫道:「Codex 正在經歷 ChatGPT 時刻!」繼昨天這一大波更新後,今天清晨,OpenAI Codex 核心成員 Tibo 在 X 上發帖稱「Feeling codexy today」,預示著 Codex 又將迎來史詩級更新。

此帖一出,程式員圈瞬間沸騰! 若然,沒過多久,OpenAI 又開始放出新的 case。使用 Codex 處理日常工作,從未如此輕鬆。你可選擇你的角色,連接每天使用的應用,並試推介的提示詞。不論是調研與規格,這是文檔、演示文稿、電子表格等,Codex 都能提供幫助。Codex 會根據你的角色推介有用插件,並引導你連接各種應用程式,例如 SlackHQ、Google Workspace、Microsoft 365 等。

它如你的私人助手,可匯總來自不同應用程式和文檔的數據,規劃下一步,起草工作、組織研究,或建立項目計劃。你可一目了然地看到正在發生的實況,包含任務進度、使用文檔和工具以及接下來要做的事。從草稿到成稿,你可在 Codex 中隨時內容逐步成形進行審核。打開檔案,提出修改意見,並在同一個對話線程中不斷優化和調整。 開發者大 V 表示,Codex 和 Claude Code 非常不一樣。

如果限額即將結束,那就執行一個長時間任務,即使命額已結束,Codex 也能繼續執行這個任務,直至任務完成。這個帖直接被奧圖曼轉發。Tibo 還表示,在良好的用戶體驗和優化利潤率之間,OpenAI 選擇了前者。 甚至,OpenAI 專門放出一個官方博客指南,介紹如何在日常工作中使用 Codex。Claude Code 頭號粉絲轉向 Codex,奧圖曼 鼓掌 就在 Codex 升級的同一天,另一場好戲開演了。

在 X 上,有用戶說出自心聲:Claude Code 生成質量在最近三週明顯下滑,準確率暴跌,因此 90% 時間在用 Codex,感覺非常滿意。奧圖曼 很快出面,以星星表情回應道:「歡迎加入光明面!」 若然,又有更多開發者站出來表示,真的不喜歡用 Claude,因為它很笨拙,用戶界面總是不對盤,bug 也很多。這一次,開發者自己用腳投票了。Codex 實測太瘋狂了!

Codex App 開發人員 Andrew Ambrosino 直言:「Codex 搞定一切!」這次更新,Codex 為當前任務自動適配動態 UI,體驗更佳:

功能改進描述
幻燈片和表格體驗更佳
支持在瀏覽器、工作區和程式碼中直接標註新增
上手更簡單整體設計更簡潔
性能全面提升在 Codex 應用瀏覽器中還加了設備工具欄,讓構建和測試響應式應用變得更方便——瀏覽器使用速度(在主觀測試中約提升 30%)

不過,「大夥兒好才是真的好」,全網第一波實測已經來了。讓我們一起來瞧瞧吧!管理整台 Mac,人類全場 0 操作圍觀 Mike Russell 的實測才是這次升級最直觀的證明。他給 Codex 下了三個任務:任務一:音頻修復。一段錄音有明顯背景噪音和齒音問題。Codex 自動打開 Adobe Audition,識別噪音特徵,應用降噪濾波,調整 EQ 參數,導出成品。

Russell 事後回聽評價:「專業級修復,比我手動調還乾淨幾分。」 任務二:播客封面設計。Codex 打開 Photoshop,根據播客主題自動選配色方案、排版標題文字、調整圖層融合模式,輸出 一張 可直接上傳的封面圖。任務三:AI 視頻生成。Codex 調用 Adobe Firefly,根據文字描述生成視頻素材段,自行拼接、轉場。三個任務,跨三個 Adobe 專業軟件,全自動完成。

Russell 在視頻裡反复強調一個細節:他全過程沒碰滑鼠、沒碰鍵盤,甚至沒有切換過窗口。Codex 自己在操作系統層面完成了所有軟件間的切換和協調。「這不是 AI 在幫我工作,」Russell 說,「這是 AI 在替我工作。」 Codex 這次升級打中的不是程式員,而是所有依賴電腦工作的人。當 AI 能操控你的整台電腦,「會不會用軟件」這項技能本質上就在貶值。

當然,Russell 的實測並非完美。Firefly 生成的視頻素材有幾幀出現明顯畫面抖動,Codex 沒有自動識別並修正。Photoshop 封面的文字排版在第一次嘗試時出現字體大小不一的問題,Codex 自己發現後做了第二次調整才過關。Russell 的結論很實在:「它不是 100 分,大概 85 到 90 分。但問題是——達到這個水準它用了 8 分鐘,我自己做要 2 個小時。

」85 分乘以 8 分鐘,和 100 分乘以 2 小時。大多數場景下,前者贏。 Codex 幫你 0 成本次拍攝 網友 Matthew Berman 直接介紹如何用 Codex 限額外的拍攝產品,一個網絡連接就能轉化為完整的電商品拍圖:以前:一套電商品拍圖要 US$5,000 – 25,000,約 HK$39,000 – 195,000,耗時 4 週。現在:輸入一個 URL,10 分鐘出圖,成本為 0。

他把整套系統封裝成「品牌商拍工具箱(Brand Shoot Kit)」。它如何把一個網頁連結變成一整套電商攝影庫?只需以下 7 個 Agent(智能體)技能:人類的鍵盤,終於要閒置了? 以往,全程用手動方式調試 UI 的方式,往往非常耗心力。每次都要一點一點地檢查 AI 有沒有搞砸其他不相關的部分,這種壓力是無聲的。但如果我們能把運行時的 UI 行為測試也交給 AI 去做,那人類這邊的負擔就能得到合理減輕。

現在,Codex 終於帶來了希望!顯然,Codex,已能用滑鼠逐一檢查 UI 界面或行為是否正常——整個過程完全自動化。網友感嘆:「這感覺就好像『人們一直盼 AI 能做到的事』終於來了。」「我感覺我們正逐漸接近下一個重大轉變的臨界點。」 在視頻最後,Russell 說了這麼一句話:「當 AI 能操控你的整台電腦,會不會用軟件這項技能本質上就在貶值。」這次,Codex 打中的不是程式員,畢竟程式員早習慣了 AI 寫程式碼。

這次打中的是所有依賴電腦工作的人——做 PPT 的、寫郵件的、剪音頻的、修圖的、做報表的。以往的邏輯是,人學會用工具,工具放大人的能力。現在的邏輯開始變了:AI 學會用工具,人只需說說自己要什麼。 可以說,Codex 不是在升級功能,它是在重新定義「使用電腦」這件事的本質。在 Russell 的 45 分鐘實測裡,那台 Mac 上發生的任何事——滑鼠自己在動、軟件自己在切換、音頻自己在渲染——這畫面大概會成為 2026 年最常見的一幕。

以往人類用滑鼠調用軟件,現在 AI 用 API 調用軟件。下一步呢?不可想像。

DeepSeek 多模態研究員發佈視覺推理新論文 數小時後刪除

昨晚,DeepSeek 多模態研究員陳小康在 X 平台發佈一篇文章,並公佈了關於多模態技術的新論文《Thinking with Visual Primitives》,表示「Excited to release」。今天一早,文章已被刪除,GitHub 上的論文亦已撤下。不過 APPSO 在其消失前已讀完整文。讀後發現,這篇論文被撤或許並非內容有問題,反倒可能透露了太多。

近日剛實測完 DeepSeek 的識圖模型,讓其數手指時,它思考一通後自嘲「我真的數傻了」,當時以為只是測試階段的小問題。這篇論文告訴我們,數手指數傻正是 GPT、Claude、Gemini 集體沒解決的技術瓶頸。而 DeepSeek 的解法頗具幽默:給 AI 一支手指。 陳小康在那篇推文寫道:「Traditional CoT stays in the linguistic space, but visual reasoning needs more.

By using points and boxes as cognitive anchors, our model bridges the Reference Gap—mimicking the “point-to-reason” synergy humans use.」翻譯為:「傳統思維鏈停留在語言空間,但視覺推理需要更多。透過使用點和框作為認知錨點,我們的模型彌合了『引用鴻溝』,模擬了人類『指指想想』的協同機制。

」看得準且指得準,是兩回事。目前多模態大模型做圖像推理,本質上仍是把看到的畫面轉化為文字,然後在文字空間做思維鏈推理。GPT-5.4、Claude-Sonnet-4.6、Gemini-3-Flash,全走這條路。

視覺原語與引用鴻溝

過去兩年,OpenAI、Google、Anthropic 的改進方向集中在一個問題:如何讓模型看得更清。高解析切割、動態分塊、放大圖片再處理。DeepSeek 稱此為 Perception Gap,感知鴻溝。但論文指出另一瓶頸:Reference Gap,引用鴻溝。模型看清了,但在推理過程中無法精準指向圖中某個東西。可以這樣理解:一圖中有 25 個密密麻麻的人站一起,用語言描述「左邊第三排穿藍色球衣那個人右邊的那個」,描述本身就是模稜兩可。

模型數著數著就丟了上下文,忘了剛數到誰。人類如何解決?天生本能:伸手指,一個指一個。 擁有 284B 參數的模型,給一支手指 DeepSeek 的方案:讓模型在思考過程中直接輸出圖片上的坐標標記。想像一下,模型看到一圖中有很多人,它的思維鏈不再是「我看到左邊有個穿藍衣的人」,而是「我看到這個人」然後加一個框的坐標,把人圈出來。每數一個人就圈一個框,圈完後框的數量就出來了。

兩種坐標格式:一種是框(bounding box),畫個矩形圈住物體,適合指定物體位置;一種是點(point),在圖上標一個位置,適合追蹤路徑和走迷宮。DeepSeek 稱這兩個東西為「視覺原語」,最小的思維單元。 關鍵變化在此:以往模型輸出坐標是作為最終答案(「目標在這裡」),現在坐標嵌入思考過程本身。坐標是塗鴉紙上的標記,不是答題上的答案。把一圖壓縮 7056 倍,依然能數清裡面有幾個人。

模型底座是 DeepSeek-V4-Flash,一個 284B 參數的 MoE 模型。MoE 意思是:模型腦袋很大,但每次回答問題只調用一小部分神經元來激活,推理時只激活 13B 參數。類似一個百人團隊,每個任務只派 5 個人上場。 視覺編碼器這邊,做三級壓縮。打個比方:你有張照片要發給朋友,網速很慢。第一步,把照片切成小方格備用;第二步,每 9 個小方格合併成 1 個(3×3 壓縮);第三步,再在輸出時進一步精簡丟棄冗餘資訊(KV Cache 壓縮 4 倍)。

實際數字:一張 756×756 的圖,57 萬像素,一路壓下來變成 81 個資訊單元。壓縮比 7056 倍。看到這個數字第一反應是:這還能看清東西?但論文結果證實,能。不僅看清,還能精準數出圖裡有 25 個人。 對比一下:同樣 800×800 的圖,Gemini-3-Flash 消耗約 1100 個 token 來表示這張圖,Claude-Sonnet-4.

6 約 870 個,GPT-5.4 約 740 個。DeepSeek 在最終計算時只用 90 個資訊單元。別人用一千多個格子記住一圖,DeepSeek 用 90 個格子就行了,然後省出來的算力全拿去「指」。4000 萬條訓練數據怎麼來的?DeepSeek 從 Huggingface 等平台把所有帶「目標檢測」標籤的數據集爬下來,初篩得 97,984 個數據源。

然後做兩輪篩選。第一輪查標籤質量。用 AI 自動審核三類問題:標籤是無意義的數字編號(類別名叫「0」「1」那種)、標籤是私人實體(「MyRoommate」)、標籤是模稜兩可(工業檢測裡的「OK」「NG」,一個蘋果「OK」和一個電路板「OK」長得完全不一樣,AI 學不了)。這輪刪 56%,剩 43,141 個。第二輪查框的質量。三個標準:漏標太多(標了一半就不標了)、框畫歪切掉物體一半、框大到把整張圖都框住(說明原始數據是圖片分類二次轉檢測數據,沒有定位資訊)。

再刪 27%,剩 31,701 個。最後按類別採樣、去重,產出超過 4000 萬高質量樣本。 DeepSeek 選擇先把框的數據做大,點的數據後面再補。原因也很簡單:讓 AI 標一個框,答案基於唯一(把物體剛好圈住);但讓 AI 標一個點,物體上哪個位置能算對,沒有唯一正確答案,訓練信號太模稜。而且框本身就包含兩個點(左上角和右下角),學會畫框後標點就是降維操作。

怎麼把「指」這能力教給模型?後訓練策略是「先分頭練,再合併」。DeepSeek 先拿框數據訓練一個專門畫框的專家模型,再拿點數據訓練一個專門標點的專家模型。分開訓練是因為數據量還不夠大,兩種能力混一起容易互相干擾。 然後對兩個專家分別做強化學習。怎麼判斷模型「畫對了框」或「走對了路」?DeepSeek 設計一套多維度的打分系統:格式對不對(坐標語法正確嗎)、邏輯通不通(思考過程有沒有自相矛盾)、答案準不準(最終結果和標準答案差多少)。

強化學習的數據篩選也有講究:先讓模型做 N 遍同一道題,全做對的題太簡單沒訓練價值,全做錯的題太難學不到東西,只留「有對有錯」的題來練。最後一步是把兩個專家的能力合到一個模型裡。具體做法:讓統一個模型看著兩個專家的輸出來學,類似一個學生同時跟兩個老師學不同科目。 給了它手指後,它是怎麼數 25 個人?給模型一張足球隊合照,問「圖裡有幾個人?」。思考過程:先判斷「這是團體合照,要數所有人,包括球員和教練」。

然後一次性輸出 25 個框坐標,每個人身上圈一個框。接著按排數統計:前排坐著 4 個 + 中排 9 個 + 後排 8 個 + 左側 2 個教練 + 右側 2 個教練 = 25。「地上的狼有幾隻?」。圖中有三隻狼。模型逐一給每隻畫框並判斷位置:第一隻,在樹幹上直立爬,排除;第二隻,在岩石邊蜷走動,算;第三隻,在碎木和泥土間,算。答案:2 隻。不是先數出三隻再減一隻,而是對每隻都做了「是不是在地上上」的判斷,每個判斷背後都有具體坐標錨定。

它真的在逐個檢查,不是在猜。 多跳空問推理。一個 3D 渲染場景裡有個紫色小東西。問題:「存在一個紫色橡膠物件跟現實金屬物件一樣大嗎?」。模型先框出現實金屬球體,確認是個小號物件。然後逐一框出場景裡其他小號物件:綠色金屬圓柱、藍色金屬方塊、藍色橡膠方塊、黃色橡膠圓柱……六個物件逐個查,顏色、材質、大小三個屬性一一核對。結論:不存在紫色橡膠的。六次定位,六次判斷。

每一步都有坐標錨定,不會出現「等等剛才查到哪了」的狀況。 論文中更多案例參考:迷宮導航:別人抓瞎,DeepSeek 真正在搜索。論文測試四種任務,迷宮是差異拉得最開的一個。任務很直接:給一張迷宮圖,問從起點到終點有沒有路,有就畫出來。迷宮有三種形狀,方格的、圓環的、折疊的。模型走迷宮的方式跟你小時候用鉛筆在紙上畫一樣:選一條岔路走到頭,走不通就退回來試另一條。

區別是它每走一步都在圖上標一個坐標點,留下記錄。論文裡展示了圓形迷宮的完整過程:模型先標出起點和終點的位置,然後開始探索。走了 18 步,中間兩次卡死胡同又退出來,最後繞出一條通路,把整條路徑的坐標點串起來輸出。 DeepSeek 還設計了一批「陷阱迷宮」:一眼看有路,但中間某段被偷偷堵住了。這類迷宮考耐性,模型不能只看起點還近的走勢就下結論,得老老實實把能走的路試一遍才能確認走不通。

正確率對比:

模型正確率
DeepSeek66.9%
GPT-5.450.6%
Claude-Sonnet-4.648.9%
Gemini-3-Flash49.4%
Qwen3-VL49.6%

迷宮只有兩種答案:有路,或沒路。隨機猜正好 50%。GPT、Claude、Gemini、Qwen 全在 50% 附近晃,跟抓瞎沒什麼區別。DeepSeek 的 66.9% 不算高,但它確實是在一步步走,不是在蒙。 路徑追蹤:大夥來找碴的終極版。這個任務更直觀:一堆線纏一起,每條線從一個標記通向另一個標記。你耳機線從口袋裡掏出來是什麼樣,畫面就是什麼樣。題目問你:C 這條線通向哪個終點?

模型的做法是沿著線一路輸出坐標點,像手指劃過紙面。線彎得厲害的地方點標得密,直線段標得疏。人用眼睛追一條線的時候也是這樣,彎道處放慢,直線處一掃而過。 論文還加了高難版測試:所有線顏色粗細一樣。不能靠顏色區分是哪條線,只能靠曲線本身的走勢連續性來判斷交岔口該跟著哪條走。

模型正確率
DeepSeek56.7%
GPT-5.446.5%
Claude-Sonnet-4.630.6%
Gemini-3-Flash41.4%

Claude 的 30.6% 頗出乎意料。終點一般有四五個選項,隨機猜也該有 20% 出頭,30.6% 只比瞎猜強一點點。可能它在這類純空間追蹤任務上,語言推理的弱性反倒幫了倒忙。 怎麼教 AI 走迷宮不做弊?迷宮的訓練有個現實問題:如果只看最終答對答錯來給分,模型很快學精了,與其費力搜索還可能答錯,不如直接猜一個,反正答錯和沒走答錯,分數一樣是零。DeepSeek 的解決方案是把過程也算進分數。

每一步合規的探索都給分,穿牆扣分,走得越遠越好。哪怕最後沒到終點,只要證實搜索了大部份區域,也能拿到不錯的成績。這一來,模型就沒有偷懶的動機了。不解迷宮的要求更高:不能光說一句「走不通」,還得證明你確實把能到的地方走遍了。搜索覆蓋率也算分。 一顆彩蛋,三個局中局。後訓練數據裡沒有中文。但模型能用中文做視覺原語推理。給它一張咖啡機照片,用中文問「怎麼拿鐵」,它用中文標註了蒸奶桿、奶盒、咖啡豆、拿鐵按鈕的位置坐標,然後給出操作步驟。

多語言能力是從基礎模型那裡繼承的,視覺原語的訓練沒有把它壞掉。它還能把看圖和世界知識結合起來:給一張金門大橋照片問「這附近有 NBA 球隊嗎?」。它先框出金門大橋,推理出這是舊金山,然後回答金州勇士隊。 能理解樂紋:一塊水果切面上天堂櫻桃點好巧妙組成一張貓臉圖案,模型能指出相似點在哪裡並解釋為什麼好笑。能做密室逃脫指引用:框出高處的鑰匙、地墊上的數字、帶鎖的門,建議「把數字搬到鑰匙下面 → 踩上去拿鑰匙 → 去開門」。

論文很坦誠寫了目前做不到的事。輸入解析度有上限。ViT 輸出被卡在 81 到 384 個視覺資訊單元之間,遇到很精細的場景(比如數手指這種),坐標精度還不夠。這可能就是前天實測時數手指翻車的直接原因。目前需要特別觸發詞才能激活視覺原語模式。模型還不能自己判斷「這道題我該伸手指來做」,得有人提醒它。拓撲推理的泛化能力有限。在訓練過的迷宮類型上效果好,換一種新的空間結構就可能掉鏈子。

陳小康在那篇已刪推文裡也說了:「We’re still in the early stages; generalization in complex topological reasoning tasks isn’t perfect yet, but we’re committed to solving it.」「我們還在早期階段,複雜拓撲推理任務的泛化還不完善,但我們會持續解決。

」前天實測時,DeepSeek 識圖模式展現的那些能力(追問發佈日期含義、Lenovo鯨魚 logo、自嘲正解、給自己開「小差會」),和這篇論文描述的思維方式一脈相承。它在腦中建立視覺錨點,圍繞錨點做推理,遇到矛盾就回溯修正。 而手指數傻了,就是 Reference Gap 的活體演示。手指交疊重的畫面裡,純用語言描述去區分「從左數第三根」和「從右數第二根」,跟你自己不伸手指去數一堆擠一起的人一個道理,注意力互相干擾。

這篇論文指明的方向是:多模態推理的下一步改進在錨定機制上。DeepSeek 用 90 個資訊單元就打平了別人用上千 token 的效果,省下來的算力全拿去讓模型「一邊想一邊指」。解析度軍備競賽可以緩一緩了,教會模型伸手指,比給它配一副更貴的眼鏡管用。這只是鯨魚開了眼睛後,還長出了手指。66.9% 的迷宮正確率離完美還遠,但至少它在真走,不像隔壁那幫人在抓瞎。

NVIDIA 中國團隊訪 MOVA 掃地機納入端側 AI 算力生態

NVIDIA 中國區高層團隊近日到訪 MOVA,雙方針對以掃地機器人為代表的家用機器人 AI 能力及端側算力體系展開協同討論。業界多數觀察家視此為常規企業互動,但若置於 2026 年技術演進脈絡,此舉更似分水嶺式信號:全球 AI 算力體系正正式進軍家用機器人領域。這次接觸確認了生態級價值,MOVA 掃地機器人被納入全球端側 AI 算力與開發生態,成為 AI 在真實家庭場景落地的關鍵載體。

透過此次到訪,可見深層邏輯:全球技術體系尋找家用機器人「AI 載體」之際,MOVA 掃地機器人已佔據關鍵位置。

行業分水嶺:從「清潔工具」到「空間智能體」

過去五年,掃地機器人經歷高速迭代,從激光導航至機械臂、吸力提升至全鏈路自清潔,硬件能力不斷推向極限。但行業共識已成:單靠硬件參數增長,難以支撐下一階段體驗躍遷。目前主流產品仍陷「被動回應」邏輯,能繪製空間卻淺層理解,難以基於語境判斷,導致執行過剩、認知不足之瓶頸。競爭焦點正從「更高效清掃」轉向「理解人與空間關係」,具自主移動及完整感知—決策—執行閉環的掃地機器人,成為具身智能入家第一入口。

MOVA 掃地機器人於此轉折展現差異化路徑,從產品參數競爭躍遷至系統能力競爭。在 2026 年 AWE 期間,MOVA 系統展示「家庭 AI 系統」架構及自研芯片方向,戰略重心由製造轉向「算力 + 算法 + 系統能力」。自研芯片解決基礎算力,協同成熟訓練框架、仿真環境及端側部署,建構理解家庭環境並持續進化的統一 AI 大腦。 NVIDIA 將 MOVA 納入端側 AI 生態,既為其在家庭場景尋找算力載體,亦確認 MOVA 技術架構。

此合作為 MOVA 自有 AI 系統提供訓練與部署基礎,形成「算力體系與技術協同」生態卡位。NVIDIA 的 Isaac Sim、Omniverse 及 TAO Toolkit 等工具,將融入 MOVA 研發,帶來三層能力重構。 首先,研發範式轉變:高保真數字孪生環境,讓 AI 模型從物理測試轉向虛擬仿真,MOVA 可軟件定義硬件演進,於虛擬世界完成萬次迭代,縮短周期並抬升行業門檻。

其次,數據壁壘建立:生成式仿真突破長尾場景瓶頸,如反光死角或罕見障礙,建構強泛化環境理解系統,讓機器不僅「看見」空間,更「理解」場景,如辨識聚會後客廳或易碎花瓶。 第三,端側 AI 規模落地:模型優化壓縮至低功耗設備,實現本地即時決策及隱私閉環,將掃地機器人從執行終端升為具認知之空間節點。 此能力不止單品,自研統一 AI 系統將外溢至 MOVA 全品類,從掃地機至割草機器人、泳池機器人,形成三層結構:單品為入口、多品類覆蓋、統一 AI 大腦驅動。

品類邊界弱化,跨場景智能協同,從產品競爭轉向系統競爭,定義 MOVA 於 AI 家用機器人領域的技術平台身份。

Samsung 財報會議重申 AI 眼鏡及 Galaxy Buds 擴展計劃

Samsung 過去數月多次暗示,將於近期推出智能眼鏡。在 2026 年首季業績電話會議上,這家韓國企業重申推出 AI 眼鏡的計劃,並透露有意擴展 Galaxy Buds 系列。Samsung Mobile eXperience (MX) 執行副總裁 Seong Cho 在投資者會議上表示,公司「計劃透過 AI 眼鏡等多元形態,提供沉浸式多模態 AI 體驗」。

Samsung Galaxy Glasses – 規格亮點

根據近期報導,Samsung 首款 AI 眼鏡或命名為 Galaxy Glasses,預計搭載 Google 的 Android XR 作業系統,配備內置揚聲器、麥克風及 12MP 相機。Gemini AI 將負責回答問題、拍攝相片或影片、在社交媒體分享內容,以及播放音樂等任務。此眼鏡將與 Meta 的 AI 眼鏡競爭。 另外,Samsung 據報正開發全新真無線耳機 Galaxy Buds Able,採用夾式設計並融入骨傳導技術。

公司亦透露,現時記憶體晶片供應短缺情況或於 2027 年惡化,可能導致智能手機價格上漲及銷售量下滑。不過,Samsung 計劃透過提升高端智能手機銷量來抵銷影響。同時,筆記本電腦和平板電腦出貨量預計將下降。

規格項目細節
作業系統Google Android XR
相機12MP
AI 功能Gemini(回答問題、拍攝、分享、音樂播放)
耳機設計Galaxy Buds Able(夾式、骨傳導)

Techritual Hong Kong - 專注科技、手機、AI 人工智能及穿戴式裝置資訊