知名基準測試軟件 3DMark 的開發商 UL Solutions 近日推出 macOS 獨立版本應用,用戶現可直接從官網下載軟件並啟用授權,不再受限於 Apple 商店發佈渠道。早於去年 6 月的 WWDC 期間,UL Solutions 首次將 3DMark 引入 macOS 生態,但長期依賴 App Store 發佈途徑。此模式在授權管理和離線安裝上存在明顯局限,企業和媒體用戶過去一直受困於網絡認證及分發問題。
這次更新一次性彌補上述短板。
macOS 授權全面升級
UL Solutions 確認,常規 3DMark 授權與企業版授權已全面覆蓋 macOS。玩家和媒體可直接使用現有評測工具授權解鎖全部測試項目,無需重複購買。更重要的是離線安裝功能:測試人員從 U 盤、移動硬盤或外部網絡驅動器直接安裝。目前測試項目完整涵蓋 Steel Nomad、Steel Nomad Light、Wild Life Extreme、Solar Bay 及 Solar Bay Extreme 五大基準。
下表列出 macOS 版 3DMark 支持的測試項目規格:
測試項目
描述
Steel Nomad
涵蓋非光追高負載場景
Steel Nomad Light
輕量版高負載測試
Wild Life Extreme
極限性能基準
Solar Bay
光追性能測量
Solar Bay Extreme
極限光追基準
這一改變背後還有產業信號。Apple Silicon 在 GPU 性能上的持續提升,加上越來越多 3A 大作原生登陸 macOS,Mac 正從圖形性能測試的邊緣走向中心。獨立版本上線,顯示 macOS 被 UL Solutions 視為與 Windows 同等重要的基準測試平台。已擁有獨立版本授權的用戶登錄帳戶即可下載安裝。
相反,針對古代遺骸開展的遺傳學研究顯示,歷史上可能並存過多種螺旋體疾病,反應出這類病原體複雜的演化歷史。
研究人員同時提到,古病原體研究正面對越來越多現實挑戰,尤其在東南亞等熱帶地區,由於遺骸保存條件差異,取樣古 DNA 極其困難。此外,對人類遺骸進行破壞性取樣涉及的倫理問題,也正變得日益發燒。論文共同第一作者、菲律賓大學迪利曼分校博士生 Minh Tran 表示,在熱帶環境中提取古 DNA 異常困難,而破壞性採樣亦帶來重大倫理問題,因此未來研究需以新方式推進,並與這些遺骸相關的社群建立真正合作
Microsoft正為 Windows 11 帶來一輪圍繞更新體驗的大規模調整,重點在於將更多決定權交還給用戶,包括在系統初始設定階段跳過更新、將更新暫停任期限長,以及在已有更新待安裝時仍可單獨選擇關機或重啟而非立即應用更新。相關改動目前已開始向 Windows Insider 測試用戶推送,其中包括 Beta 頻道的 Build 26220.8282,以及 Experimental 分支中 Canary 和 Dev 頻道的 Build 26300.
8289。
源自超過 7621 項用戶反饋的四大變革
這輪改動是Microsoft根據超過 7621 項有關 Windows 更新體驗的用戶反饋作出的回應,核心包括四項變化:Windows 11 安裝設定過程中新增「稍後更新」按鈕、允許用戶長時期阻擋設備接收更新、支援在不安裝更新的情況下執行關機或重啟,以及在系統中提供更新資訊的更清晰展示。在整體思路上,Microsoft正嘗試統一部份不同類型的 Windows 更新,並將目標設定為「將更新體驗壓縮到每月一次重啟」。
根據文件所述,Microsoft首先會將驅動程式、.NET 以及固件更新之間進行協調,以減低用戶一個月內頻繁被重啟打斷的情況。
現時,用戶進入「設定 > Windows 更新」頁面後,將看到一個新的「可用更新」區域,用於集中顯示多類更新內容。這些內容不僅包括每月進行的安全更新,還涵蓋品質帶外更新以及可選的非安全更新。根據新機制,這些更新會先在後台靜默下載,之後等到下一個預定的 Windows 品質更新時機,或待用戶自行批准後再安裝。
此外,路透社今年 1 月也報導,多國政府與監管機構已開始加強對 DeepSeek 安全性和隱私政策的審視,原因之一是其隱私說明顯示,大量個人資訊及用戶與 AI 系統的互動數據會儲存於中國境內伺服器。
與此同時,DeepSeek 仍持續推進產品更新。路透社 4 月 24 日報導,這家以低成本 AI 模型而在去年引發全球關注的中國公司,當天推出了一款面向華為晶片體系優化的新模型,顯示其正加速在中國本土算力生態中的佈局。
在美國不斷強化晶片出口限制、並持續關注中國企業獲取高端 AI 硬體與模型能力的背景下,DeepSeek 的技術路徑與國際擴展,正變得備受矚目。
截至目前,官方報導未顯示美國國務院此輪「全球警示」已形成新的正式制裁措施,但相關外交動作表明,華盛頓正試圖將對中國人工智慧企業的安全、知識產權與技術競爭指控進一步國際化。對中美兩國而言,人工智慧已不只是產業競爭議題,也正日益演變為外交、安全與地緣政治博弈的重要前線。
Apple 在 iOS 26.5 測試版中新增地圖應用廣告彈出窗,將這項商業化舉措從謠言變成現實。廣告採用與 Google 地圖類似的競價排名機制,出價最高者優先佔據搜尋結果頂部,且不提供關閉選項。例如,一家火鍋店可為「火鍋」這詞參與競標,當用戶搜尋「火鍋」時,出價最高商家的位置廣告便會出現在結果頂部。這是 Apple 過去十餘年反覆抨擊 Google 商業模式的轉變。
5 讓 OpenAI 重回 AI 領域第一位,打破了與 Anthropic 和 Google 的三方平局。」然而,伴隨高性能一同被曝光的,還有高幻覺率。在 Artificial Analysis 的私有基準測試 AA-Omniscience 中,GPT-5.5 的幻覺率高達 86%,遠高於 Claude Opus 4.7 的 36%。這意味著,當這個目前「最聰明」的 AI 大腦面對不確定或未知問題時,選擇「坦言不知」的概率極低,反而傾向於「自信地虛構」一個答案。
而在需要高可靠性的工作場景中,這種高幻覺率很可能導致分析偏差、決策失誤乃至財務損失。最強的 AI 也是最危險的「說謊者」?面對高幻覺率,GPT-5.5 究竟能否在實際應用中可靠完成複雜知識任務?為回答這些關鍵問題,本文對 GPT-5.5 進行實測,從處理家庭帳本到編寫即時對戰遊戲,測試其應對長上下文、複雜邏輯知識工作與編程實戰能力。此測試不僅關乎單一模型性能,更關乎 AI 技術進入深水區後,如何在擁抱其強大能力同時,應對潛在風險。
知識能力:真正像職場人一樣會幹活
根據官方發佈的基準測試結果,GPT-5.5 在多數核心指標上超越前代 GPT-5.4,在知識工作領域表現尤為突出。在一項涵蓋 44 個職業的 GDPval 測試中,GPT-5.5 取得 84.9% 分數,不僅超過 83.0% 的真實職場人員平均水平,也高於 Claude Opus 4.7 的 80.3% 和 Gemini 3.1 Pro 的 67.3%。該測試模擬了金融分析師、市務經理、軟件工程師等多種白領職業的日常工作,要求模型完成資訊整合、分析推理、決策建議與報告生成等綜合性任務。
這個測試場景設計看似簡單,卻很能看出 AI 是否真正「好用」。因為家庭記帳是很多人日常,但記錄往往隨手寫、格式亂,「亂七八糟」的記帳數據要求 AI 不只能處理整齊表格,還得「看懂」手寫式記錄、理解每筆錢是什麼意思,並把相似項目歸一起。而算總帳、分析錢花在哪、給出節省建議,實則對應一套完整的思考過程,GPT-5.5 需要先把資訊理順,再從裡面看出門道、提出可行措施,最終「寫報告」,則要求它會用人能懂、易接受的方式呈現工作。
除了在日常知識任務中表現可靠,在編程這類對精準性要求更高的「硬功能」上,GPT-5.5 同樣展現不錯進步。在一項考驗「智能體」的基準測試(Terminal-Bench 2.0)中,它拿到 82.7% 高分。該測試模擬在終端執行一連串複雜操作,就好像讓 AI 自己完成一個多步驟的運維任務。其成績不僅比自家上代(GPT-5.4 的 75.1%)高,也明顯超過競爭對手 Claude Opus 4.
DeepSeek-V4 的運行成本低於頂級閉源模型,高於主流開源模型,較前代大幅上漲。完成全套人工分析智能指數評測,V4-Pro 的運行成本為 US$1071,約 HK$8350,不到 Claude Opus 4.7(US$4811,約 HK$37526)的四分之一;但對比同類開源模型仍偏高,高於 Kimi K2.6(US$948,約 HK$7394)、GLM-5.
,英偉達將處於不利。
與 DeepSeek-R1 不同,DeepSeek-V4 並未引發美國科技股大跌。晨星高級股票分析師 Ivan Su 表示,DeepSeek-V4 很難複製推理模型 R1 初期的市場影響力,因為交易市場早已消化預期:中國人工智能技術已備競爭力,且使用成本更低。Ivan Su 還稱,DeepSeek 此次全新產品定位,將國產其他開源大模型直接劃入競爭產品行列。
美國參議院軍事委員會主席要求終止與伊朗的談判,並恢復軍事打擊。密西西比州共和黨參議員羅傑·威克在社交平台 X 發文表示:「與伊朗談判的時代已經結束。」威克指出:「哈梅內伊的繼任者不會遵守任何承諾與協議。我方三位軍統帥應指示資深軍方領導,徹底清除伊朗常規軍事力量,摧毀其核計劃所有殘餘設施。」他強調:「這是確保該地區長治久安的唯一途徑。」
伊朗總統當日表示,正準備提交談判方案。
多份報導指出,Samsung 正在開發三款全新摺疊式智能手機,包括 Galaxy Z Fold 8、Galaxy Z Flip 8,以及一款書本式摺疊顯示屏的機型,其寬度比以往 Galaxy Z Fold 系列更闊。這款機型料將以 Galaxy Z Fold 8 Wide 或 Galaxy Z Fold Wide 名義推出。近日,一則新洩漏消息揭露了其尺寸及兩塊顯示屏的長寬比細節。
4 x 143.2 x 4.5 mm,收合時為 158.4 x 72.8 x 9 mm,其顯示屏長寬比尚未有資料,而 Galaxy Z Fold 7 的內置摺疊顯示屏長寬比為 3.33:3。從這些規格可見,Galaxy Z Fold 8 Wide 明顯比標準版及前代更矮更闊,從而帶來更寬闊的顯示比例。
據數碼聊天站於微博發佈的新爆料,小米 Redmi 目前正開發三款不同智能手機,全部配備 10,000 mAh 電池。這些機型的電池採用單電芯設計,因此無法在歐盟市場推出,並支援 100W 有線快充技術。相關機型將涵蓋主流 Note 系列,以及注重性能的 K 系列。
規格細節
規格項目
細節
電池容量
10,000 mAh
電池類型
單電芯
有線充電
100W
適用系列
Note 系列、K 系列
近年中國市場的 Redmi Note 系列,常與國際版命名相似但規格有別,或提前數月發佈。K 系列則為中國獨佔,部分型號偶爾以 Poco 名義於海外推出,因此未來或有 Poco 機型搭載 10,000 mAh 電池,但僅限亞洲地區。這些爆料反映小米 Redmi 在電池續航上的持續探索,針對中國消費者對長效續航的需求。
POCO X8 Pro 後置 5,000萬像素 Sony IMX882 主鏡頭 (f/1.5、1.6μm 超大像素、OIS) + 800萬像素超廣角,支援 4K 60fps 影片、960fps 慢動作和動作追蹤對焦。前置 2,000萬像素鏡頭限於 1080p 影片。
Honor 600 主相機像素更高 (2億 vs 5,000萬),適合細節捕捉和變焦,但 POCO X8 Pro 的感光元件更大、4K 60fps 更流暢,且超廣角更廣。前置鏡頭 Honor 勝出 (5,000萬 vs 2,000萬,高解像度)。整體,Honor 在像素和前置上領先,POCO 在影片和感光上更強。
連接性與其他功能比較
兩機均支援 5G雙卡 (Honor 支援 eSIM),Wi-Fi 6 (Honor ax 2×2 MIMO,POCO 支援 MU-MIMO),藍牙 Honor 5.4 vs POCO 6.0 (後者更新)。Honor 有紅外線遙控和 IP68/IP69/IP69K 防水 (優於 POCO IP68),電池 7000mAh (vs 6500mAh),但充電 80W (含標配充電器) 落後 POCO 100W + 27W 逆向。兩機無 3.5mm 孔,均有立體聲揚聲器。
Honor 尺寸更薄輕 (156×74.7×7.8mm、190g vs 157.53×75.19×8.38mm、201g),包裝含保護殼和屏幕貼;POCO 強調 AI 和 NFC。電池續航 Honor 更長,防水更高級;POCO 充電更快,定位系統更全面 (多頻 GNSS)。
總結
綜合比較,小米 POCO X8 Pro 在屏幕 (高亮、高刷新)、效能 (強大晶片)、充電速度和影片錄製上更優勝,適合遊戲玩家、多媒體愛好者和追求流暢體驗的用戶。Honor 600 (香港版) 則以更大電池、更薄機身、更高像素相機 (主/前置)、頂級防水 (IP69K) 和 eSIM 支援取勝,適合注重續航、攝影和日常耐用性的用戶。
無絕對贏家:若預算允許追求頂尖顯示和效能,選 POCO X8 Pro;若重視電池、防水和自拍,Honor 600 更佳。建議根據個人需求如遊戲 vs 續航選擇,兩機售價和軟件更新亦需考慮。
華為終端近日發佈最新預熱影片,首次展示華為 Pura X Max 搭載的小藝伴隨式 AI 在真實場景中的主動服務能力。這款全球首款大闊折機型已於 4 月 20 日正式發佈,外觀與配色全面公布,全渠道預售同步開啟並現已正式開售。此前,華為已構建涵蓋全形態的折疊屏產品矩陣,Pura X Max 進一步豐富折疊屏用戶選擇,滿足不同場景的差異化需求。
自 2019 年推出首款折疊屏華為 Mate X 以來,華為持續探索折疊屏形態。