TechRadar 團隊再次聚焦科技話題,本週討論了 Google Pixel 9a 的設計改變,並提出了對其外觀的質疑,尤其是為何 Google 決定去除經典的橫杠。此外,團隊還探討了智能手錶市場的困境,評估可穿戴設備品牌是否足夠創新,以吸引消費者的興趣。Samsung 的 One UI 7 系統也面臨挑戰,因為其智能手機操作系統的延遲可能會被即將推出的 Android 版本超越。
本期節目中,主持人 Josie Watson 和 Hamish Hector 邀請了 TechRadar 的健身、健康及可穿戴設備編輯 Matt Evans、美國移動編輯 Philip Berne,以及特別嘉賓 T3 的活躍編輯 Matt Kolla,共同深入探討這些話題。
本集節目可在上方視頻播放器中收看,或直接通過 YouTube 頻道、Spotify 或 Apple Podcasts 進行串流收聽。聽眾還可以回顧之前的集數,包括 CES 和遊戲專題。如果在 YouTube 上,還可觀看最新科技產品的有趣和資訊豐富的視頻評測。
下一集將專注於 Nintendo Switch 2,團隊將詳細分析發佈活動中獲得的所有信息,並討論是否應該立即購買這款新手持設備,或是等待合適的獨占遊戲推出後再做決定。
Microsoft 將 Xbox 遊戲引入 PS5 的策略似乎初見成效,這一點在 Sony 的 PlayStation Store 中得到了證實。目前在美國 PlayStation Store 中,預購最多的遊戲為《印地安納·瓊斯與偉大圓環》和《極限競速 5》,兩款遊戲的高級版本售價均為 $99.99 / 約 HK$ 779。根據 Resetera 的用戶反映,加拿大 PlayStation Store 及多個歐洲國家的商店,如法國、德國、意大利、西班牙和英國,情況亦相似。
在 Sony 自家遊戲工作室進入低潮期之際,Microsoft 精準地選擇了這兩款遊戲進行發佈。早前,《海盜無雙 Sea of Thieves》於去年 4 月在 PS5 首發,Sony 隨後透露該遊戲在美國、加拿大和歐洲市場的銷售表現最佳,並在 Sony 的下載榜單上保持了近六個月。
Microsoft 的 Xbox Everywhere 策略在 PS5 上顯然運行良好,預計在 2025 年及以後將會有更多遊戲登陸 Sony 的平台。此外,Microsoft 也在為任天堂的 Switch 2 準備類似的 Xbox 遊戲列表,報導顯示這款次世代主機將於 6 月發佈,隨後將有第三方遊戲推出。
語音訪問在 Windows 11 中讓用戶能夠完全通過語音命令控制他們的計算機和編寫文本。這個內建的無障礙功能對於有行動障礙的人特別有用,但如果只是希望以免提的方式使用計算機,它也非常方便。語音訪問在初始設置後甚至不需要互聯網連接,這得益於先進的設備內語音識別技術。
檢查 Windows 版本和要求
在開始之前,確保 Windows 11 更新至版本 22H2 或更高版本,因為語音訪問在之前的版本中不可用。要驗證 Windows 版本,打開「設定」,選擇「系統」,然後點擊「關於」。在這裡,可以看到當前的 Windows 版本。如果需要更新,導航到「設定」,選擇「Windows 更新」,然後點擊「檢查更新」。
Google 最近推出了一款名為 Gemini 2.5 Pro 的先進 AI 模型,該模型在「人類最後考試」(Humanity’s Last Exam, HLE)中獲得了 18.8% 的高分,且在測試過程中未使用任何網絡搜索或其他工具。HLE 是一項嚴格的評估標準,由來自全球的專家和學者設計,旨在測試各個學科的深入知識。此前,OpenAI 的 o3-mini-high 在同一基準上獲得了 14% 的分數,同樣未使用任何工具。
Gemini 2.5 Pro 是一個思考模型,意味著它是一個推理模型,基於更大的基礎大型語言模型(LLM)構建,並使用增強學習和思維鏈提示。在 Gemini 2.5 Pro 之前,Google 還推出了更小型的 Gemini 2.0 Flash Thinking 模型。
Google 表示,Gemini 2.5 Pro 模型能夠「分析信息、得出邏輯結論、融入上下文和細微差別,並做出明智的決策」。
Gemini 2.5 Pro 在 LMArena 以代號「nebula」進行測試,現在已在 LMArena 排行榜上獲得了 1,443 的最高分,超越了 Grok 3 和 GPT-4.5。在其他基準測試中,Google 表示 Gemini 2.5 Pro 在編碼、數學和科學方面的表現也相當出色。
在 GPQA Diamond 中,Gemini 2.5 Pro 獲得了 84% 的分數;在 AIME 2025 中,該模型達到了 86.7%。即使在測試解決真實世界軟件問題能力的 SWE-bench 驗證基準中,Gemini 2.5 Pro 也取得了 63.8% 的分數,僅次於 Claude 3.7 Sonnet Extended Thinking 的 70.3%。
Google 表示,這款新的 Gemini 2.5 Pro 模型具備高級編碼和推理能力,並將向 Gemini 高級用戶推出。希望免費測試 Gemini 2.5 Pro 模型的用戶可以前往 Google AI Studio,並在下拉菜單中選擇「Gemini 2.5 Pro Experimental 03-25」模型。
這些改進使得該模型的性能接近 OpenAI 的 GPT-4 或 Anthropic 的 Claude 2 模型。然而,根據 DeepSeek 的說法,即使性能未必完全相同,其運行成本卻要便宜得多。這一點在 AI 使用和成本不斷上升的背景下,無疑是一個重要的賣點。訓練 AI 模型的成本向來高昂,而 OpenAI 和 Google 擁有的龐大雲端預算,是許多公司無法輕易達到的,除非與 Microsoft 等公司建立合作關係。如果 DeepSeek 的低成本成果變得更為普遍,這種獨占性將會消失。
美國在 AI 模型領域的主導地位也開始動搖,部分原因在於像 DeepSeek 這樣的中國初創公司。當最熱門的模型來自深圳或杭州時,已不再令人感到驚訝。地緣政治因素以及商業考量也促使部分美國政府官員呼籲禁止 DeepSeek 的發展。
儘管如此,DeepSeek 最新的發布不會立即改變所有人的日程安排。這暗示著,為支持下一代 AI 所需的計算能力和能源需求,可能並不像預期的那麼驚人。這也意味著,負責重寫簡歷或調試網站的 AI 聊天機器人,可能也能流利地使用普通話。
隨著 Tesla 計劃在夏季推出其內部開發的全自動駕駛(FSD)軟件進行首次無監督駕駛,並啟動初步的機器人計程車叫車服務,這一消息顯示出 Tesla 在無人駕駛技術領域的持續創新。儘管目前 Tesla 尚未運營任何付費叫車服務,但其車輛能夠從啟用 FSD 監控的駕駛者那裡生成實時訓練數據,這將進一步提升其技術優勢。
在星期二,Google 推出了 Gemini 2.5,這是一個新的 AI 推理模型系列,能在回答問題前暫停「思考」。
為了啟動這個新模型系列,Google 正式推出 Gemini 2.5 Pro Experimental,這是一個多模態的推理 AI 模型,該公司聲稱這是其迄今為止最智能的模型。這個模型將於星期二在公司的開發者平台 Google AI Studio 以及訂閱每月 $20 / 約 HK$ 156 的 AI 計劃 Gemini Advanced 的 Gemini 應用程式中提供。
未來,Google 表示所有的新 AI 模型都將內建推理能力。
自從 OpenAI 在 2024 年 9 月推出第一個 AI 推理模型 o1 以來,科技行業一直在努力匹配或超越該模型的能力。目前,Anthropic、DeepSeek、Google 和 xAI 都擁有 AI 推理模型,這些模型利用額外的計算能力和時間進行事實核查和推理,然後再給出答案。
推理技術幫助 AI 模型在數學和編程任務中達到新的高度。許多科技界人士認為,推理模型將是 AI 代理的一個關鍵組成部分,這些自主系統能在很大程度上無需人類干預地執行任務。然而,這些模型的成本也較高。
Google 聲稱 Gemini 2.5 Pro 在多個基準測試中超越了其之前的前沿 AI 模型以及一些競爭對手的領先 AI 模型。具體來說,Google 表示其設計的 Gemini 2.5 專注於創建視覺上引人注目的網絡應用程序和代理編程應用程序。
以下是 Gemini 2.5 Pro 在不同測試中的表現:
測試項目
得分
競爭對手
Aider Polyglot(代碼編輯)
68.6%
OpenAI、Anthropic、DeepSeek
SWE-bench(代理編程能力)
63.8%
OpenAI’s o3-mini、DeepSeek’s R1、Anthropic’s Claude 3.7 Sonnet(70.3%)
Humanity’s Last Exam(多模態測試)
18.8%
OpenAI、Anthropic、DeepSeek
Google 表示,Gemini 2.5 Pro 配備 100 萬個標記的上下文窗口,這意味著該 AI 模型可以在單次提示中處理約 750,000 字,這比整個《魔戒》系列還要長。不過,Google 表示,2 百萬個標記的上下文窗口也即將推出。
Google 之前曾嘗試過 AI 推理模型,去年 12 月曾發布過一個「思考」版本的 Gemini,但 Gemini 2.5 代表了該公司對 OpenAI o 系列模型的最嚴肅競爭。
隨著 Tesla 超充站對更多電動車品牌的開放,這不僅提升了充電基礎設施的可及性,還促進了整個電動車市場的發展。Tesla 在推動電動車普及和基礎設施建設方面的領導地位,無疑將為未來的可持續交通解決方案鋪平道路,讓消費者受益於更廣泛的選擇和便利性。這一創新不僅展示了 Tesla 的技術優勢,還進一步鞏固了其在全球電動車市場中的影響力。