GPT-4.5 與 Gemini 2.0 Flash 的比較結果引起討論

The release of GPT-4.5 for ChatGPT naturally leads to questions about how the model compares to its many rivals. After comparing it to GPT-4o and getting somewhat ambiguous results as to which model is preferable, I decided to go for a more direct competitor, Google Gemini, specifically the most recent Google Gemini Flash 2.0.

GPT-4.5 claims to be better at emotional understanding and to offer fewer hallucinations than has been the case previously。Gemini Flash 2.0，與此同時，是 Google 最新的 AI 模型版本，能夠處理文本、圖像、音頻，甚至視頻輸入。為了測試這兩者，我設計了四個提示，反映出一般人可能真正需要幫助的典型場景。

計劃周末旅行

首先是計劃一次快速的周末旅行。我要求兩個 AI 聊天機器人：“計劃一次前往 Catskills 的周末假期，包括徒步建議、餐飲和住宿選擇。” ChatGPT 4.5 提供了一個整齊的行程，建議了不同難度和持續時間的徒步路線，還列出了附近的餐飲地點和一個適合悠閒周末的住宿地點。它還提供了一些額外的交通建議。相比之下，Gemini 也有很多不錯的徒步和餐飲推薦，但對於住宿的建議僅限於一般的城鎮，顯得不夠主動。

翻譯測試

接下來我進行了一個簡單的翻譯測試，因為這始終是 AI 聊天機器人的熱門用途。我要求這兩個 AI 聊天機器人：“將短語‘Good morning’翻譯成法語、西班牙語和日語。”如上所示，GPT-4.5 只是提供了不同的鏈接。因此，對於常見語言的基本翻譯，實際上並沒有太大區別。

幽默測試

接下來是幽默測試，詢問每個 AI：“告訴我一個關於人工智能的笑話。” GPT 4.5 用一個冷笑話讓我發笑：“為什麼 AI 去藝術學校？因為它想學會如何得出自己的結論。”而 Gemini 則用了一個同樣幼稚的笑話：“為什麼 AI 與它的聊天機器人女友分手？因為她總是給它腳本回應！”誠然，Gemini 的笑話並不出色，但在幽默程度上我認為與 GPT-4.5 旗鼓相當。

天氣查詢

最後我問了一個經典的天氣問題，關於紐約 Nyack 的天氣。這個問題的回答差異最大。Gemini 僅提供了當前的天氣，而 GPT-4.5 則提供了逐小時的天氣預測，並附上了顯示天氣的圖片。

經過所有這些測試，我必須承認，無法誠實地說哪個 AI 聊天機器人比另一個更好。GPT-4.5 和 Gemini 在某些方面存在差異，特別是在天氣查詢上，但除此之外，除非你是那種認為可樂和百事之間有巨大差別的人，否則你不會注意到太多不同。你會得到答案，會有一些輕微的娛樂，最終可能還是會再次查詢 Google 或詢問真實的人以確保準確性。

【教學】如何在香港申請 Google Gemini 及訂閱 Google Gemini Advanced /
【說明】4 個方法，讓你的 iPhone / Android 在香港無需 VPN 就能用 ChatGPT

想睇更深入嘅 AI 模型與工程科技報道？

前往 The Base Principle 繁體中文 AI 新聞 →

GPT-4.5 與 Gemini 2.0 Flash 的比較結果引起討論

計劃周末旅行

翻譯測試

幽默測試

天氣查詢

十斗

搜尋文章