GPT-4.5 與 Gemini 2.0 Flash 的比較結果引起討論

The release of GPT-4.5 for ChatGPT naturally leads to questions about how the model compares to its many rivals. After comparing it to GPT-4o and getting somewhat ambiguous results as to which model is preferable, I decided to go for a more direct competitor, Google Gemini, specifically the most recent Google Gemini Flash 2.0.

GPT-4.5 claims to be better at emotional understanding and to offer fewer hallucinations than has been the case previously。Gemini Flash 2.0,與此同時,是 Google 最新的 AI 模型版本,能夠處理文本、圖像、音頻,甚至視頻輸入。為了測試這兩者,我設計了四個提示,反映出一般人可能真正需要幫助的典型場景。

計劃周末旅行

首先是計劃一次快速的周末旅行。我要求兩個 AI 聊天機器人:“計劃一次前往 Catskills 的周末假期,包括徒步建議、餐飲和住宿選擇。” ChatGPT 4.5 提供了一個整齊的行程,建議了不同難度和持續時間的徒步路線,還列出了附近的餐飲地點和一個適合悠閒周末的住宿地點。它還提供了一些額外的交通建議。相比之下,Gemini 也有很多不錯的徒步和餐飲推薦,但對於住宿的建議僅限於一般的城鎮,顯得不夠主動。

翻譯測試

接下來我進行了一個簡單的翻譯測試,因為這始終是 AI 聊天機器人的熱門用途。我要求這兩個 AI 聊天機器人:“將短語‘Good morning’翻譯成法語、西班牙語和日語。”如上所示,GPT-4.5 只是提供了不同的鏈接。因此,對於常見語言的基本翻譯,實際上並沒有太大區別。

幽默測試

接下來是幽默測試,詢問每個 AI:“告訴我一個關於人工智能的笑話。” GPT 4.5 用一個冷笑話讓我發笑:“為什麼 AI 去藝術學校?因為它想學會如何得出自己的結論。”而 Gemini 則用了一個同樣幼稚的笑話:“為什麼 AI 與它的聊天機器人女友分手?因為她總是給它腳本回應!”誠然,Gemini 的笑話並不出色,但在幽默程度上我認為與 GPT-4.5 旗鼓相當。

天氣查詢

最後我問了一個經典的天氣問題,關於紐約 Nyack 的天氣。這個問題的回答差異最大。Gemini 僅提供了當前的天氣,而 GPT-4.5 則提供了逐小時的天氣預測,並附上了顯示天氣的圖片。

經過所有這些測試,我必須承認,無法誠實地說哪個 AI 聊天機器人比另一個更好。GPT-4.5 和 Gemini 在某些方面存在差異,特別是在天氣查詢上,但除此之外,除非你是那種認為可樂和百事之間有巨大差別的人,否則你不會注意到太多不同。你會得到答案,會有一些輕微的娛樂,最終可能還是會再次查詢 Google 或詢問真實的人以確保準確性。

【教學】如何在香港申請 Google Gemini 及訂閱 Google Gemini Advanced /
【說明】4 個方法,讓你的 iPhone / Android 在香港無需 VPN 就能用 ChatGPT

十斗
十斗https://www.techritual.com/author/tenten/
十斗在知名大學取得了計算機科學與工程學位,並在學術研究方面表現出色。她的研究領域包括人工智能、機器學習和數據科學。一斗為十升,一升為十合,一合為十分之一升。謝靈運言天下才學一石,曹植占八斗,以此讚譽。後用以比喻才學極高。