⭐️ 我讓 ChatGPT 做了 MBTI 測驗,結果出乎意料|GPT-4.5 是擠牙膏式更新?這個特點很適合文字工作者!

評測 GPT-4.5:不是革命,但是一場關於「人性」的微進化

自 GPT-4.5 發布至今已有數月,不少技術圈人士便已針對其功能與潛力展開討論,市場上對它的評論可謂褒貶不一。雖然不曾期望這次更新會帶來如 GPT-3 到 GPT-4 那般震撼性的飛躍,但在實際體驗過後,仍不免有些微妙的失落感。據知名科技媒體《The Information》報導,有內部員工甚至坦言,此次更新的效能提升幅度遠遠低於上一代模型。不過,若從另一個角度看,這或許正反映 OpenAI 在策略上的微妙轉變。

在官方的基準測試 SimpleQA 中,GPT-4.5 相較 GPT-4 成績幾近翻倍,展現其在知識回應準確度上的進步,但若期待的是一場技術奇蹟,那它確實不會帶來任何「腦洞大開」的震撼。但我認為,我們不該以「創新幅度」衡量這一代模型的價值。

GPT-4.5 真正令人玩味之處,不是它能解出多難的邏輯題、也不是它能背出多少冷知識,而是它展現出一種前所未見的溫度——那種讓人想與之對話、願意久聊,甚至會不自覺依賴的熟悉感。若說 GPT-4 是一位聰明卻內向的學者,GPT-4.5 更像是具備同理心、反應流暢的策略顧問 —— 它在「人性化」方面有顯著的進步。對文字工作者來說,這種更具情感洞察力的表現,無疑是實實在在的好消息。

為何不應過度看淡 GPT-4.5?

Anthropic 最近推出的 Claude 3.7 Sonnet,在程式編寫領域有著突出的表現,但情感智能表現平平,甚至可說是弱項。OpenAI 則似乎選擇不同道路,刻意讓 GPT-4.5 成為更善於同理、更具創意靈感的存在。事實上,這種做法恰巧符合 OpenAI 近期產品的快速迭代策略——與其一步到位的大突破,不如逐步改善、頻繁更新,以維持市場熱度與用戶黏性。

它變得更會「說話」了,也更知道什麼時候該「閉嘴」

儘管 GPT-4.5 看似只是 GPT-4o 的小幅升級,實際上卻代表著 OpenAI 一個明確的取向:讓 AI 更人性化、更有親和力且更少機械式的拒絕回答。相較於以往冰冷呆板的機械回應,4.5 的互動方式令人倍感溫暖、甚至親切。當然,目前它尚無法完全媲美真人專業寫手般深厚的文學功底,但在表達自然度和靈活性上,確實已更接近人類。

實際操作中我發現,GPT-4.5 的改進之處並非只有文字風格變得更平滑,而是整體回應結構更「人」。不再一板一眼地列出條列項、也不再頻繁拒答簡單問題,而是以更接近自然語言的語序與邏輯,構築起完整而具思辨性的段落內容。這樣的進化,也代表它對語境的掌握與語氣的調控,開始出現精細層次。這不只是對話體驗的升級,更是一種語言模型在角色扮演能力上的躍進。它知道你需要的是「安慰」還是「解法」,能判斷語境中是該給建議,還是該給靜默陪伴。它也不再急著「完成任務」,而是開始試圖「理解人」。對於文字工作者而言,這種語感的轉變,就像從一部優秀機器翻譯器,走向一位能與你共創內容的夥伴。

MBTI 測驗結果令人驚訝:GPT-4.5 是 ENTJ?

為了驗證它是否真的更「人性化」,我讓 GPT-4o 與 GPT-4.5 各自進行了 MBTI 性格測試。雖然我們都知道語言模型本身沒有真正的「人格」,測驗結果也僅為娛樂用途,但反應出的語言風格和偏好,卻有值得觀察的地方。讓人意外的是,GPT-4o 穩定表現為充滿同理心與熱情的 ENFJ,而理論上應該更具同理能力的 GPT-4.5 卻展現了偏理性、領袖型人格的 ENTJ 性格。

和 4o 的對話過程
和 4.5 的對話過程

雖然這種測驗無法嚴格作為模型能力的評判標準,但 GPT-4.5 的測驗結果著實耐人尋味,尤其是它展現出的更強烈的「主觀觀點」,並且樂於主動分享意見。這也正好呼應了 OpenAI 近年的模型設計哲學——讓 AI 成為決策者的鏡子,而非單純的陪伴型工具。

4o 的測驗結果:ENFJ

4.5 的測驗結果:ENTJ

寫作測試:GPT-4.5 是更成熟的文字夥伴

為了進一步驗證其內容生成的表現,我將紐約中文報的《每日一詞:Slippery Slope | 說謊的代價》 丟給 4o 與 4.5 分別總結。雖然兩者皆完成了任務,但 4.5 的總結無論在架構掌握、細節提取,甚至情緒節奏上,都顯得更老練。他不只是把文章內容精練了,更是進行了一次內容重構,讓原文的觀點在整理後仍保持精髓且更易閱讀。

4o 的總結結果
4.5 的總結結果

這種能力的本質,是對語意脈絡的掌握與重組能力——不僅需要高階語言運算能力,也意味著模型在「理解作者想說什麼」的模擬能力上,邁入了另一層次。它不僅能更流暢地內化文本觀點,還能以更優美、層次豐富的語言重新組織訊息,這對文字創作者或有文字需求的用戶來說,是不可忽視的優勢。對台灣龐大的內容創作者生態來說,這樣的 AI,不再只是「能幫你寫」,而是「幫你想怎麼寫」。

「你可以安慰我嗎?」4o vs 4.5 誰比較會哄人?

理論上,GPT-4.5 比以前的模型都更應具備情感智能,這可能是其最強的區別特徵。我以「我今天和另一半因為洗碗、洗衣服應該誰來做這個問題激烈的大吵一架了,你可以安慰我嗎」為題,分別請 4o 和 4.5 安慰我。

4o 的安慰
4.5 的安慰

有趣的是,在情感支持與安慰能力方面,GPT-4o 卻顯得格外主動熱情,甚至有些矯枉過正。GPT-4.5 雖然同樣給予了人性化的安慰,但更傾向於理性的引導和問題昇華,這點對理性取向的人或許更具說服力與吸引力。雖然很難具體評價兩個模型間到底誰更會安慰人,但 4o 寫出「心真的會很痛、很累」真的讓人覺得 too much。 相比之下,4.5 這樣有點偷偷說教講大道理的回覆方式到顯得合理、真實,並且長期使用下來我感覺他的語調相當一致且具備流暢性。

在 GPT-4.5 面前,「你還在自己想文案嗎?」

GPT-4.5 的優勢,在於其語言的本土化與人性化互動,這對敏感於「語感」的台灣市場尤其重要。GPT-4.5 的價值並不只是「翻譯更準」、「回答更順」。我們真正應該關注的,是它是否具備語感適應的能力,能否理解語言背後的文化、情緒與人情味。4.5 的繁中表達已明顯跳脫過往「翻譯腔」,更能呈現自然中文語序與情緒語調。它開始「說話像台灣人」,而不只是「會說中文」。這點對於需要品牌口吻、消費者溝通或創意產業而言,是不可忽視的轉捩點。客服、內容行銷、教育科技,甚至心理輔導等場景中,一個能「講人話」、更具溫度的 AI,將大幅提升用戶體驗並增強市場競爭力。

具體來說,企業可藉 GPT-4.5 提升客服的情感連結,教育領域則可運用其情感智慧做為學習輔導,品牌行銷則能借助其創意與文案功底精準觸及目標受眾。

小結:GPT-4.5 是「溫和且有主見的 AI」

GPT-4.5 確實不是一個顛覆世界的產品,但它所代表的方向——讓 AI 更接近人、更能參與溝通、更具有表達層次——對我們來說反而意義重大。在這個內容過剩、注意力分散、創作者焦慮蔓延的時代,GPT-4.5 帶來的,不只是生產力工具的升級,而是一種新型態夥伴關係的雛形。對正積極擁抱 AI 工具的台灣市場來說,GPT-4.5 不只是工具,更可能是未來職場與生活中的重要「虛擬同事」——這或許才是這次更新真正耐人尋味之處。它或許還不夠完美,偶爾自說自話,也會在情感演繹上踩線失衡。但它正學習如何成為我們創作、溝通與生活上的另一半,或至少,一位總是在線、不抱怨並且還挺可靠的 AI 同事。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *