GPT-5不夠驚喜

發(fā)布時間：2025-08-11 09:19:46來源：北京商報

　　千呼萬喚，GPT-5面世了。一鍵生成網(wǎng)頁、寫作像詩人、更懂健康問題，OpenAI稱它將徹底改變?nèi)藗児ぷ?、學(xué)習(xí)及創(chuàng)新方式。但許多人表示，這次GPT-5并沒有帶來更多的驚喜，反倒是價格策略成了此次發(fā)布的最大亮點。GPT-5上線后，社交媒體出現(xiàn)不少關(guān)于GPT-5使用感不佳的吐槽，更有用戶直呼"還我GPT-4o"。面對用戶爭議，OpenAI發(fā)文宣布，重新上線GPT-4o，供Plus和Team用戶使用。

　　"博士級專家"

　　自2018年OpenAI發(fā)布首個大模型GPT-1以來，GPT系列已經(jīng)走過了七年。2020年GPT-3的出現(xiàn)，讓大模型參數(shù)規(guī)模從15億直接拓展到了1750億，也因此通過"上下文學(xué)習(xí)"能力，擺脫了對大量標(biāo)注數(shù)據(jù)的依賴，使大模型能夠開始作為效率工具使用。

　　兩年后，基于GPT-3.5構(gòu)建的對話式模型ChatGPT上線，進一步推動大模型走入C端日常，成為通用AI應(yīng)用的重要落地轉(zhuǎn)折點。隨后GPT-4的全面升級，更是在實現(xiàn)萬億級模型參數(shù)的同時，讓大模型在單純文本輸出的基礎(chǔ)上，實現(xiàn)了圖像的交互提升。

　　美東時間8月7日，OpenAI正式發(fā)布GPT-5。新模型發(fā)布后，OpenAI聯(lián)合創(chuàng)始人、首席執(zhí)行官薩姆·奧爾特曼在一場訪談中表示，相比于GPT-4，GPT-5不僅能解答各種難題，更能實現(xiàn)即時的、按需的軟件開發(fā)，并將徹底改變?nèi)藗児ぷ鳌W(xué)習(xí)及創(chuàng)新方式。

　　奧爾特曼用三個身份，類比了公司三代旗艦?zāi)Ｐ偷难葸M：GPT-3像是偶有靈光閃現(xiàn)但常伴挫敗感的高中生;GPT-4則如同具備了真實智慧與實用價值的大學(xué)生;而最新的GPT-5，則被譽為可以按需召喚的"博士級專家"，能夠隨時助力用戶達(dá)成各種復(fù)雜目標(biāo)。

　　OpenAI聲稱，GPT-5在超高難度的科學(xué)問題上刷新了世界紀(jì)錄，并在與人類專家的對比測試中，有近70%的場景表現(xiàn)更優(yōu)。此外，GPT-5還與現(xiàn)有的o系列模型進行了無縫整合，能夠根據(jù)任務(wù)的復(fù)雜性，自動選擇最佳的推理路徑。官方數(shù)據(jù)顯示，GPT-5在代碼生成和寫作領(lǐng)域的準(zhǔn)確率均高于GPT-4系列，部分內(nèi)部測試中的錯誤率甚至下降了約80%。

　　值得一提的是，在訪談中，奧爾特曼表示，GPT-5在健康建議方面的能力顯著提升，它的答案更準(zhǔn)確、幻覺更少，更有可能告知真正的病因和應(yīng)對措施。奧爾特曼還表示，在2035年，人們將能借助這些工具治愈或至少有效治療許多目前仍在困擾人類的疾病。

　　在奧爾特曼看來，在GPT-8時代，人們可以利用這一AI工具治療某種癌癥。比如，GPT-8會先遍歷所有現(xiàn)存的研究與數(shù)據(jù)，并提出治療思路。隨后告知用戶："我需要你找一個實驗室完成這9個實驗，并反饋結(jié)果。"

　　邊際收益遞減

　　近兩年，隨著AI工具開始席卷各行各業(yè)，人們渴望AI能夠取代重復(fù)繁瑣的工作，也在擔(dān)憂自己是否會被AI所取代，這也是GPT-5發(fā)布前備受關(guān)注的原因之一。

　　但相比此前GPT-3到GPT-4所帶來的全方位升級，許多人表示，這次GPT-5并沒有帶來更多的驚喜，從發(fā)布會規(guī)模、產(chǎn)品亮點到性能升級，都顯得較為平庸，相較當(dāng)前主流SOTA模型，提升幅度并不顯著。

　　從第三方的基準(zhǔn)測試數(shù)據(jù)來看，GPT-5相較于競爭對手的旗艦?zāi)Ｐ?，其領(lǐng)先優(yōu)勢也微乎其微。根據(jù)Artificial Analysis的綜合排名，GPT-5目前雖然位列第一，但其綜合得分僅比自家的老模型o3高出兩分，比Grok 4僅高出一分。而在被譽為AGI終極測試的Arc Prize競賽中，GPT-5更是被Grok 4大幅超越。

　　OpenAI在發(fā)布會上還特別強調(diào)了GPT-5在代碼生成和寫作方面的能力。然而，用戶的實際使用體驗，似乎并未完全印證官方的說法。Meta公司的一位工程師體驗GPT-5后在社交媒體上感嘆道："GPT-5僅用一次調(diào)用就重構(gòu)了我的整個代碼庫：25個工具調(diào)用，3000多行新代碼，12個全新的文件。"但他隨即話鋒一轉(zhuǎn)："然而，這些代碼都無效(無法正常工作)，雖然確實寫得很漂亮。"

　　"GPT-5不太可能‘超越一切預(yù)期’，因為大模型的邊際收益正在迅速遞減。"AI營銷與銷售專家、太和智庫研究員唐興通分析指出，"我們今天所看到的所謂‘進步’，更多是來自于工程層面的調(diào)優(yōu)和多模態(tài)能力的融合，而非純粹的智能層面上的突破。"

　　他認(rèn)為，AI的發(fā)展正面臨兩大物理限制："我們必須清醒地認(rèn)識到，‘數(shù)據(jù)墻’是客觀存在的，高質(zhì)量的公共訓(xùn)練數(shù)據(jù)正在被快速耗盡。同時，算力成本的指數(shù)級增長，也讓過去那種‘大力出奇跡’的暴力美學(xué)難以為繼。"

　　不過，不少人表示價格很"香"。GPT-5的API調(diào)用價格僅為前幾日發(fā)布的Claude Opus 4.1的1/15，顯著低于Gemini 2.5 Pro，在當(dāng)前大模型市場上展現(xiàn)出極強的性價比。

　　缺少溫度

　　最新數(shù)據(jù)顯示，今年8月ChatGPT周活躍用戶已達(dá)7億，同比增長4倍。其付費用戶數(shù)從2024年的300萬增至500萬，Pro會員和企業(yè)版用戶貢獻(xiàn)了超60%的收入。

　　龐大的用戶規(guī)模，幫助ChatGPT的商業(yè)收入再創(chuàng)新高。曾有媒體報道，截至今年7月末，OpenAI預(yù)計將實現(xiàn)120億美元的年度經(jīng)常性收入，成為全球最大的AI創(chuàng)業(yè)公司。它的最大競爭對手Anthropic同期收入預(yù)計僅為50億美元。

　　不過，OpenAI的挑戰(zhàn)也顯而易見。尤其是在企業(yè)級市場，OpenAI的市場份額正在迅速被競爭對手蠶食。近期，海外投資機構(gòu)Menlo Ventures發(fā)布的一份報告顯示，Anthropic在企業(yè)大語言模型市場占有率已達(dá)32%。相比之下，OpenAI的市場份額僅為25%。

　　ChatGPT-5上線后，不少用戶發(fā)現(xiàn)OpenAI停用了GPT-4o版本。社交媒體出現(xiàn)不少關(guān)于GPT-5使用感不佳的吐槽，更有用戶直呼"還我GPT-4o"。用戶對GPT-5的"吐槽"，主要集中在新模型雖提升了回答的專業(yè)度，但卻缺少了情感交互的溫度、個性及想象力。

　　面對用戶爭議，OpenAI發(fā)文宣布，重新上線GPT-4o，供Plus和Team用戶使用，若需多平臺使用，用戶可在ChatGPT網(wǎng)頁版設(shè)置中啟用"顯示舊版模型"訪問GPT-4o。與此同時，下周還將推出迷你版GPT-5和GPT-5 thinking。

　　針對用戶對GPT-5的負(fù)面反饋，奧爾特曼解釋稱，這是由于自動切換器損壞，致使GPT-5表現(xiàn)異常。他表示，未來將專注于完成GPT-5的部署與改進，并確保其穩(wěn)定性。奧爾特曼同時透露，GPT-5上線后，ChatGPT API流量在24小時內(nèi)翻倍增長，OpenAI正在全力優(yōu)化系統(tǒng)并尋找更多的容量。但他坦言，預(yù)計下周仍將面臨嚴(yán)峻的容量挑戰(zhàn)。

　　奧爾特曼坦言，低估了用戶對GPT-4o的喜愛程度，并表示這強化了公司為不同用戶提供定制化服務(wù)的理念，未來將推出比當(dāng)前更多的定制化內(nèi)容。同時，其宣布將允許Plus用戶繼續(xù)使用GPT-4o，并將密切關(guān)注用戶使用情況，考慮舊版本模型的保留期限。

　　北京商報記者趙天舒

外賣大戰(zhàn)降溫，專家吁多...

最后一頁

熱點推薦

国产精品99久久久久久人小-av在线免费观看小说-女同志一区二区你懂的在线-日韩一区二区三区精品丝袜

GPT-5不夠驚喜