新智元報(bào)道
編輯:桃子
【資料圖】
【新智元導(dǎo)讀】GPT-5一場鬧劇,讓OpenAI出大糗了!讓所有人都以為GPT-5破解了十道Erdos難題,沒想到竟是查文獻(xiàn)給出了答案。Hassabis點(diǎn)評,這太尷尬了。
OpenAI團(tuán)隊(duì)狂吹了一波GPT-5,結(jié)果竟是鬧劇一場......
事情是這樣的。
幾天前,OpenAI科學(xué)家Sebastien Bubeck激動轉(zhuǎn)發(fā),兩位研究員聯(lián)手GPT-5 Pro,僅用了一個(gè)周末,破解了10個(gè)「百年懸案」——
埃爾德什難題(Erdos problems)
緊接著,OpenAI科學(xué)副總裁Kevin Weil等人紛紛加入,大肆宣傳。
然而,真相很快浮出水面:
這十道難題,早就被學(xué)界解決,并非由GPT-5獨(dú)立解決,它只是通過檢索網(wǎng)絡(luò)文獻(xiàn)給出了答案。
消息一出,輿論嘩然。就連谷歌DeepMind CEO Demis Hassabis也忍不住評價(jià),「這也太尬了」。
還有,圖靈獎(jiǎng)得主LeCun閃現(xiàn)X上嘲諷,「簡直就是,搬起石頭(GPT)砸自己的腳」。
GPT-5,一場鬧劇
這場鬧劇,可以說OpenAI團(tuán)隊(duì)的自導(dǎo)自演。
研究人員Mark Sellke和Mehtaab Sawhney發(fā)文很明確,并沒有說GPT-5破解了難題。
他們原帖是,通過GPT-5數(shù)千條查詢后,找到了十個(gè)被列為Erdos問題的解。
當(dāng)時(shí)的結(jié)果是,問題223、339、494、515、621、822、883、903、1043、1079都得到了解決,同時(shí)在另外 11 個(gè)問題上也取得了部分進(jìn)展。
另一方面,這十道難題早已有了答案,只不過網(wǎng)站管理者并未更新。
傳送門:https://www.erdosproblems.com/
英國皇家學(xué)會研究院Thomas Bloom,網(wǎng)站erdosproblems.com運(yùn)營者,卻對此并不知情。
網(wǎng)站上,「開放」?fàn)顟B(tài)僅代表他個(gè)人并不了解該問題的解法,而不是表示該問題在科學(xué)界尚未被解決。
總言之,兩個(gè)誤會,湊在了一起,讓人們產(chǎn)生了「幻覺」——GPT-5攻克了埃爾德什難題。
一方面,難題并非未解決,只是網(wǎng)站維護(hù)者不清楚;另一方面,GPT-5僅通過搜索文獻(xiàn)完成,并非自己解決。
Sebastien Bubeck尷尬回復(fù)道,GPT-5只是在文獻(xiàn)中找到了解決方案,僅此而已。
即便如此,已經(jīng)非常高效了,因?yàn)槲抑浪阉魑墨I(xiàn)是有多么地困難。
網(wǎng)友熱議,還需同行評審
評論區(qū)的大佬們,正坐在前排吃瓜。
通過這場爭論,開發(fā)者M(jìn)att Mazur認(rèn)真地表示,所有人必須謹(jǐn)慎地對待任何關(guān)于AI發(fā)現(xiàn)新科學(xué)/數(shù)學(xué)成果的說法」。
Hyperbolic創(chuàng)始人Yuchen Jin稱,「關(guān)于AI發(fā)現(xiàn)科學(xué)/數(shù)學(xué)的新發(fā)現(xiàn),需要更多的同行評審」。
不過也有人認(rèn)為,這對GPT-5來說并不尷尬,畢竟它在文獻(xiàn)檢索方面表現(xiàn)還是很出色的。
幾天前,陶哲軒也曾發(fā)文表示,我越來越覺得,眼下AI要在數(shù)學(xué)領(lǐng)域真正發(fā)揮作用,關(guān)鍵可能不在用最牛的模型去攻克最難的題目——
當(dāng)然偶爾會有這種案例,特別是當(dāng)人們砸了大量算力和專家精力進(jìn)去的時(shí)候。
但更靠譜的路線,反而是用中等水平的AI工具,去幫我們搞定那些研究里繞不開的瑣碎活、體力活。
無論何時(shí),對AI原創(chuàng)發(fā)現(xiàn)保持審慎都是第一位的,但這并不妨礙AI輔助科研成為未來的必經(jīng)之路。
參考資料:
https://x.com/SebastienBubeck/status/1979539604522127746
https://x.com/thomasfbloom/status/1979254235075059732
關(guān)鍵詞: 數(shù)學(xué) 圖靈獎(jiǎng) gpt 科學(xué)界 openai deepmind 杰米斯·哈薩比斯
免責(zé)聲明:本網(wǎng)站所有信息,并不代表本站贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé),投資者據(jù)此操作,風(fēng)險(xiǎn)請自擔(dān)。
人民財(cái)訊10月19日電,據(jù)路透社18日報(bào)道,法國奢侈品巨頭開云集團(tuán)計(jì)劃將旗下美妝部門出售給法國歐萊雅集團(tuán)。報(bào)道稱,這筆交易可能會達(dá)到40億美元、約合人民幣285億元。交易內(nèi)容包括歐萊雅將獲得高端香水品
希勒:哲凱賴什的作用是插到防線身后,這能給隊(duì)友創(chuàng)造出空間,希勒,防線,阿森納,哲凱賴什
年產(chǎn)值超10億元!昆山又一高端智能項(xiàng)目投產(chǎn)!
GPT-5破解世紀(jì)難題,竟是上網(wǎng)抄來的!哈薩比斯:太尷尬了,數(shù)學(xué),圖靈獎(jiǎng),gpt,科學(xué)界,openai,deepmind,杰米斯·哈薩比斯
誰是“紙老虎”?萌虎寶寶遇上機(jī)器狗既想“貼貼”,又膽怯地往后縮
2025年10月19日阜陽農(nóng)產(chǎn)品中心批發(fā)市場價(jià)格行情
2025年10月19日貴陽農(nóng)產(chǎn)品物流園價(jià)格行情
在期貨交易中,廣泛挖掘交易機(jī)會是投資者獲取收益的關(guān)鍵。這需要投資者綜合運(yùn)用多種方法,從不同角度去尋找潛在的盈利點(diǎn)?;久娣治鍪峭诰蚱谪浗灰讬C(jī)會的重要手段。通過研
在房產(chǎn)中打造一個(gè)專業(yè)且實(shí)用的攝影室,需要綜合考慮多個(gè)方面的要點(diǎn)。首先是空間布局。攝影室的空間大小要根據(jù)使用需求來確定。如果主要拍攝人像,一般20-30平方米的空
范曾去朋友家吃飯,看中人妻張桂云,那時(shí)候張桂云已經(jīng)是三孩媽媽,沈從文,齊白石,名家,國畫,書畫大師范曾,李苦禪,張桂云
韓鵬為瓦科解圍,澤卡不是中鋒踢法泰山2功勛被棄踢海牛是轉(zhuǎn)折,韓鵬,海牛,魯能,王彤,瓦科,澤卡,洛佩斯,吳興涵
小S獲獎(jiǎng)后舉辦慶功宴開懷大笑,S媽許雅鈞現(xiàn)身,具俊曄夸她很美,小s,大s,許雅鈞,具俊曄,范瑋琪,汪小菲,范曉萱,慶功宴,徐熙娣
灰熊官方:小皮蓬接受左腳大腳趾手術(shù),預(yù)計(jì)傷缺12周,小皮蓬,灰熊官方,斯科蒂·皮蓬,孟菲斯灰熊隊(duì)
金秋時(shí)節(jié),內(nèi)蒙古各地喜迎豐收,科技成為秋糧豐收的“硬核”助力。針對陰雨天氣的不利影響,內(nèi)蒙古全力推進(jìn)作物收獲,確保糧食和重要農(nóng)產(chǎn)品應(yīng)收盡收。地處河套平原的巴彥淖
“支援西北是國事,奉養(yǎng)母親是家事。爹常教導(dǎo)我,有國才有家。我這就跟學(xué)校申請,帶您一起走!娘在哪,家就在哪!國在哪,根就在哪!”10月18日,在“紅星照耀中國:從
中國能建中電工程西北院簽約同華軒崗二期2×66萬千瓦總承包項(xiàng)目人民財(cái)訊10月18日電,據(jù)“西北電力設(shè)計(jì)院”公眾號消息,10月18日,中國能建中電工程西北院與晉能控股山西電力股份有限公司(...

起重機(jī)作為一種高度復(fù)雜的運(yùn)輸系統(tǒng),其運(yùn)行涉及多個(gè)運(yùn)動維度的精確協(xié)調(diào)。在典型的起重機(jī)操作中,起升機(jī)構(gòu)負(fù)責(zé)垂直方向的載荷移動,大車機(jī)構(gòu)實(shí)現(xiàn)水平方向的整體位移,而小車機(jī)構(gòu)則完成精確的定位調(diào)整。這些運(yùn)動往往需要同時(shí)或交替進(jìn)行,這就要求驅(qū)動系統(tǒng)中的減速機(jī)必須具備出色的負(fù)載能力和精準(zhǔn)的控制性能。針對起重機(jī)系統(tǒng)的特殊需求,諾...

鄉(xiāng)村振興有效銜接考核評估反饋問題整改工作開展以來,海東市樂都區(qū)把整

村民送水給施工人員。收邊。運(yùn)輸混凝土。施工現(xiàn)場。施工現(xiàn)場。農(nóng)村道路