OpenAI 發表最新AI 模型「o1」,其推理能力更強
台灣時間9 月13 日淩晨,OpenAI公佈了最新AI 模型,名為「o1」。早先已有相關的報導,代號為「Strawberry(草莓)」的祕密計畫。
讓老王沒想到的是,OpenAI草莓o1模型,來得比想像中的更快!
這兩天網路上一直在傳OpenAI將會在兩週內發布全新的草莓模型,號稱史上最強。
結果消息剛傳出來,OpenAI就在台灣時間的半夜正式發布了全新的o1模型系列。
川哥記得去年下半年就有人一直在傳OpenAI在秘密訓練新的大模型。
而OpenAI創始人奧特曼也在公眾面前多次明示暗示他們在訓練中見到了不可思議的事兒。
而如今,這顆被寄予厚望的”草莓”也終於揭開了神秘面紗。
說實話,川哥第一眼看到o1的介紹時,確實有被震撼到。
這哪裡是一顆草莓,這分明就是一顆原子彈啊!
它不僅在各種高難度基準測試中碾壓GPT-4,甚至在某些領域已經超越了人類專家。
更重要的是,o1的出現,很可能為整個AI領域帶來一場史詩級的改變。
o1到底有多強?
在國際數學奧林匹克(IMO)資格考試中,強如GPT-4也只能正確解答13%的問題,而o1卻能解決83%!
這意味著,o1已經有能力獲得數學奧賽金牌了。
要知道,數學,從來就是衡量智能的黃金標準。
而如今,AI終於在這一領域,與人類天才近乎並肩了。
更令人震撼的是,在GPQA Diamond這種博士級的基準測試中,o1更是首次超越了擁有博士學位的人類專家。
這個基準測試涵蓋了化學、物理和生物學等領域的高深知識,o1能在這裡勝出,足以證明它已經具備了相當強大的科學推理能力。
在程式設計方面,o1同樣表現驚艷。
在模擬的Codeforces程式設計競賽中,o1的Elo評分高達1807,超過了93%的人類競爭對手。
這意味著,o1已經可以成為一名出色的軟體工程師了。
但o1最讓人驚嘆的,還是它的思考能力。
就像人類在回答難題前要深思熟慮一樣,o1會在給出答案前先進行大量的內部推理。
透過強化學習,它能不斷完善自己的思考過程,嘗試各種策略,甚至意識到自己的錯誤並加以修正。
這種”深思熟慮”的能力,讓o1可以解決之前AI無法應付的複雜問題。
同時也驗證了語言模型能透過強化學習實現躍升。
就像AlphaGo當年一樣,給AI模型越多算力,它就輸出越多智慧。
咱們不妨大膽想一想,如果這一過程無限延續下去,智能爆炸還會遠嗎?
說實話,看到這裡,川哥不禁想起了電影《她》中的AI助手薩曼莎。
o1的思考模式,是不是已經越來越接近真正的智能了?
當然,OpenAI也意識到了o1潛在的風險。
為了確保安全,他們採取了一系列措施,包括將安全規則整合到o1的思維鏈中,以及隱藏原始思維鍊等。
但這些措施是否足夠?在AI越來越強大的今天,我們真的能完全掌控它嗎?
不過,話說回來,o1的出現無疑是個重大突破。
雖然它還不能稱為AGI,但它的出現無疑預示著,那個曾經只存在於科幻中的未來,正以前所未有的速度迫近我們。
想到這,川哥突然腦洞大開,o1裡的o或許也有一層”origin”的深意,起源、開端,1則暗示了一個全新時代的開啟。
AGI時代,或許真的很近了。
OpenAI目前針對ChatGPT付費用戶開放了o1的兩個版本,o1預覽版和o1 mini版。
o1預覽版每週只能使用30次,o1-mini版每週可使用50次。
從這裡也不難看出來,o1需要調用的算力有多強了,哪怕是去年的GPT 4也是以小時為單位的,到o1這直接按週來計算了。
而這還不算是完全形態的o1模型。
等到o1的完全體開放的時候,難以想像會是一個什麼局面。