英偉達(dá)財(cái)報(bào)前夜,OpenAI下一代模型“泄漏”:吃“草莓”的“獵戶座”
激石Pepperstone(http://dsgkdz.com/)報(bào)道:
GPT-5遲遲未出,等來了神秘的“草莓”和“獵戶座”模型,OpenAI再次站在風(fēng)口浪尖。
據(jù)科技媒體The Information最新報(bào)道,OpenAI神秘“草莓”(Strawberry,前身為Q*)項(xiàng)目,計(jì)劃最早今年秋季推出。同時(shí)用“草莓”合成數(shù)據(jù)來開發(fā)的最新大模型“獵戶座”(Orion),該模型或于明年年初推出。
此前,OpenAI多次“放風(fēng)”將推出“草莓”模型,ChatGPT曾于8月初在X上發(fā)布了草莓的表情,似乎在暗示在“草莓”大模型,Sam Altman最近也在社交媒體上發(fā)布了一張草莓的圖片。
“草莓”是一個(gè)推理模型,核心能力在于強(qiáng)大的推理能力,可處理復(fù)雜的問題;“獵戶座”則是超越GPT-4的下一代大模型,減少過程中幻覺或錯(cuò)誤大幅減少。
此外,“草莓”模型不僅會(huì)為獵戶座提供訓(xùn)練數(shù)據(jù),OpenAI可能還會(huì)用“草莓”的簡(jiǎn)化版本集成在ChatGPT中,增強(qiáng)GPT-4的推理能力。
神秘的“草莓”和“獵戶座”模型是什么?
具體來看,“草莓”是一個(gè)推理模型:
- 核心能力在于強(qiáng)大的推理能力,它并不局限于回答技術(shù)問題,而是擁有處理復(fù)雜問題的能力,例如解決編程和數(shù)學(xué)問題,這在傳統(tǒng)的對(duì)話式AI中一直是一個(gè)難題。
- ?盡管提高語(yǔ)言理解和推理能力,但同時(shí)需要額外更多地時(shí)間去“思考”;
而“獵戶座”則是超越GPT-4的下一代大模型:
使用“草莓”的高質(zhì)量數(shù)據(jù)訓(xùn)練,從而減少模型產(chǎn)生的幻覺或錯(cuò)誤。
“草莓”技術(shù)對(duì)“獵戶座”的重要性不言而喻。據(jù)研究人員透露,使用“草莓”可以為“獵戶座”生成高質(zhì)量的訓(xùn)練數(shù)據(jù),“獵戶座”通過訓(xùn)練數(shù)據(jù)學(xué)習(xí),接觸到的正確復(fù)雜推理示例越多,學(xué)習(xí)效果就越好。
推理能力大爆發(fā),“草莓”更像個(gè)推理插件
OpenAI創(chuàng)始人兼CEO奧特曼曾強(qiáng)調(diào),今后AI發(fā)展的關(guān)鍵將圍繞推理能力展開。
由于推理能力限制,目前AI技術(shù)在諸如航空航天、結(jié)構(gòu)工程之類的數(shù)學(xué)密集型行業(yè)中并沒有得到廣泛應(yīng)用。因此,大模型數(shù)學(xué)推理能力的優(yōu)化成為普及AI應(yīng)用的必備條件,也是AI公司們進(jìn)一步提升盈利能力的必經(jīng)之路。
“草莓”模型的前身是Q*算法模型,Q*能夠解決棘手的科學(xué)和數(shù)學(xué)問題。如果AI模型掌握了數(shù)學(xué)能力,將擁有更強(qiáng)的推理能力,甚至可以解決從未見過的數(shù)學(xué)問題或者自發(fā)解決變成問題,與人類智能相媲美。
值得一提的是,“草莓”模型在 MATH 基準(zhǔn)測(cè)試中的得分已經(jīng)超過90%,整體性能十分驚艷。
有網(wǎng)友稱,相信草莓模型會(huì)成為金融等科技的行業(yè)改變規(guī)則,徹底解決復(fù)雜計(jì)算、推理的方式。
從產(chǎn)品路線上看,OpenAI或?qū)⒃嫉摹安葺蹦P屯ㄟ^“蒸餾”生成簡(jiǎn)化版本,將改進(jìn)的推理能力整合到GPT中。簡(jiǎn)化版本旨在保持與原始模型相同的性能水平,同時(shí)操作更容易、成本更低。
盡管這可能會(huì)使答案更準(zhǔn)確,但花費(fèi)的時(shí)間可能更多,這意味著“草莓”可能不適合需要即時(shí)響應(yīng)的應(yīng)用,預(yù)計(jì)ChatGPT用戶將能夠根據(jù)需求選擇開啟或關(guān)閉“草莓”功能。?????????
掃描二維碼推送至手機(jī)訪問。
版權(quán)聲明:本文由激石Pepperstone發(fā)布,如需轉(zhuǎn)載請(qǐng)注明出處。