GPT-4o不香了?OpenAI競(jìng)爭(zhēng)對(duì)手Anthropic發(fā)布最強(qiáng)大AI模型Claude 3.5
激石Pepperstone(http://dsgkdz.com/)報(bào)道:
6月20日周四,OpenAI競(jìng)爭(zhēng)對(duì)手Anthropic發(fā)布了公司迄今為止性能最強(qiáng)大的AI模型Claude 3.5 Sonnet。
在覆蓋閱讀、編程、數(shù)學(xué)和視覺(jué)等領(lǐng)域的多項(xiàng)性能測(cè)試中,Claude 3.5 Sonnet的性能略勝一籌,吊打GPT-4o等一眾競(jìng)爭(zhēng)對(duì)手的AI模型,且優(yōu)于自家旗艦?zāi)P虲laude 3 Opus。當(dāng)然,也有些測(cè)試不能完全反映AI在現(xiàn)實(shí)運(yùn)用的情況,偏小眾和個(gè)例。
Anthropic的產(chǎn)品負(fù)責(zé)人Michael Gerstenhaber自信表示道:“對(duì)企業(yè)來(lái)說(shuō),重要的是AI是否能幫助他們滿(mǎn)足業(yè)務(wù)需求,而不是AI在性能測(cè)試中是否具有競(jìng)爭(zhēng)力,從這個(gè)角度來(lái)看,我相信Claude 3.5 Sonnet將領(lǐng)先于我們現(xiàn)有的任何其他產(chǎn)品,也領(lǐng)先于行業(yè)中的任何其他產(chǎn)品?!?/p>
定價(jià)方面,新模型定價(jià)與前代3 Sonnet模型相同,即每輸入百萬(wàn)token為3美元,每生成百萬(wàn)token為15美元,并具有20萬(wàn)個(gè)token的上下文窗口,約合15萬(wàn)個(gè)單詞。Token是數(shù)據(jù)的細(xì)分單元,例如單詞“fantastic”中的“fan”、“tas”和“tic”。
現(xiàn)在,用戶(hù)可以通過(guò)Anthropic的網(wǎng)頁(yè)客戶(hù)端和iOS應(yīng)用免費(fèi)試用新模型,而訂閱了Claude Pro和Claude Team的用戶(hù)將享受5倍的速率限制。此外,新模型也在A(yíng)nthropic的API以及亞馬遜Bedrock和谷歌云的Vertex AI等托管平臺(tái)上上線(xiàn)。
今年晚些時(shí)候,公司還將推出更大更好的模型,如Claude 3.5 Haiku和Claude 3.5 Opus。后者配備有網(wǎng)絡(luò)搜索和偏好記憶等功能。
最強(qiáng)視覺(jué)模型、速度提升兩倍、幽默感增加、內(nèi)容迭代功能
和前一代模型Claude 3 Opus相比,新模型在多個(gè)方面實(shí)現(xiàn)了性能上的提升。Anthropic在一篇博客中寫(xiě)道:“它在把握細(xì)微差別、幽默和復(fù)雜指示方面有顯著進(jìn)步,在以自然、合理的語(yǔ)氣撰寫(xiě)高質(zhì)量?jī)?nèi)容方面也十分出色。此外,它還可以編寫(xiě)、編輯和執(zhí)行代碼?!?/p>
例如,與3 Opus相比,Claude 3.5 Sonnet在理解復(fù)雜指令和細(xì)微差別方面更為出色,甚至能夠更好地把握幽默概念,盡管AI在幽默感方面通常表現(xiàn)不佳。
對(duì)于需要快速響應(yīng)的應(yīng)用程序,如客戶(hù)服務(wù)聊天機(jī)器人,3.5 Sonnet的處理速度是Claude 3 Opus的兩倍,成本只有其五分之一。
視覺(jué)分析方面,3.5 Sonnet能夠更準(zhǔn)確地解讀圖表和圖形,并能從存在失真和視覺(jué)偽影的“不完美”圖像中轉(zhuǎn)錄文本。
除了新模型的推出,Anthropic還推出了新功能“Artifacts預(yù)覽版”,這是一個(gè)工作空間,允許用戶(hù)能夠編輯和迭代AI模型生成的內(nèi)容。
想象一下,你在使用一個(gè)AI助手來(lái)幫你寫(xiě)代碼。當(dāng)你向AI提出你的要求后,AI會(huì)生成一段代碼。在A(yíng)rtifacts功能中,這段代碼不僅僅是顯示給你,而是會(huì)以一種可以操作和修改的形式出現(xiàn)在你的界面上,就像是一個(gè)“工件”或是一個(gè)“草稿”。
接下來(lái),你可以對(duì)這段代碼進(jìn)行迭代——也就是說(shuō),你可以修改它,增加新的功能,或者和 AI 助手“Claude”交流,告訴它你的修改意見(jiàn)或新的需求。AI 會(huì)根據(jù)你的反饋再次生成代碼,你則可以繼續(xù)這個(gè)過(guò)程,直到代碼達(dá)到你的期望,可以被實(shí)際運(yùn)行。
這個(gè)過(guò)程就像是你和AI一起合作,不斷地打磨和完善最終的產(chǎn)品。Artifacts提供了一個(gè)平臺(tái),讓你能夠更容易地與AI模型互動(dòng),并且對(duì)生成的內(nèi)容進(jìn)行有效的管理和優(yōu)化。
目前Artifacts處于預(yù)覽階段,Anthropic計(jì)劃在未來(lái)為其增加新功能,比如支持與大型團(tuán)隊(duì)協(xié)作和知識(shí)庫(kù)存儲(chǔ)。
此外,媒體稱(chēng),Claude 3.5 Sonnet雖然是一個(gè)先進(jìn)的AI模型,但它并不完美,仍然可能會(huì)犯錯(cuò)。盡管如此,它的能力可能足以吸引開(kāi)發(fā)者和企業(yè)轉(zhuǎn)向Anthropic的平臺(tái)。畢竟,這才是對(duì)Anthropic最重要的。
模型改進(jìn)部分歸功于訓(xùn)練數(shù)據(jù),但來(lái)源不明
Anthropic的產(chǎn)品負(fù)責(zé)人Michael Gerstenhaber表示,這些改進(jìn)歸功于模型架構(gòu)的調(diào)整和新的訓(xùn)練數(shù)據(jù)(包括AI生成的數(shù)據(jù))。至于具體是哪些數(shù)據(jù)帶來(lái)了這些增強(qiáng)?Gerstenhaber沒(méi)有透露詳細(xì)信息。
出于保護(hù)商業(yè)機(jī)密和避免法律挑戰(zhàn)的考慮,訓(xùn)練數(shù)據(jù)的具體細(xì)節(jié)尚未公開(kāi),但Claude 3.5 Sonnet和公司以往AI模型一樣,經(jīng)過(guò)了大量文本和圖像的訓(xùn)練,并通過(guò)人類(lèi)測(cè)試人員的反饋,試圖讓模型與用戶(hù)的意圖“保持一致”,希望以此防止模型生成有害或有問(wèn)題的文本。
目前法院尚未做出裁決,即Anthropic等供應(yīng)商及其競(jìng)爭(zhēng)對(duì)手(如 OpenAI、谷歌、亞馬遜等)是否有權(quán)使用公共數(shù)據(jù)(包括受版權(quán)保護(hù)的數(shù)據(jù))進(jìn)行訓(xùn)練,而無(wú)需向這些數(shù)據(jù)的創(chuàng)作者提供補(bǔ)償。
網(wǎng)友怎么看?
網(wǎng)友們社交媒體X上發(fā)帖表示:
“Claude 3.5 Sonnet是最新推出的最佳LLM模型!剛剛為ChatGPT Plus支付了20美元,現(xiàn)在我必須為Claude支付20美元,我的聊天記錄怎么辦?這些LLM戰(zhàn)爭(zhēng)才剛剛開(kāi)始?!?/p>
“來(lái)自Anthropic的競(jìng)爭(zhēng)很激烈,但我希望ChatGPT能夠與之匹敵甚至更好,因?yàn)檫w移到新服務(wù)需要成本?!?/p>
“Anthropic剛剛發(fā)布了Claude 3.5 Sonnet,據(jù)介紹性能可以說(shuō)相當(dāng)于A(yíng)nthropic最高級(jí)型號(hào)大模型Claude 3 Opus,而API收費(fèi)價(jià)格與Claude 3 Sonnet相同,作為默認(rèn)的免費(fèi)體驗(yàn)AI已經(jīng)替換了Claude 3 Sonnet。也就是,現(xiàn)在就可以免費(fèi)用上這個(gè)最好性能的AI了?!?/p>
新模型對(duì)Anthropic和AI生態(tài)系統(tǒng)有何意義?
今年3月,Anthropic推出了Claude 3系列模型。隨后,OpenAI在5月份推出了GPT-4o。6月20日Anthropic又推出了Claude 3.5家族的第一款模型“Claude 3.5 Sonnet”。
媒體指出,在A(yíng)I技術(shù)的不斷演進(jìn)中,Anthropic公司的Claude 3.5 Sonnet模型雖未帶來(lái)翻天覆地的變化,卻代表了AI模型發(fā)展的現(xiàn)階段現(xiàn)實(shí):在期待重大科研突破的同時(shí),實(shí)現(xiàn)逐步的性能提升,即在等待重大研究突破的同時(shí),持續(xù)進(jìn)行小步快跑。
近幾個(gè)月,包括谷歌的Gemini 1.5 Pro和OpenAI的GPT-4o在內(nèi)的旗艦產(chǎn)品,僅在基準(zhǔn)測(cè)試和性能上實(shí)現(xiàn)了小幅提升。由于現(xiàn)有模型架構(gòu)的局限性和訓(xùn)練所需的巨大計(jì)算資源,業(yè)界尚未再次見(jiàn)證類(lèi)似從GPT-3到GPT-4的巨大飛躍。
隨著生成性AI供應(yīng)商將重點(diǎn)轉(zhuǎn)向數(shù)據(jù)整理和許可,投資者對(duì)于生成性AI投資回報(bào)的預(yù)期變得更加審慎。Anthropic得益于亞馬遜(以及谷歌的較小程度支持)的有利位置,相對(duì)免受這種壓力的影響。然而,Anthropic預(yù)計(jì)到2024年底的營(yíng)收僅略低于10億美元,與OpenAI相比仍有較大差距。
Anthropic擁有包括Bridgewater、Brave、Slack和DuckDuckGo等知名品牌在內(nèi)的不斷增長(zhǎng)的客戶(hù)群,但在企業(yè)信譽(yù)方面仍有提升空間。值得注意的是,普華永道最近選擇與OpenAI合作,而非Anthropic,以向企業(yè)轉(zhuǎn)售生成性AI產(chǎn)品。
Anthropic意識(shí)到,隨著模型之間能力差距的縮小,建立一個(gè)圍繞模型構(gòu)建生態(tài)系統(tǒng)(而不是孤立的模型)是留住客戶(hù)的關(guān)鍵。
一方面,為了留住客戶(hù),Anthropic在加強(qiáng)工具開(kāi)發(fā)。比如允許開(kāi)發(fā)人員深入控制AI模型的內(nèi)部功能,以及讓AI模型能夠在應(yīng)用程序中執(zhí)行特定的操作。這些工具包括前面提到的Artifacts。
另一方面,公司在擴(kuò)展團(tuán)隊(duì)和市場(chǎng)。Anthropic聘請(qǐng)了Instagram的聯(lián)合創(chuàng)始人作為產(chǎn)品負(fù)責(zé)人,這表明公司在產(chǎn)品開(kāi)發(fā)方面的重視。此外,公司在倫敦和都柏林設(shè)立了辦公室,這有助于擴(kuò)大其產(chǎn)品的市場(chǎng)覆蓋。
當(dāng)然,成本也很重要。Anthropic產(chǎn)品負(fù)責(zé)人Michael Gerstenhaber表示:“當(dāng)你在構(gòu)建應(yīng)用程序時(shí),最終用戶(hù)不需要關(guān)心背后使用的模型或優(yōu)化細(xì)節(jié),而工程師則可以利用工具來(lái)優(yōu)化體驗(yàn),其中成本是一個(gè)重要因素?!?????????
掃描二維碼推送至手機(jī)訪(fǎng)問(wèn)。
版權(quán)聲明:本文由激石Pepperstone發(fā)布,如需轉(zhuǎn)載請(qǐng)注明出處。