Anthropic又發(fā)新模型了,但手里藏著更強(qiáng)的“殺招”
“這一次,用戶可以將最艱難的工作交給新模型,同時(shí)不用太多監(jiān)督?!碑?dāng)?shù)貢r(shí)間4月16日,風(fēng)頭正盛的AI獨(dú)角獸Anthropic又宣布更新了,這次是旗艦新模型Claude Opus 4.7,距離上一代發(fā)布僅間隔兩個(gè)多月。
![]()
Anthropic在推文中表示,新模型能以更嚴(yán)謹(jǐn)?shù)膽B(tài)度處理長時(shí)間運(yùn)行的任務(wù),更精確地遵循指令,并在報(bào)告前驗(yàn)證自己的輸出??雌饋恚翱孔V”是這次模型升級的關(guān)鍵。
值得一提的是,Opus 4.7并非Anthropic手中的最強(qiáng)底牌。從基準(zhǔn)測試來看,雖然新模型Opus 4.7在編程等方面已經(jīng)超過市面上其他競爭對手,但都比不過Claude Mythos Preview。
4 月 7 日,Anthropic開放內(nèi)測的 Claude Mythos Preview模型,但僅有少數(shù)科技公司、金融機(jī)構(gòu)等有限群體能使用,Anthropic認(rèn)為目前這一模型“過于強(qiáng)大”,在代碼與漏洞掃描上展現(xiàn)出“破壞性”的跨代提升,“公開發(fā)布是不負(fù)責(zé)任的”。
看向基準(zhǔn)測試數(shù)據(jù),在編程能力方面,Opus 4.7在SWE-bench Verified這一測試中的得分從上一代的80.8%升至87.6%,是目前公開模型中的第一名,超過Gemini 3.1 Pro的80.6%。但內(nèi)測的Mythos Preview分?jǐn)?shù)達(dá)到了93.9%,提升不小。
SWE-bench Pro是更難的版本,Opus 4.7的得分從 53.4% 升至64.3%,對比之下GPT-5.4是57.7%、Gemini 3.1 Pro 是54.2%。而Mythos Preview分?jǐn)?shù)達(dá)到了77.8%,是目前的最高水平。
![]()
Anthropic收到的用戶反饋顯示,他們能夠自信地將最困難的編碼工作(以前需要密切監(jiān)督的那類)交給Opus 4.7了。
Opus 4.7 這次更新另一大特色是,視覺能力大幅提升。它能夠以超過三倍的分辨率查看圖像,并因此生成更高質(zhì)量的界面、幻燈片和文檔。在基準(zhǔn)測試上,視覺推理的CharXiv分?jǐn)?shù)從上一代的69.1%提升到了82.1%。
“盡管Opus 4.7的性能不如我們最強(qiáng)大的模型Claude Mythos preview,但它在一系列基準(zhǔn)測試中顯示出比Opus 4.6更好的結(jié)果。”翻譯一下Anthropic的潛臺詞是,公司手上有核彈,但眼下發(fā)給用戶的這把新式步槍,絕對安全且好用。
不過,在價(jià)格上,從業(yè)界反饋來看,這次Opus 4.7定價(jià)沒有上漲,但因?yàn)樾枰母鄑oken,帶來的結(jié)果是變相漲價(jià)了。
Opus 4.7的基礎(chǔ)定價(jià)仍然是每百萬token輸入5美元、輸出 25 美元。但官方表示,Opus 4.7引入了全新分詞器,同樣的文本會拆分出比原來多1到1.35 倍的token,疊加上模型在高強(qiáng)度任務(wù)中傾向于更長的思考,這意味著消耗必然上升。
即便如此,Claude的護(hù)城河從來不是低價(jià)。第一財(cái)經(jīng)了解到,對眾多開發(fā)者來說,Claude始終是攻堅(jiān)編程難題的首選工具,只要產(chǎn)出效率帶來的杠桿足夠大,多消耗的那點(diǎn)token成本,對于企業(yè)級用戶而言不過是算得過來的經(jīng)濟(jì)賬。
過去一段時(shí)間,Anthropic的產(chǎn)品迭代節(jié)奏呈現(xiàn)出加速狀態(tài),幾乎每兩周就有一個(gè)重量級發(fā)布。上月底,有一張圖在X流傳,據(jù)不完全統(tǒng)計(jì),在今年2月1日至3月24日,短短52天里,Anthropic 就一共更新了 74 款產(chǎn)品,平均不到兩天一個(gè)。
過去幾個(gè)月,Anthropic更新的內(nèi)容覆蓋法律、金融、營銷、安全等等,每一次發(fā)布,都有一批公司的股價(jià)在次日開盤前跌下去。Anthropic也靠著大模型產(chǎn)品的能力坐穩(wěn)AI圈“頂流”。
值得注意的是,Anthropic除了在產(chǎn)品競爭上發(fā)力,還在劃定更多的邊界,例如宣布禁止“龍蝦”(OpenClaw)這樣的第三方工具用Claude的訂閱服務(wù)。
4月14日,Anthropic還上線了身份驗(yàn)證,宣布為Claude的“部分使用場景”引入強(qiáng)制實(shí)名認(rèn)證。分析指出,這是Claude的一次“合規(guī)清場”,對內(nèi)完成用戶分層與責(zé)任追溯的基礎(chǔ)建設(shè),對外精準(zhǔn)過濾非戰(zhàn)略市場。
盡管如此,Anthropic的收入也一度快超過OpenAI了。
這個(gè)月初,Anthropic宣布公司年化收入(ARR)已超過300億美元(約合人民幣2048億元),和2025年底的90億美元(約合人民幣614億元)相比實(shí)現(xiàn)大幅增長。
從數(shù)據(jù)上看,Anthropic的收入已經(jīng)反超OpenAI,后者最新的年化收入為250億美元(約合人民幣1706億元)。不過,OpenAI首席營收官Denise Dresser在寫給員工的備忘錄里提到,競爭對手Anthropic年化營收存在大約80億的水分,因?yàn)閮杉夜驹谟?jì)算云分發(fā)合作伙伴的收入方式上存在差異。
按Denise Dresser的說法,統(tǒng)一到凈額口徑后,Anthropic對外宣稱的300億美元年化營收,實(shí)際約為220億美元,低于OpenAI的250億。但即便如此,按照Anthropic目前的增長速度,超過OpenAI或許只是時(shí)間問題。
無論是Anthropic還是OpenAI都在積極推進(jìn)上市計(jì)劃。據(jù)外媒報(bào)道,Anthropic最快或?qū)⒂诮衲?0月在美國上市。OpenAI也正為IPO做準(zhǔn)備,?目標(biāo)是2027年上市?,估值可能高達(dá)?1萬億美元?。
AI的競爭,已經(jīng)從拼參數(shù)、拼融資,進(jìn)入了拼收入、拼治理、拼上市時(shí)間表的全新階段。