人工智能公司 Anthropic 宣布推出全新 Claude Opus 4.7 型號,該模型現已全面開放使用。根據官方資料,Claude Opus 4.7 在進階軟件工程領域較上一代型號有顯著提升,尤其在最具挑戰性的任務方面表現突出。
據悉,用戶反映能夠將過往需要密切監督的艱深編碼工作放心交付予 Opus 4.7 處理。該模型能夠嚴谨且一致地處理複雜且耗時較長的任務,精確遵循指令指引,並會自行設計方法驗證輸出結果後方回報。
Claude Opus 4.7 在視覺處理能力方面亦有實質改進,能以更高解析度讀取圖像資料。在創意應用層面,該模型執行專業任務時展現更佳品味與創意,生成的介面、簡報及文件質素有所提升。
不過,官方同時指出,Claude Opus 4.7 的整體能力不及 Anthropic 最強大的 Claude Mythos Preview 型號,但在多項基準測試中較 Opus 4.6 呈現更佳表現。
值得關注的是,Claude Opus 4.7 為首批實施網絡安全防護措施的模型。Anthropic 表示,該模型的網絡安全能力不及 Mythos Preview,在訓練過程中更特別進行削弱這方面能力的實驗。模型內置自動偵測及阻擋功能,能夠識別並阻止涉及禁止或高風險網絡安全用途的請求。
Anthropic 同時推出網絡安全驗證計畫(Cyber Verification Program),邀請有合法網絡安全用途(如漏洞研究、滲透測試及紅隊演練)需求的專業人士申請使用。
多位 Early Access 測試者就 Opus 4.7 的表現提供意見。金融科技平台代表指出,該模型結合速度與精準度,有助加快開發流程。另有技術總監形容,Opus 4.7 在處理真實世界的非同步工作流程方面表現突出,對自動化、持續整合與持續部署(CI/CD)以及長時間運行任務支援完善。
編碼效能方面,據測試結果顯示,在包含93項任務的編碼基準測試中,Opus 4.7 較 Opus 4.6 的解析率提升13%,當中四項任務為 Opus 4.6 及 Sonnet 4.6 均無法解決的難題。
軟件開發平台方面表示,Opus 4.7 正確報告資料缺失情況,而非提供看似合理但實際有誤的替代方案,並能抵抗足以令 Opus 4.6 陷入困境的資料不一致陷阱。另有測試者形容,低投入程度的 Opus 4.7 約等同於中等投入程度的 Opus 4.6。
在代理工具測試中,Opus 4.7 在工具調用及規劃準確度方面錄得雙位數提升,且在較少標記代幣使用的情況下較 Opus 4.6 提升14%,工具錯誤率更降低三分之二。
Claude Opus 4.7 即日起於所有 Claude 產品及 API 平台上開放使用,同時支援 Amazon Bedrock、Google Cloud Vertex AI 及 Microsoft Foundry 等雲端服務。定價維持與 Opus 4.6 相同水平:每百萬輸入Tokens收費5美元,每百萬輸出Tokens收費25美元。開發者可直接透過 Claude API 使用 claude-opus-4-7。
資料來源: https://www.anthropic.com/news/claude-opus-4-7
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/269503.html