在2025年7月9日的線上直播中,Elon Musk推出了xAI最新的人工智慧產品——Grok 4,並宣稱這款AI模型的智能超越了大多數研究生。Grok 4不僅承諾能處理從程式編碼到多領域複雜問題解決的各種任務,而且還在效率和速度上提升了許多。當下,Musk相關公司正面臨領導層改組及內容監控壓力,然而Grok 4依然吸引了眾多目光,市場上也在關注它是否能與同類競爭者如GPT-4o、Claude 3及Gemini抗衡。
Grok 4與過去版本的提升
Grok 4的表現已經在一場名為「人類最後考驗」的測試中達到了25.4%的分數,這比起o3及Gemini 2.5 Pro有了顯著提高。而結合工具的使用後,Grok 4更進一步達到38.6%,而「Grok 4 Heavy」多代理設置更增至44.4%。
Grok 4被設計為擁有“科學家級別的推理能力”,其上下文處理長度從Grok 3的32,000個tokens增加到130,000個token。此外,它的速度更快,準確性更高,幻覺現象更少,更優化了GPU使用。Musk十分自信地表示,Grok 4已經能與GPT-5、Claude 4 Opus匹敵,並誇稱試題已經用盡。
在今年3月,xAI與X的合併促使Grok的研發更進一步,兩者共享資源,每月投入約10億美元,以追趕OpenAI、Google及Meta。Grok 4在科洛索超級計算機上進行訓練,被賦予的“科學家級推理能力”也獲得了驗證。相比Grok 3,新版本處理更長的提示,更快速的GPU設置使其性能提升且幻覺減少。
Grok 4為開發者提供的支持
Grok 4推出了兩個版本:通用模型和開發者專用版本。通用模型可以解決如寫作、研究、翻譯、數學和推理等任務。開發者專用版本"Grok 4 Code"則被設計成能與像Cursor這樣的工具集成,作為程序編碼助手,幫助自動完成、調試和錯誤檢測。日益受到好評的Grok 4 Code在理解整個項目上顯示了超越一般AI工具的智能建議。
Grok 4 (通用模型) | Grok 4 Code (開發者專用模型) | |
---|---|---|
主要特點 | – 函數調用– 結構化輸出- 高級推理 | – 程式生成與完成- 錯誤檢測與調試 |
優勢 | 在NLP、數學、研究、寫作、翻譯上表現出色 | 能在Cursor等工具中提供有上下文意識的程式協作 |
應用情境 | 寫作、研究、翻譯、一般任務 | 簡化開發工作流程,撰寫更清晰更快的代码 |
整合 | xAI助手平台 | 與开发工具如Cursor集成 |
Grok 4的新特點
Grok 4帶來了多重升級,尤其在處理多類型內容上。與Grok 3僅限於文本相比,Grok 4能理解圖片,且錄影支持即將上線。盡管在圖像生成上與Google的Imagen 3相比仍有一些差距,但這项多模態支持則使其与更高端的AI模型如GPT-4o和Gemini 2.5 Pro相提並論。
在語音對話中,回應更自然順暢,儘管尚無法與Gemini Live相比。Grok 4仍保有DeepSearch功能,特別強化了從X獲取實時資訊的能力,這對於那些依賴即時信息的用戶來說是個巨大優勢。
與其他AI模型不同的是,Grok 4在理解互聯網文化方面非常出色。它在解讀網絡流行用語、笑話和俚語方面展示了極強的能力,使其在網路語境辨識中更具靈性和活力。
是否值得嘗試Grok 4?
從展示和公眾細節來看,Grok 4在推理、模擬現實情境和處理實时數據方面顯示出顯著進步。在一次演示中,Grok能精准解析一份100頁的地產文件,清晰地解釋了相關細节,這在深度和清晰度上超過了許多其他的聊天機器人。
在財務任務中,它能即時拉取股票市場數據並提供合理的市場走向總結,而這一般是其他競爭對手所缺乏或無法實時完成的。Grok還顯示了出色的錯誤檢測能力,可識別72個錯誤中的66個,對比Gemini的準確性不逞多讓,還提供更詳細的解释。
此外,Grok 4目前正在進行生成視頻內容的訓練,xAI計劃今年推出第一檔AI製作的電視節目,明年則可能公開全AI生成的電影。Musk更是放話稱Grok將來甚至可能發現新技術或物理規則。
Grok 4的費用
Grok 4及其高階版本Grok 4 Heavy推出了一項名為SuperGrok Heavy的超高級計劃,定價為每月300美元或每年3,000美元,這是主要供應商中的最昂貴AI訂閱計畫之一。
該計畫讓用戶可以早期使用Grok 4 Heavy及未來的工具,包括八月推出的編碼模型、九月推出的多模態代理和十月推出的視頻生成模型。Grok 4支援128K的事件上下文,這與GPT-4o Plus和Manus AI相似,而Claude和Gemini的上下文讀取則更高。
對於開發者而言,Grok 4 Code的專業化焦點可能值得投資,特別是在與集成開發環境(IDE)的整合實現有承諾的情況下。
Grok 4目前的不足之處
即便Grok 4在速度和智能上有了進步,但仍缺乏一些關鍵功能。首先,它不具備記憶功能,這意味著每次會話重啟都需重新解釋上下文,這對於研究、编码项目或任何需要持續性的任務来说是个不便。其次,它缺乏聊天記錄的組織工具,无法像OpenAI那樣保存、標籤和檢索特定項目。最後,Grok主要作為獨立聊天機器人運行,沒有ChatGPT般的外部插件支持。
總體來看,Grok 4展示了尖端科技的前景,然而,美德當然需要克服一些不容忽視的現實挑戰。