探索Grok 4：xAI最新雄心勃勃的AI模型詳解

在2025年7月9日的線上直播中，Elon Musk推出了xAI最新的人工智慧產品——Grok 4，並宣稱這款AI模型的智能超越了大多數研究生。Grok 4不僅承諾能處理從程式編碼到多領域複雜問題解決的各種任務，而且還在效率和速度上提升了許多。當下，Musk相關公司正面臨領導層改組及內容監控壓力，然而Grok 4依然吸引了眾多目光，市場上也在關注它是否能與同類競爭者如GPT-4o、Claude 3及Gemini抗衡。

Grok 4與過去版本的提升

Grok 4的表現已經在一場名為「人類最後考驗」的測試中達到了25.4%的分數，這比起o3及Gemini 2.5 Pro有了顯著提高。而結合工具的使用後，Grok 4更進一步達到38.6%，而「Grok 4 Heavy」多代理設置更增至44.4%。

Grok 4被設計為擁有“科學家級別的推理能力”，其上下文處理長度從Grok 3的32,000個tokens增加到130,000個token。此外，它的速度更快，準確性更高，幻覺現象更少，更優化了GPU使用。Musk十分自信地表示，Grok 4已經能與GPT-5、Claude 4 Opus匹敵，並誇稱試題已經用盡。

在今年3月，xAI與X的合併促使Grok的研發更進一步，兩者共享資源，每月投入約10億美元，以追趕OpenAI、Google及Meta。Grok 4在科洛索超級計算機上進行訓練，被賦予的“科學家級推理能力”也獲得了驗證。相比Grok 3，新版本處理更長的提示，更快速的GPU設置使其性能提升且幻覺減少。

Grok 4為開發者提供的支持

Grok 4推出了兩個版本：通用模型和開發者專用版本。通用模型可以解決如寫作、研究、翻譯、數學和推理等任務。開發者專用版本"Grok 4 Code"則被設計成能與像Cursor這樣的工具集成，作為程序編碼助手，幫助自動完成、調試和錯誤檢測。日益受到好評的Grok 4 Code在理解整個項目上顯示了超越一般AI工具的智能建議。

	Grok 4 (通用模型)	Grok 4 Code (開發者專用模型)
主要特點	– 函數調用– 結構化輸出- 高級推理	– 程式生成與完成- 錯誤檢測與調試
優勢	在NLP、數學、研究、寫作、翻譯上表現出色	能在Cursor等工具中提供有上下文意識的程式協作
應用情境	寫作、研究、翻譯、一般任務	簡化開發工作流程，撰寫更清晰更快的代码
整合	xAI助手平台	與开发工具如Cursor集成

Grok 4的新特點

Grok 4帶來了多重升級，尤其在處理多類型內容上。與Grok 3僅限於文本相比，Grok 4能理解圖片，且錄影支持即將上線。盡管在圖像生成上與Google的Imagen 3相比仍有一些差距，但這项多模態支持則使其与更高端的AI模型如GPT-4o和Gemini 2.5 Pro相提並論。

在語音對話中，回應更自然順暢，儘管尚無法與Gemini Live相比。Grok 4仍保有DeepSearch功能，特別強化了從X獲取實時資訊的能力，這對於那些依賴即時資訊的使用者來說是個巨大優勢。

與其他AI模型不同的是，Grok 4在理解網際網路文化方面非常出色。它在解讀網絡流行用語、笑話和俚語方面展示了極強的能力，使其在網路語境辨識中更具靈性和活力。

是否值得嘗試Grok 4？

從展示和公眾細節來看，Grok 4在推理、模擬現實情境和處理實时數據方面顯示出顯著進步。在一次演示中，Grok能精准解析一份100頁的地產文件，清晰地解釋了相關細节，這在深度和清晰度上超過了許多其他的聊天機器人。

在財務任務中，它能即時拉取股票市場數據並提供合理的市場走向總結，而這一般是其他競爭對手所缺乏或無法實時完成的。Grok還顯示了出色的錯誤檢測能力，可識別72個錯誤中的66個，對比Gemini的準確性不逞多讓，還提供更詳細的解释。

此外，Grok 4目前正在進行生成視頻內容的訓練，xAI計劃今年推出第一檔AI製作的電視節目，明年則可能公開全AI生成的電影。Musk更是放話稱Grok將來甚至可能發現新技術或物理規則。

Grok 4的費用

Grok 4及其高階版本Grok 4 Heavy推出了一項名為SuperGrok Heavy的超高級計劃，定價為每月300美元或每年3,000美元，這是主要供應商中的最昂貴AI訂閱計畫之一。

該計畫讓使用者可以早期使用Grok 4 Heavy及未來的工具，包括八月推出的編碼模型、九月推出的多模態代理和十月推出的視頻生成模型。Grok 4支援128K的事件上下文，這與GPT-4o Plus和Manus AI相似，而Claude和Gemini的上下文讀取則更高。

對於開發者而言，Grok 4 Code的專業化焦點可能值得投資，特別是在與集成開發環境（IDE）的整合實現有承諾的情況下。

Grok 4目前的不足之處

即便Grok 4在速度和智能上有了進步，但仍缺乏一些關鍵功能。首先，它不具備記憶功能，這意味著每次會話重啟都需重新解釋上下文，這對於研究、编码项目或任何需要持續性的任務来说是个不便。其次，它缺乏聊天記錄的組織工具，无法像OpenAI那樣保存、標籤和檢索特定項目。最後，Grok主要作為獨立聊天機器人運行，沒有ChatGPT般的外部外掛程式支持。

總體來看，Grok 4展示了尖端科技的前景，然而，美德當然需要克服一些不容忽視的現實挑戰。