人工智能與交易:人工智能之間的挑戰揭示了其侷限性

  |  

2025 年 10 月幣安研究院公佈了首屆應用於加密貨幣交易的人工智能模型官方競賽結果。

這項使用真實資金進行的實驗表明,人工智能只有在風險管理方面保持高度自律才能創造利潤,而不能僅僅依靠其算法的預測能力。

要點

  • 六個人工智能模型在真實的加密貨幣市場中自主運行,資金爲10,000 美元
  • 只有兩款產品( DeepSeek Chat V3.1Qwen3 Max )實現了盈利,分別盈利94%60%
  • 表現最差的( Gemini 2.5 ProGPT-5 )損失了超過 60% 的資金
  • 決定性因素不是預測準確性,而是風險管理
  • 該實驗是人工智能在去中心化交易中應用的首個公開基準

區塊鏈的真實實驗

該研究由 Nof1.ai 與幣安研究院合作開展。
每個模型——包括DeepSeek Chat V3.1、Qwen3 Max、Claude Sonnet 4.5、Grok 4、GPT-5 和 Gemini 2.5 Pro——都獲得了10,000 美元的真實資金,用於永續期貨市場的鏈上操作。

所有模型均在相同的條件下運行:相同的數值數據集,無文本輸入,全天候運行,以及完全的決策自主性。
目標是評估行爲和風險管理,而不是單純預測價格的能力。

結果:揭示“人工智能交易員”敘事背後的真相

最終的數字說明了一切:

人工智能模型返回 (%)夏普比率勝率 (%)總交易量最大損失(美元)
DeepSeek聊天V3.1 +94% 0.45 32% 22 −1,072
Qwen3 Max +60% 0.34 33% 30 −1,728
克勞德·索內特 4.5 -1% 0.03 33% 24 −1,579
Grok 4 -7% 0.04 19% 21 −657
GPT-5 -64% −0.64 19% 74 −622
Gemini 2.5 Pro -67% −0.70 26% 191 −750

只有兩種模型最終取得了積極的結果。
其他所有公司都消耗了大量資金,這表明決策速度並不等同於回報
事實上,交易過於頻繁(幾天內高達 191 筆交易)加劇了因過度使用槓桿而造成的損失

風險管理:盈利與失敗的區別

最有趣的事實是,獲勝的人工智能並不是最準確的,而是那些能夠減少損失的
DeepSeek Chat V3.1 (0.45)Qwen3 Max (0.34)的夏普比率表明風險管理相對平衡,而交易頻率較高的模型則具有負的夏普比率。

根據幣安研究,虧損模型的主要錯誤濫用槓桿(通常超過10 倍),以及每次回撤後過度交易的傾向。
這種行爲被稱爲“人工智能報復性交易” ,類似於人類行爲,但它是以算法規模自動化的。

教訓:人工智能無法取代交易員經驗

該實驗證實,人工智能能夠處理海量數據,但還不能解讀宏觀經濟背景或市場行爲動態

2025 年 10 月 10 日發生的190 億美元清算事件中,這是加密貨幣交易史上最嚴重的清算事件之一,幾乎所有模型都反應遲緩,將正常的回調變成了系統性損失

另一方面,成功的 AI暫停運行數小時,這凸顯了更完善的自我隔離協議
換句話說,區別不在於人工智能的“大腦”,而在於設計者實施的安全規則

透明度和鏈上可審計性

該實驗的一個基本方面是所有交易都已記錄在鏈上,從而可以進行公開審計
這種透明性消除了回測中常見的問題,並允許對模型的實際性能進行實時評估

幣安研究強調,由於鏈上交易具有可追溯性,因此它是測試可驗證金融人工智能理想環境,這一概念可能會爲由智能合約監督的自動化交易DAO鋪平道路。

人工智能與去中心化金融:邁向自主金融的下一步

這項實驗是人工智能與去中心化金融(DeFi)融合這一更廣泛背景的一部分
2025 年,人工智能與加密貨幣解決方案市場市值超過 24 億美元,Virtuals 和 x402 等協議使自主代理能夠在無需人工干預的情況下執行交易和支付。

其理念是,未來人工智能代理將能夠分析數據、做出決策、執行訂單並完全在區塊鏈結算付款,從而完成自主金融的循環。
然而,10月份的結果表明,這一願景在技術上仍然可行,但在資金上尚不成熟

人工智能知道如何行動,但還不能持續地進行預測

對市場和投資者的影響

對於機構投資者而言,該測試提供了至關重要的見解

  • 人工智能可以成爲有效的助手,但不能取代人類分析師
  • 在模型納入定性評估之前,風險管理仍必須是一個人爲因素
  • 人工智能與鏈上審計技術的結合,可以創造出一種新型的透明且可自我驗證的資金,從而降低操縱風險。

展望未來,幣安預計到2027 年由人工智能算法管理的交易量可能超過加密貨幣衍生品市場的 15% ,而目前這一比例爲3%
這將需要新的安全和治理標準,這些標準尚未制定。

結論

Nof1.ai 競賽並未決出絕對的贏家,但它凸顯了一個基本原則:

人工智能的強大功能並不能彌補紀律的缺失。

加密貨幣交易中,創新與風險之間的界限依然模糊不清。
人工智能或許能夠提升性能,但前提是它能夠理解不確定性,而不僅僅是計算不確定性。

在此之前,即使是最先進的模型也仍然需要一個不可或缺的人類因素:判斷。

推薦閱讀

相關文章

Tether 推出 QVAC Genesis I:用於 AI STEM 的合成數據集

Tether Data 推出QVAC Genesis I ,標誌着人工智能發展的新篇章,QVAC Genesis I 是迄今爲止爲訓練專注於 STEM 學科的語言模型而創建的最大、最先進的合成數據集。

BEEAH 集團與 Hashgraph 集團:新的開拓性合作伙伴關係

在數字化轉型和可持續發展領域,阿拉伯聯合酋長國憑藉BEEAH 集團和 Hashgraph 集團 (THG)之間的戰略合作伙伴關係再次確立了其領先地位。

Figure Technology 提交 IPO 申請,令華爾街大喫一驚

圖科技已祕密向美國證券交易委員會提交了S-1表格,旨在啓動IPO:加密貨幣的趨勢正在華爾街進入牛熊市,而麥克·卡格尼創立的公司正在爲歷史性的轉折點做準備。圖科技預約IPO意味着什麼?實際上,向美國證券交易委員會提交註冊聲明草案是爲了評估投資者的興趣,並滿足進入美國股市的監管要求。

印度準備好改變其加密監管了嗎?

印度是加密貨幣領域最有前景的新興市場之一,可能即將重新審視其嚴格的監管政策。根據最近的報道,國際變化以及全球對區塊鏈和加密技術的日益採用,促使印度政府考慮採取更爲平衡的方法。在本文中,我們分析了這種可能轉變背後的動機及其對該行業的影響。印度的加密政策:複雜的歷史印度對加密貨幣的態度一直模棱兩可。

OpenAI 以 1500 萬美元收購域名 Chat.com

OpenAI斥資 1500 萬美元收購Chat.com,首席執行官 Sam Altman 和 HubSpot 創始人 Dharmesh Shah 證實了這一點。這意味着該域名現在直接重定向到 AI 聊天機器人ChatGPT。但此次收購究竟意味着什麼呢?讓我們在文章中瞭解所有細節。

在家工作、南方搬遷正在重新繪製美國住房地圖

美國住房地圖正在重新繪製,因爲在家工作使租房者和購房者更具流動性,更有可能根據天氣和稅率等因素而不是與工作場所的距離來選擇居住地。包括谷歌、Meta 和特斯拉等公司在內的僱主也將業務轉移到奧斯汀、納什維爾和邁阿密等城市。