2025 年 10 月,幣安研究院公佈了首屆應用於加密貨幣交易的人工智能模型官方競賽結果。
這項使用真實資金進行的實驗表明,人工智能只有在風險管理方面保持高度自律才能創造利潤,而不能僅僅依靠其算法的預測能力。
要點
- 六個人工智能模型在真實的加密貨幣市場中自主運行,資金爲10,000 美元。
- 只有兩款產品( DeepSeek Chat V3.1和Qwen3 Max )實現了盈利,分別盈利94%和60% 。
- 表現最差的( Gemini 2.5 Pro和GPT-5 )損失了超過 60% 的資金。
- 決定性因素不是預測準確性,而是風險管理。
- 該實驗是人工智能在去中心化交易中應用的首個公開基準。
區塊鏈的真實實驗
該研究由 Nof1.ai 與幣安研究院合作開展。
每個模型——包括DeepSeek Chat V3.1、Qwen3 Max、Claude Sonnet 4.5、Grok 4、GPT-5 和 Gemini 2.5 Pro——都獲得了10,000 美元的真實資金,用於永續期貨市場的鏈上操作。
所有模型均在相同的條件下運行:相同的數值數據集,無文本輸入,全天候運行,以及完全的決策自主性。
目標是評估行爲和風險管理,而不是單純預測價格的能力。
結果:揭示“人工智能交易員”敘事背後的真相
最終的數字說明了一切:
| 人工智能模型 | 返回 (%) | 夏普比率 | 勝率 (%) | 總交易量 | 最大損失(美元) |
| DeepSeek聊天V3.1 | +94% | 0.45 | 32% | 22 | −1,072 |
| Qwen3 Max | +60% | 0.34 | 33% | 30 | −1,728 |
| 克勞德·索內特 4.5 | -1% | 0.03 | 33% | 24 | −1,579 |
| Grok 4 | -7% | 0.04 | 19% | 21 | −657 |
| GPT-5 | -64% | −0.64 | 19% | 74 | −622 |
| Gemini 2.5 Pro | -67% | −0.70 | 26% | 191 | −750 |
只有兩種模型最終取得了積極的結果。
其他所有公司都消耗了大量資金,這表明決策速度並不等同於回報。
事實上,交易過於頻繁(幾天內高達 191 筆交易)加劇了因過度使用槓桿而造成的損失。
風險管理:盈利與失敗的區別
最有趣的事實是,獲勝的人工智能並不是最準確的,而是那些能夠減少損失的。
DeepSeek Chat V3.1 (0.45)和Qwen3 Max (0.34)的夏普比率表明風險管理相對平衡,而交易頻率較高的模型則具有負的夏普比率。
根據幣安研究,虧損模型的主要錯誤是濫用槓桿(通常超過10 倍),以及每次回撤後過度交易的傾向。
這種行爲被稱爲“人工智能報復性交易” ,類似於人類行爲,但它是以算法規模自動化的。
教訓:人工智能無法取代交易員經驗
該實驗證實,人工智能能夠處理海量數據,但還不能解讀宏觀經濟背景或市場行爲動態。
在2025 年 10 月 10 日發生的190 億美元清算事件中,這是加密貨幣交易史上最嚴重的清算事件之一,幾乎所有模型都反應遲緩,將正常的回調變成了系統性損失。
另一方面,成功的 AI暫停運行數小時,這凸顯了更完善的自我隔離協議。
換句話說,區別不在於人工智能的“大腦”,而在於設計者實施的安全規則。
透明度和鏈上可審計性
該實驗的一個基本方面是所有交易都已記錄在鏈上,從而可以進行公開審計。
這種透明性消除了回測中常見的問題,並允許對模型的實際性能進行實時評估。
幣安研究強調,由於鏈上交易具有可追溯性,因此它是測試可驗證金融人工智能的理想環境,這一概念可能會爲由智能合約監督的自動化交易DAO鋪平道路。
人工智能與去中心化金融:邁向自主金融的下一步
這項實驗是人工智能與去中心化金融(DeFi)融合這一更廣泛背景的一部分。
2025 年,人工智能與加密貨幣解決方案市場市值超過 24 億美元,Virtuals 和 x402 等協議使自主代理能夠在無需人工干預的情況下執行交易和支付。
其理念是,未來人工智能代理將能夠分析數據、做出決策、執行訂單並完全在區塊鏈上結算付款,從而完成自主金融的循環。
然而,10月份的結果表明,這一願景在技術上仍然可行,但在資金上尚不成熟:
人工智能知道如何行動,但還不能持續地進行預測。
對市場和投資者的影響
對於機構投資者而言,該測試提供了至關重要的見解:
- 人工智能可以成爲有效的助手,但不能取代人類分析師;
- 在模型納入定性評估之前,風險管理仍必須是一個人爲因素;
- 人工智能與鏈上審計技術的結合,可以創造出一種新型的透明且可自我驗證的資金,從而降低操縱風險。
展望未來,幣安預計到2027 年,由人工智能算法管理的交易量可能超過加密貨幣衍生品市場的 15% ,而目前這一比例爲3% 。
這將需要新的安全和治理標準,這些標準尚未制定。
結論
Nof1.ai 競賽並未決出絕對的贏家,但它凸顯了一個基本原則:
人工智能的強大功能並不能彌補紀律的缺失。
在加密貨幣交易中,創新與風險之間的界限依然模糊不清。
人工智能或許能夠提升性能,但前提是它能夠理解不確定性,而不僅僅是計算不確定性。
在此之前,即使是最先進的模型也仍然需要一個不可或缺的人類因素:判斷。