2025 年 10 月,币安研究院公布了首届应用于加密货币交易的人工智能模型官方竞赛结果。
这项使用真实资金进行的实验表明,人工智能只有在风险管理方面保持高度自律才能创造利润,而不能仅仅依靠其算法的预测能力。
要点
- 六个人工智能模型在真实的加密货币市场中自主运行,资金为10,000 美元。
- 只有两款产品( DeepSeek Chat V3.1和Qwen3 Max )实现了盈利,分别盈利94%和60% 。
- 表现最差的( Gemini 2.5 Pro和GPT-5 )损失了超过 60% 的资金。
- 决定性因素不是预测准确性,而是风险管理。
- 该实验是人工智能在去中心化交易中应用的首个公开基准。
区块链的真实实验
该研究由 Nof1.ai 与币安研究院合作开展。
每个模型——包括DeepSeek Chat V3.1、Qwen3 Max、Claude Sonnet 4.5、Grok 4、GPT-5 和 Gemini 2.5 Pro——都获得了10,000 美元的真实资金,用于永续期货市场的链上操作。
所有模型均在相同的条件下运行:相同的数值数据集,无文本输入,全天候运行,以及完全的决策自主性。
目标是评估行为和风险管理,而不是单纯预测价格的能力。
结果:揭示“人工智能交易员”叙事背后的真相
最终的数字说明了一切:
| 人工智能模型 | 返回 (%) | 夏普比率 | 胜率 (%) | 总交易量 | 最大损失(美元) |
| DeepSeek聊天V3.1 | +94% | 0.45 | 32% | 22 | −1,072 |
| Qwen3 Max | +60% | 0.34 | 33% | 30 | −1,728 |
| 克劳德·索内特 4.5 | -1% | 0.03 | 33% | 24 | −1,579 |
| Grok 4 | -7% | 0.04 | 19% | 21 | −657 |
| GPT-5 | -64% | −0.64 | 19% | 74 | −622 |
| Gemini 2.5 Pro | -67% | −0.70 | 26% | 191 | −750 |
只有两种模型最终取得了积极的结果。
其他所有公司都消耗了大量资金,这表明决策速度并不等同于回报。
事实上,交易过于频繁(几天内高达 191 笔交易)加剧了因过度使用杠杆而造成的损失。
风险管理:盈利与失败的区别
最有趣的事实是,获胜的人工智能并不是最准确的,而是那些能够减少损失的。
DeepSeek Chat V3.1 (0.45)和Qwen3 Max (0.34)的夏普比率表明风险管理相对平衡,而交易频率较高的模型则具有负的夏普比率。
根据币安研究,亏损模型的主要错误是滥用杠杆(通常超过10 倍),以及每次回撤后过度交易的倾向。
这种行为被称为“人工智能报复性交易” ,类似于人类行为,但它是以算法规模自动化的。
教训:人工智能无法取代交易员经验
该实验证实,人工智能能够处理海量数据,但还不能解读宏观经济背景或市场行为动态。
在2025 年 10 月 10 日发生的190 亿美元清算事件中,这是加密货币交易史上最严重的清算事件之一,几乎所有模型都反应迟缓,将正常的回调变成了系统性损失。
另一方面,成功的 AI暂停运行数小时,这凸显了更完善的自我隔离协议。
换句话说,区别不在于人工智能的“大脑”,而在于设计者实施的安全规则。
透明度和链上可审计性
该实验的一个基本方面是所有交易都已记录在链上,从而可以进行公开审计。
这种透明性消除了回测中常见的问题,并允许对模型的实际性能进行实时评估。
币安研究强调,由于链上交易具有可追溯性,因此它是测试可验证金融人工智能的理想环境,这一概念可能会为由智能合约监督的自动化交易DAO铺平道路。
人工智能与去中心化金融:迈向自主金融的下一步
这项实验是人工智能与去中心化金融(DeFi)融合这一更广泛背景的一部分。
2025 年,人工智能与加密货币解决方案市场市值超过 24 亿美元,Virtuals 和 x402 等协议使自主代理能够在无需人工干预的情况下执行交易和支付。
其理念是,未来人工智能代理将能够分析数据、做出决策、执行订单并完全在区块链上结算付款,从而完成自主金融的循环。
然而,10月份的结果表明,这一愿景在技术上仍然可行,但在资金上尚不成熟:
人工智能知道如何行动,但还不能持续地进行预测。
对市场和投资者的影响
对于机构投资者而言,该测试提供了至关重要的见解:
- 人工智能可以成为有效的助手,但不能取代人类分析师;
- 在模型纳入定性评估之前,风险管理仍必须是一个人为因素;
- 人工智能与链上审计技术的结合,可以创造出一种新型的透明且可自我验证的资金,从而降低操纵风险。
展望未来,币安预计到2027 年,由人工智能算法管理的交易量可能超过加密货币衍生品市场的 15% ,而目前这一比例为3% 。
这将需要新的安全和治理标准,这些标准尚未制定。
结论
Nof1.ai 竞赛并未决出绝对的赢家,但它凸显了一个基本原则:
人工智能的强大功能并不能弥补纪律的缺失。
在加密货币交易中,创新与风险之间的界限依然模糊不清。
人工智能或许能够提升性能,但前提是它能够理解不确定性,而不仅仅是计算不确定性。
在此之前,即使是最先进的模型也仍然需要一个不可或缺的人类因素:判断。