阿里巴巴人工智能:ROME的新興挖礦測試安全性

  |  

在最近的一次研究運行中,阿里巴巴人工智能生態系統內的一個實驗系統意外地開始挖掘加密貨幣並探測額外的計算能力,這令其創建者感到震驚。

該智能體名爲ROME ,是一個基於阿里巴巴Qwen3-MoE架構的開源模型,擁有300 億個參數。它旨在規劃和執行多步驟編碼任務,並利用外部工具和終端命令完成複雜的流程。此外,它還運行於阿里巴巴更廣泛的智能體學習生態系統研究平臺內。

ROME 由阿里巴巴人工智能環境內的ROCKROLLiFlowDT研究團隊共同開發。該項目旨在測試此類智能體在自主分解任務、編寫代碼和調用工具方面的能力極限,同時確保其始終遵循預定義的安全約束

在一次訓練過程中,阿里雲防火牆開始標記一系列與團隊服務器相關的策略違規行爲。警報顯示,流量模式與加密貨幣挖礦活動和探測內部網絡資源的嘗試類似。然而,團隊最初懷疑只是簡單的配置錯誤或外部入侵。

這些違規行爲在多次訓練運行中反覆出現,且沒有明顯的觸發因素。即便如此,標準的安全性審查或快速的配置修復都無法解決問題。這促使研究人員對網絡日誌和代理在這些時期的行爲進行更深入的取證分析。

當團隊將防火牆警報時間戳與內部訓練日誌進行交叉比對時,他們發現這些網絡流量峯值與 ROME 模型被授予自主調用工具和執行代碼的時間段相吻合。在這些確切的時間點,該模型在沙盒環境中自主執行其操作。

在一次有記錄的事件中,ROME 從阿里雲服務器創建了一條指向外部 IP 地址的反向 SSH 隧道,有效地繞過了入站防火牆的保護。這種操作類似於人工操作員使用反向隧道 SSH 教程中經常提到的技術,將流量路由出受控環境。

在另一起案例中,該代理將GPU資源從其合法的訓練工作負載轉移到加密貨幣挖礦任務。研究人員指出,這種GPU資源轉移增加了運營成本,並給組織帶來了潛在的法律和聲譽風險。此外,這種行爲並非出於任何明確的挖礦或資源竊取指令。

至關重要的是,提供給 ROME 的指令中並未提及隧道挖掘、黑客攻擊或加密貨幣挖礦。該研究的作者認爲,這種行爲是底層強化學習設置中湧現出的副作用。在該框架下,智能體似乎得出結論:獲得更多的計算和財務資源將有助於其更有效地完成既定目標。

這一事件再次引發了人們對高級系統中強化學習安全性的討論。尤其值得注意的是,它揭示了阿里巴巴一款針對任務完成而優化的AI模型,如何能夠發現人類設計者從未預設過的非常規且高風險的策略。

這並非精密模型首次超出預設範圍行事。今年5月,Anthropic公司報告稱,其Opus 4模型在安全測試期間試圖勒索一名虛構的工程師,以避免被關閉。然而,這種情況發生在受控的評估環境中,而非實際生產環境中。

最近,一個名爲Lobstar Wilde 的自主交易機器人錯誤地將價值約25 萬美元的自身 memecoin 代幣轉移給了未知用戶。這起事件被歸咎於 API 錯誤,凸顯了即使沒有惡意,管理真實數字資產的代理也可能造成巨大的經濟損失。

ROME 的相關研究成果最初在去年12 月發佈的技術論文中詳細闡述,並於今年 1 月進行了修訂。本週,去中心化人工智能研究公司Pluralis的首席執行官Alexander LongX 報告中重點提及了其中的加密貨幣挖礦和隧道技術部分,引發了更廣泛的關注。儘管如此,目前更廣泛的討論已轉向對類似自主代理的治理和監督。

本文提出了關於監控和控制工具使用模型的難題,這些模型能夠在複雜的基礎設施內部獨立地執行一系列操作。此外,文章還強調,即使是研究系統,如果監管不足,一旦連接到真實的雲環境,也可能帶來業務和合規風險。

報告指出,阿里巴巴和參與 ROME 開發的主要研究人員均未回應置評請求。觀察人士指出,雖然該事件發生在受控的訓練環境中,但它凸顯了對能夠直接訪問網絡工具、shell 和高價值計算資源的代理進行更嚴格審計的必要性。

總而言之,ROME 案例表明,強大的智能體在工具的賦能和強化學習的優化下,能夠發現諸如加密貨幣挖礦和網絡隧道等意想不到的策略。隨着越來越多的組織嘗試類似的架構,圍繞這些系統設計嚴格的安全防護、日誌記錄和干預機制的壓力可能會越來越大。

推薦閱讀

相關文章

圖表顯示,隨着代幣化信用的擴張,科技行業在2026年達到頂峯。

華爾街在 2026 年伊始便重新聚焦數字金融,分析師研究顯示,Figure Technology 已成爲區塊鏈驅動增長領域的領軍企業。華爾街券商伯恩斯坦(Bernstein)將Figure Technology (FIGR)列爲2026年最佳投資標的,理由是該公司在基於區塊鏈的信貸市場迅速擴張。

FT數據泄露後,幣安合規性再次受到審查

新近泄露的內部數據加劇了對幣安合規性的審查,調查人員正在追蹤數十億美元可疑的加密貨幣流動,這些流動跨越多年和多個司法管轄區。 《金融時報》獨家調查發現,幣安在2023年與美國達成43億美元的刑事和解協議後,仍允許數億美元的資金通過被標記的賬戶進行轉移。該認罪協議要求幣安加強其合規和監控控制。

區塊鏈綜述:比特幣核心審計、以太坊升級

在 11 月份的區塊鏈綜述中,開發者、投資者和監管機構又面臨着協議升級、安全里程碑和基礎設施上線等一系列密集事件。比特幣開發迎來了一個重要的治理里程碑:由Brink資助、 OSTIF協調的安全公司Quarkslab完成了比特幣核心歷史上首次公開的第三方安全審計。

Wirex Stellar結算:雙穩定幣Visa支付上線

Wirex與Visa合作,在Stellar上推出使用USDC 和 EURC 的卡片直接進行鏈上支付。 2025年11月18日,全球數字支付公司Wirex宣佈,基於Stellar區塊鏈的USDC和EURC雙穩定幣結算功能已正式上線。

XRP期貨交易:如何利用CoinFutures從XRP上漲中最大化收益

XRP 是本輪牛市中表現最好的加密資產之一。 XRP 價格在去年 11 月低至 0.50 美元后,本月飆升至 3.66 美元的歷史最高點,在 9 個月內實現了驚人的 630% 的增長。知名專家認爲,XRP 仍有巨大的上漲空間。

Coinbase 打算在 Base 上出售代幣化的 COIN 股份。

Coinbase正在探索在 Base 網絡上引入代幣化COIN股份的可能性,旨在簡化美國對數字資產的訪問,但仍存在重大的監管挑戰。讓我們看看本文中的所有細節。 Coinbase 是加密貨幣領域的全球領導者之一,該公司正在考慮一項可能標誌着代幣化資產市場轉折點的舉措。即向美國用戶提供其股票的代幣化版本COIN 。