人⼯智能 (AI) 和加密貨幣之間的交點⾮常⼴泛,但⼈們往往對其知之甚少。我們認爲,這個交點的不同⼦部分之間有着截然不同的機遇和發展時間表。
我們普遍認爲,對於人工智能產品來說,去中心化本身並不足以帶來競爭優勢——它還必須在某些其他關鍵領域達到與中心化產品同等的功能。
我們的逆向觀點是,由於人工智能行業受到廣泛關注,許多人工智能代幣的價值潛力可能被誇大,而且許多人工智能代幣在中短期內可能缺乏可持續的需求側驅動因素。
近年來,人工智能的持續突破,特別是生成式人工智能領域,引起了人們對人工智能行業的高度關注,並爲位於兩者交叉點的加密項目提供了機會。我們之前在 2023 年 6 月的一份早期報告中介紹了該行業的一些可能性,並指出加密貨幣的整體資本配置似乎對人工智能方面的投入不足。此後,加密人工智能領域取得了巨大的發展,我們認爲,指出可能阻礙其被廣泛採用的某些實際挑戰非常重要。
人工智能的快速變化使我們對「以加密貨幣爲中心的平台具有獨特的優勢來顛覆該行業」的大膽主張持謹慎態度;這使得我們認爲大多數人工智能代幣實現長期和可持續價值增值的道路充滿不確定性,特別是對於那些代幣經濟模型固定的項目來說。 相反,我們認爲,鑑於更廣泛的市場競爭和監管,人工智能領域的一些新興趨勢實際上可能會使基於加密貨幣的創新更難被採用。
也就是說,我們相信人工智能和加密貨幣之間的點是廣泛且有不同的機會的,某些⼦部分的採用速度可能會更快,盡管許多此類領域缺乏已經上市的代幣。盡管如此,這似乎並沒有抑制投資者的興趣。我們發現,人工智能相關加密代幣的表現受到人工智能市場頭條新聞的支持,即使在比特幣交易走低的日子裏,也可能具有積極的價格走勢。因此,我們相信許多與人工智能相關的代幣可以繼續作爲人工智能進步的代表進行交易。
人工智能領域(與加密人工智能產品相關)最重要的趨勢之一是圍繞開源模型的持續文化。Hugging Face 上公開了超過 530,000 個模型,供研究人員和用戶操作和微調。Hugging Face 在人工智能協作中的作用與依賴 GitHub 進行代碼托管或 Discord 進行社區管理(兩者都在加密領域廣泛使用)沒有什麼不同。除非出現嚴重的管理不善,否則這種情況在不久的將來不會發生改變。
Hugging Face 上可用的模型範圍從大型語言模型 (LLM) 到生成圖像和視頻模型,包括 Open AI、Meta 和 Google 等主要行業參與者以及獨立開發人員的創作。一些開源語言模型甚至在吞吐量方面比最先進的閉源模型具有性能優勢(同時保持可比的輸出質量),這確保了開源模型和商業模型之間存在一定程度的競爭(見圖 1)。重要的是,我們認爲這個充滿活力的開源生態系統與競爭激烈的商業部門相結合,已經使不良模型被競爭淘汰的行業成爲可能。
第二個趨勢是較小模型的質量和成本效益不斷提高(早在 2020 年的 LLM 研究以及微軟最近的一篇論文中就強調了這一點),這也與開源文化相吻合,以進一步實現高性能、 本地運行的人工智能模型。一些經過微調的開源模型在某些基準下甚至可以超越領先的閉源模型。在這樣的世界中,一些人工智能模型可以在本地運行,從而最大限度地去中心化。當然,現有技術公司將繼續在雲上訓練和運行更大的模型,但兩者之間的設計空間將需要權衡。
另外,考慮到人工智能模型基準測試的任務日益復雜(包括數據污染和不同的測試範圍),生成模型輸出最終可能由自由市場中的最終用戶進行最佳評估。實際上,最終用戶可以使用現有工具來橫向比較模型輸出以及執行相同操作的基準公司。從各種不斷增長的開放式 LLM 基準中可以粗略地了解生成式 AI 基準測試的難度,這些基準包括 MMLU、HellaSwag、TriviaQA、BoolQ 等,每個基準測試不同的用例,例如常識推理、學術主題,以及各種問題格式。
我們在人工智能領域觀察到的第三個趨勢是,具有強大用戶粘性或解決具體業務問題的現有平台能夠從人工智能集成中獲得不成比例的收益。例如,GitHub Copilot 與代碼編輯器的集成增強了本已強大的開發人員環境。將人工智能接口嵌入到其他工具中,從郵件客戶端到電子表格再到客戶關係管理軟件,也都是人工智能的自然用例(例如,Klarna 的人工智能助理完成了 700 名全職客服人員的工作)。
但值得注意的是,在許多此類場景中,人工智能模型不會帶來新平台,而只會增強現有平台。其他在內部改進傳統業務流程的人工智能模型(例如,Meta 公司的 Lattice 系統,它在蘋果推出 App Tracking Transparency 功能後幫助其廣告性能恢復到了原有水平)也通常依賴於專有數據和封閉系統。這些類型的人工智能模型可能會保持閉源狀態,因爲它們垂直集成到核心產品中並使用專有數據。
在人工智能硬件和計算領域,我們看到了另外兩個相關趨勢。首先是計算用途從訓練到推理的轉變。也就是說,當人工智能模型首次開發時,大量計算資源被用來通過向模型提供大型數據集來「訓練」模型。現在已經轉向部署和查詢模型。
NVIDIA 2024 年 2 月的財報電話會議顯示,他們大約 40% 的業務用於推理,Satya Nadella 在 1 月前一個月的微軟財報電話會議上也發表了類似言論,指出他們的 Azure AI「大部分」使用都是用於推理。隨着這種趨勢的持續,我們認爲尋求模型貨幣化的實體將優先考慮能夠以安全和生產就緒的方式可靠運行模型的平台。
第二個主要趨勢是圍繞硬件架構的競爭格局。Nvidia 的 H200 處理器將於 2024 年第二季度開始上市,下一代 B100 預計性能將進一步翻倍。此外,谷歌對其自身張量處理單元(TPU)和 Groq 較新的語言處理單元(LPU)的持續支持也可能在未來幾年作爲該領域的替代品增加其市場份額(見圖 2)。此類發展可能會改變人工智能行業中的成本動態,並且可以使雲服務提供商受益,他們可以快速轉向、批量採購硬件並設置任何相關的物理網路要求和開發人員工具。
總體而言,人工智能領域是一個新興且快速發展的領域。ChatGPT 於 2022 年 11 月首次向市場發布不到 1.5 年(盡管其底層 GPT 3 模型自 2020 年 6 月以來就已存在),此後該領域的快速發展令人震驚。盡管一些生成式人工智能模型背後的偏見存在一些值得懷疑的行爲,但我們可以看到表現較差的模型被市場淘汰,轉而青睞更好的替代方案。該行業的快速發展和即將出臺的法規的可能性意味着,隨着新解決方案的出現,該行業的問題正在定期發生變化。
對於這樣一個快速創新的領域來說,經常被吹捧的「去中心化解決 [XXX]」作爲已成定局的一攬子補救措施還爲時過早。它還搶先解決了一個可能不一定存在的中心化問題。現實情況是,通過許多不同公司和開源項目之間的競爭,人工智能行業在技術和業務垂直領域已經實現了很大程度的去中心化。此外,由於其決策和共識過程的性質,真正的去中心化協議在技術和社會層面上的進展速度比中心化協議慢。這可能會對在人工智能發展的現階段尋求平衡去中心化和具有競爭力的產品造成障礙。也就是說,加密貨幣和人工智能之間在較長的時間範圍內存在一些可以有意義地實現的協同效應。
從廣義上講,我們將人工智能和加密貨幣的交點分爲兩大類。第一類是人工智能產品改善加密行業的用例。這包括從創建人類可讀的交易和改進區塊鏈數據分析,到利用鏈上模型輸出作爲無許可協議的一部分等場景。第二類是加密貨幣旨在通過分散的計算、驗證、身分等方法顛覆傳統人工智能管線的用例。
前一類業務相關場景的用例是明確的,我們相信,盡管仍然存在重大技術挑戰,但在更復雜的鏈上推理模型場景中也有長期前景。集中式人工智能模型可以像任何其他以技術爲中心的行業一樣改善加密貨幣,從改進開發人員工具和代碼審計到將人類語言轉化爲鏈上行動。但這一領域的投資通常通過風險投資流入私營公司,因此通常被公共市場忽視。
然而,對於加密技術如何顛覆現有的人工智能管線這一說法,其意義和好處 對我們來說還不太確定。後一類的困難不只是技術挑戰(我們認爲從長遠來看通常可以解決),並且也是與更廣泛的市場和監管力量的艱苦鬥爭。最近對人工智能和加密貨幣的大部分關注都集中在這一類別上,因爲這些用例更適合擁有流動性代幣。這是我們下一節的重點,因爲目前而言與加密貨幣中的集中式人工智能工具相關的流動性代幣相對較少。
冒着過於簡單化問題的風險,我們認爲加密貨幣在人工智能管線的四個主要階段對人工智能的潛在影響:
1、數據的收集、存儲和處理,
2、模型的訓練和推理,
3、模型輸出的驗證,
4、跟蹤人工智能模型的輸出。
這些領域已經出現了大量新的加密人工智能項目,盡管許多項目在中短期內將面臨需求側生成以及來自中心化公司和開源解決方案的激烈競爭兩大嚴峻挑戰。
Proprietary Data
數據是所有人工智能模型的基礎,並且可能是專業人工智能模型性能的關鍵區別因素。歷史區塊鏈數據本身是模型的新的豐富數據源,而像 Grass 這樣的某些項目也旨在利用加密激勵措施從開放互聯網中管理新的數據集。在這方面,加密有機會提供行業特定的數據集,並激勵創建新的有價值的數據集。(我們認爲,Reddit 最近與 Google 達成的每年 6000 萬美元的數據許可協議預示着數據集貨幣化的未來。)
許多早期模型(例如 GPT 3)混合使用了 CommonCrawl、WebText2、書籍和維基百科等開放數據集,以及 Hugging Face 上免費提供的類似數據集(目前托管超過 110,000 個選項)。然而,可能是爲了保護商業利益,許多最近的閉源模型尚未公布最終的訓練數據集組成。專有數據集的趨勢,特別是在商業模型中,將繼續保持下去,並提高數據許可的重要性。
現有的集中式數據市場已在幫助彌合數據提供商和消費者之間的差距,使新的去中心化數據市場解決方案的機會空間夾在開源數據目錄和企業競爭對手之間。如果沒有法律結構的支持,純粹去中心化的數據市場還需要構建標準化的數據接口和管道,驗證數據完整性和配置,並解決其產品的冷啓動問題——並同時平衡市場參與者之間的代幣激勵。
另外,去中心化存儲解決方案最終也可能在人工智能行業找到一席之地,盡管這方面仍然存在諸多挑戰。一方面,用於分發開源數據集的管線已經存在並被廣泛使用。另一方面,許多專有數據集的所有者有嚴格的安全性和合規性要求。事實上目前不存在在 FIL 和 Arweave 等去中心化存儲平台上托管敏感數據的監管途徑。許多企業仍在從本地服務器過渡到集中式雲存儲提供商。在技術層面上,這些網路的去中心化性質目前也不符合敏感數據存儲的某些地理位置和物理數據孤島要求。
雖然去中心化存儲解決方案和成熟雲提供商之間的價格比較,表明每個去中心化的存儲單元更便宜,但這忽略了重大的前提。首先,與在提供商之間遷移系統相關的前期成本需要考慮到日常運營費用之外。其次,基於加密的去中心化存儲平台需要與過去二十年發展的成熟雲系統更好的工具和集成相匹配。從業務運營的角度來看,雲解決方案還具有更可預測的成本,提供合同義務和專門的支持團隊,並且還擁有大量現有的開發人員人才。
還值得注意的是,與「三大」雲提供商(亞馬遜網路服務、谷歌雲平台和微軟 Azure)的粗略比較是不完整的。還有數十家成本較低的雲公司也在通過提供更便宜的基礎服務器機架來爭奪市場份額。我們認爲,對於成本敏感的消費者來說,這些才是真正的近期主要競爭對手。
也就是說,最近的創新,如 FIL 的數據計算和 Arweave 的 ao 計算環境,可能會爲即將到來的利用不太敏感數據集的綠地項目或尚未成爲供應商的對成本最敏感(可能規模較小)的公司發揮作用。
因此,雖然數據空間中肯定存在新型加密產品的空間,但最近的技術顛覆將發生在它們可以產生獨特價值主張的地方。去中心化產品與傳統和開源競爭對手正面競爭的領域將需要更多時間才能取得進展。
Training and Inferencing Models
加密行業的去中心化計算(DeComp)領域也旨在成爲集中式雲計算的替代方案,部分原因是現有的 GPU 供應緊張。針對這一短缺問題提出的一種解決方案是在集體網路中重新利用閒置計算資源,並降低集中式雲提供商的成本,Akash 和 Render 等協議應用了類似的解決方案。根據初步指標,此類項目在用戶和供應商方面的使用似乎都在增加。例如,今年迄今爲止,Akash 的活躍租約(即用戶數量)增加了三倍(參見圖 3),這主要是由於其存儲和計算資源的使用量增加所致。
然而,自 2023 年 12 月的峯值以來,支付給網路的費用實際上有所下降,因爲可用 GPU 的供應超過了這些資源的需求增長。也就是說,隨着越來越多的提供商加入網路,租賃的 GPU 數量(按比例來看,這似乎是最大的收入驅動因素)已經下降(參見圖 4)。對於計算定價可以根據供需變化而變化的網路,尚不清楚如果供應方的增長超過需求方的增長,最終會在哪裏出現對原生代幣的持續的、使用驅動的需求。盡管此類變化的長期影響尚不明確,未來可能需要重新審視此類代幣經濟模型,以針對市場變化進行優化。
在技術層面上,去中心化計算解決方案也面臨着網路帶寬限制的挑戰。對於需要多節點訓練的大型模型,物理網路基礎設施層起着至關重要的作用。數據傳輸速度、同步開銷以及對某些分布式訓練算法的支持意味着需要特定的網路配置和自定義網路通信(如 InfiniBand)來促進高性能執行。當超過一定的集羣規模時,則很難以分散的方式實現
總的來說,去中心化計算(和存儲)的長期成功面臨着來自中心化雲提供商的激烈競爭。任何運用至少都將是一個類似於雲採用時間表的長期過程。鑑於去中心化網路開發的技術復雜性不斷增加,加上缺乏類似的可擴展開發和銷售團隊,完全執行去中心化計算願景將是一個艱難的旅程。
Validating and Trusting Models
隨着人工智能模型在生活中愈發重要,人們越來越擔心它們的輸出質量和偏差。某些加密項目旨在通過利用一套算法來評估不同類別的輸出,找到一個去中心化的、基於市場的解決方案來解決這個問題。然而,上述圍繞模型基準測試的挑戰,以及明顯的成本、吞吐量和質量權衡,使得面對面的比較具有挑戰性。BitTensor 是此類中最大的專注於人工智能的加密貨幣之一,旨在解決這個問題,盡管存在許多突出的技術挑戰可能會阻礙其廣泛採用(參見附錄 1)。
另外,無需信任的模型推理(即證明模型輸出實際上是由所聲稱的模型生成的)是加密人工智能重疊領域的另一個活躍研究領域。然而,隨着開源模型規模的縮小,此類解決方案可能會面臨需求方面的挑戰。在模型可以在本地下載和運行並且通過完善的文件哈希/校驗和方法驗證內容完整性的世界中,去信任推理的作用不太明確。誠然,許多 LLM 還無法通過手機等輕型設備進行培訓和操作,但功能強大的臺式計算機(如用於高端遊戲的計算機)已經可以用於運行許多高性能模型。
Data Provenance and Identity
隨着生成式人工智能的輸出與人類的輸出越來越難以區分,辨識和跟蹤 AI 生成內容的重要性也逐漸成爲人們關注的焦點。GPT 4 通過圖靈測試的速度是 GPT 3.5 的 3 倍,而且我們幾乎不可避免地會在某一天無法區分機器人和人類。在這樣的世界中,確定在線用戶的身分以及對人工智能生成的內容加水印將是關鍵功能。
像 Worldcoin 這樣的去中心化標識符和身分證明機制旨在解決之前在鏈上識別人類的問題。同樣,將數據哈希發布到區塊鏈可以通過驗證內容的時間標志和來源來幫助確定數據來源。然而,與前面的部分類似,我們認爲必須權衡基於加密的解決方案的可行性與集中式替代方案。
中國等一些國家將網路人格與政府控制的數據庫聯系起來。盡管世界其他地區的中心化程度並不高,但了解你的客戶 (KYC) 提供商聯盟也可以提供獨立於區塊鏈技術的身分證明解決方案(可能與構成了當今互聯網安全的基石的受信任的證書頒發機構類似)。目前還正在進行人工智能水印研究,以在文本和圖像輸出中嵌入隱藏信號,以便算法能夠檢測內容是否是人工智能生成的。許多領先的人工智能公司,包括微軟、Anthropic 和亞馬遜,都公開承諾在其生成的內容中添加此類水印。
此外,許多現有的內容提供商已經被委托嚴格記錄內容的元數據,以滿足合規要求。因此,用戶通常會委托社交媒體帖子關聯的元數據(但不信任其截圖),即使它們是集中存儲的。這裏需要注意的是,任何基於加密的數據來源和身分解決方案都需要與用戶平台集成才能廣泛有效。因此,雖然用於證明身分和數據來源的基於加密的解決方案在技術上是可行的,但我們也認爲它們的採用並不是既定的,最終將取決於業務、合規性和監管要求。
Trading the AI Narrative
盡管存在上述難點,但從 2023 年第四季度開始,許多人工智能代幣的表現優於比特幣和以太幣,也優於英偉達和微軟等主要人工智能股票。這是因爲人工智能代幣通常受益於更廣泛的加密市場以及相關人工智能新聞頭條的強勁相關表現(參見附錄 2)。因此,即使比特幣價格下跌,以人工智能爲中心的代幣價格也可能漲波動,這會導致比特幣下跌期間出現上行波動。圖 5 直觀地顯示了 AI 代幣在比特幣交易下跌期間的分散情況。
總體而言,人工智能敘事貿易中仍然缺少許多短期持續需求驅動因素。由於缺乏明確的採用預測和指標,導致了廣泛的模因式投機,這可能無法長期持續下去。最終,價格和效用將會趨同——懸而未決的問題是這需要多長時間,以及效用是否會上升以滿足價格,反之亦然。也就是說,持續建設的加密貨幣市場和表現出色的人工智能行業可能會在一段時間內維持強大的加密貨幣人工智能敘事。
加密貨幣在人工智能中的作用並不是憑空存在的——任何去中心化平台都在與現有的中心化替代方案相競爭,必須在更廣泛的業務和監管要求背景下進行分析。因此,純粹爲了「去中心化」而取代中心化提供商不足以推動有意義的進步。生成式人工智能模型已經存在了幾年,並且由於市場競爭和開源軟件,已經保留了一定程度的去中心化。
本報告中反復出現的一個主題是,承認基於加密的解決方案雖然在技術上通常是可行的,但仍然需要大量的工作才能達到與更集中的平台相同的功能,而平台並不會在未來的發展中停滯不前。事實上,由於共識機制的原因,集中式開發通常比分散式開發更快,這可能會給人工智能這樣快速發展的領域帶來挑戰。
有鑑於此,人工智能和加密貨幣的交疊仍處於初級階段,隨着更廣泛的人工智能領域的發展,未來幾年可能會迅速發生變化。正如加密行業許多人目前所設想的那樣,去中心化的人工智能未來並不能得到保證——事實上,人工智能行業本身的未來在很大程度上仍然不確定。因此,我們認爲謹慎的做法是謹慎地駕馭這樣的市場,更深入地研究基於加密貨幣的解決方案以及如何真正提供更好的替代方案,或者理解潛在的交易敘事。
本文轉載自[theblockbeats],原文標題“Crypto’s AI Mirage”,著作權歸屬原作者[David Han],如對轉載有異議,請聯系Gate Learn團隊,團隊會根據相關流程盡速處理。
免責聲明:本文所表達的觀點和意見僅代表作者個人觀點,不構成任何投資建議。
文章其他語言版本由Gate Learn團隊翻譯, 在未提及Gate.io的情況下不得復制、傳播或抄襲經翻譯文章。
人⼯智能 (AI) 和加密貨幣之間的交點⾮常⼴泛,但⼈們往往對其知之甚少。我們認爲,這個交點的不同⼦部分之間有着截然不同的機遇和發展時間表。
我們普遍認爲,對於人工智能產品來說,去中心化本身並不足以帶來競爭優勢——它還必須在某些其他關鍵領域達到與中心化產品同等的功能。
我們的逆向觀點是,由於人工智能行業受到廣泛關注,許多人工智能代幣的價值潛力可能被誇大,而且許多人工智能代幣在中短期內可能缺乏可持續的需求側驅動因素。
近年來,人工智能的持續突破,特別是生成式人工智能領域,引起了人們對人工智能行業的高度關注,並爲位於兩者交叉點的加密項目提供了機會。我們之前在 2023 年 6 月的一份早期報告中介紹了該行業的一些可能性,並指出加密貨幣的整體資本配置似乎對人工智能方面的投入不足。此後,加密人工智能領域取得了巨大的發展,我們認爲,指出可能阻礙其被廣泛採用的某些實際挑戰非常重要。
人工智能的快速變化使我們對「以加密貨幣爲中心的平台具有獨特的優勢來顛覆該行業」的大膽主張持謹慎態度;這使得我們認爲大多數人工智能代幣實現長期和可持續價值增值的道路充滿不確定性,特別是對於那些代幣經濟模型固定的項目來說。 相反,我們認爲,鑑於更廣泛的市場競爭和監管,人工智能領域的一些新興趨勢實際上可能會使基於加密貨幣的創新更難被採用。
也就是說,我們相信人工智能和加密貨幣之間的點是廣泛且有不同的機會的,某些⼦部分的採用速度可能會更快,盡管許多此類領域缺乏已經上市的代幣。盡管如此,這似乎並沒有抑制投資者的興趣。我們發現,人工智能相關加密代幣的表現受到人工智能市場頭條新聞的支持,即使在比特幣交易走低的日子裏,也可能具有積極的價格走勢。因此,我們相信許多與人工智能相關的代幣可以繼續作爲人工智能進步的代表進行交易。
人工智能領域(與加密人工智能產品相關)最重要的趨勢之一是圍繞開源模型的持續文化。Hugging Face 上公開了超過 530,000 個模型,供研究人員和用戶操作和微調。Hugging Face 在人工智能協作中的作用與依賴 GitHub 進行代碼托管或 Discord 進行社區管理(兩者都在加密領域廣泛使用)沒有什麼不同。除非出現嚴重的管理不善,否則這種情況在不久的將來不會發生改變。
Hugging Face 上可用的模型範圍從大型語言模型 (LLM) 到生成圖像和視頻模型,包括 Open AI、Meta 和 Google 等主要行業參與者以及獨立開發人員的創作。一些開源語言模型甚至在吞吐量方面比最先進的閉源模型具有性能優勢(同時保持可比的輸出質量),這確保了開源模型和商業模型之間存在一定程度的競爭(見圖 1)。重要的是,我們認爲這個充滿活力的開源生態系統與競爭激烈的商業部門相結合,已經使不良模型被競爭淘汰的行業成爲可能。
第二個趨勢是較小模型的質量和成本效益不斷提高(早在 2020 年的 LLM 研究以及微軟最近的一篇論文中就強調了這一點),這也與開源文化相吻合,以進一步實現高性能、 本地運行的人工智能模型。一些經過微調的開源模型在某些基準下甚至可以超越領先的閉源模型。在這樣的世界中,一些人工智能模型可以在本地運行,從而最大限度地去中心化。當然,現有技術公司將繼續在雲上訓練和運行更大的模型,但兩者之間的設計空間將需要權衡。
另外,考慮到人工智能模型基準測試的任務日益復雜(包括數據污染和不同的測試範圍),生成模型輸出最終可能由自由市場中的最終用戶進行最佳評估。實際上,最終用戶可以使用現有工具來橫向比較模型輸出以及執行相同操作的基準公司。從各種不斷增長的開放式 LLM 基準中可以粗略地了解生成式 AI 基準測試的難度,這些基準包括 MMLU、HellaSwag、TriviaQA、BoolQ 等,每個基準測試不同的用例,例如常識推理、學術主題,以及各種問題格式。
我們在人工智能領域觀察到的第三個趨勢是,具有強大用戶粘性或解決具體業務問題的現有平台能夠從人工智能集成中獲得不成比例的收益。例如,GitHub Copilot 與代碼編輯器的集成增強了本已強大的開發人員環境。將人工智能接口嵌入到其他工具中,從郵件客戶端到電子表格再到客戶關係管理軟件,也都是人工智能的自然用例(例如,Klarna 的人工智能助理完成了 700 名全職客服人員的工作)。
但值得注意的是,在許多此類場景中,人工智能模型不會帶來新平台,而只會增強現有平台。其他在內部改進傳統業務流程的人工智能模型(例如,Meta 公司的 Lattice 系統,它在蘋果推出 App Tracking Transparency 功能後幫助其廣告性能恢復到了原有水平)也通常依賴於專有數據和封閉系統。這些類型的人工智能模型可能會保持閉源狀態,因爲它們垂直集成到核心產品中並使用專有數據。
在人工智能硬件和計算領域,我們看到了另外兩個相關趨勢。首先是計算用途從訓練到推理的轉變。也就是說,當人工智能模型首次開發時,大量計算資源被用來通過向模型提供大型數據集來「訓練」模型。現在已經轉向部署和查詢模型。
NVIDIA 2024 年 2 月的財報電話會議顯示,他們大約 40% 的業務用於推理,Satya Nadella 在 1 月前一個月的微軟財報電話會議上也發表了類似言論,指出他們的 Azure AI「大部分」使用都是用於推理。隨着這種趨勢的持續,我們認爲尋求模型貨幣化的實體將優先考慮能夠以安全和生產就緒的方式可靠運行模型的平台。
第二個主要趨勢是圍繞硬件架構的競爭格局。Nvidia 的 H200 處理器將於 2024 年第二季度開始上市,下一代 B100 預計性能將進一步翻倍。此外,谷歌對其自身張量處理單元(TPU)和 Groq 較新的語言處理單元(LPU)的持續支持也可能在未來幾年作爲該領域的替代品增加其市場份額(見圖 2)。此類發展可能會改變人工智能行業中的成本動態,並且可以使雲服務提供商受益,他們可以快速轉向、批量採購硬件並設置任何相關的物理網路要求和開發人員工具。
總體而言,人工智能領域是一個新興且快速發展的領域。ChatGPT 於 2022 年 11 月首次向市場發布不到 1.5 年(盡管其底層 GPT 3 模型自 2020 年 6 月以來就已存在),此後該領域的快速發展令人震驚。盡管一些生成式人工智能模型背後的偏見存在一些值得懷疑的行爲,但我們可以看到表現較差的模型被市場淘汰,轉而青睞更好的替代方案。該行業的快速發展和即將出臺的法規的可能性意味着,隨着新解決方案的出現,該行業的問題正在定期發生變化。
對於這樣一個快速創新的領域來說,經常被吹捧的「去中心化解決 [XXX]」作爲已成定局的一攬子補救措施還爲時過早。它還搶先解決了一個可能不一定存在的中心化問題。現實情況是,通過許多不同公司和開源項目之間的競爭,人工智能行業在技術和業務垂直領域已經實現了很大程度的去中心化。此外,由於其決策和共識過程的性質,真正的去中心化協議在技術和社會層面上的進展速度比中心化協議慢。這可能會對在人工智能發展的現階段尋求平衡去中心化和具有競爭力的產品造成障礙。也就是說,加密貨幣和人工智能之間在較長的時間範圍內存在一些可以有意義地實現的協同效應。
從廣義上講,我們將人工智能和加密貨幣的交點分爲兩大類。第一類是人工智能產品改善加密行業的用例。這包括從創建人類可讀的交易和改進區塊鏈數據分析,到利用鏈上模型輸出作爲無許可協議的一部分等場景。第二類是加密貨幣旨在通過分散的計算、驗證、身分等方法顛覆傳統人工智能管線的用例。
前一類業務相關場景的用例是明確的,我們相信,盡管仍然存在重大技術挑戰,但在更復雜的鏈上推理模型場景中也有長期前景。集中式人工智能模型可以像任何其他以技術爲中心的行業一樣改善加密貨幣,從改進開發人員工具和代碼審計到將人類語言轉化爲鏈上行動。但這一領域的投資通常通過風險投資流入私營公司,因此通常被公共市場忽視。
然而,對於加密技術如何顛覆現有的人工智能管線這一說法,其意義和好處 對我們來說還不太確定。後一類的困難不只是技術挑戰(我們認爲從長遠來看通常可以解決),並且也是與更廣泛的市場和監管力量的艱苦鬥爭。最近對人工智能和加密貨幣的大部分關注都集中在這一類別上,因爲這些用例更適合擁有流動性代幣。這是我們下一節的重點,因爲目前而言與加密貨幣中的集中式人工智能工具相關的流動性代幣相對較少。
冒着過於簡單化問題的風險,我們認爲加密貨幣在人工智能管線的四個主要階段對人工智能的潛在影響:
1、數據的收集、存儲和處理,
2、模型的訓練和推理,
3、模型輸出的驗證,
4、跟蹤人工智能模型的輸出。
這些領域已經出現了大量新的加密人工智能項目,盡管許多項目在中短期內將面臨需求側生成以及來自中心化公司和開源解決方案的激烈競爭兩大嚴峻挑戰。
Proprietary Data
數據是所有人工智能模型的基礎,並且可能是專業人工智能模型性能的關鍵區別因素。歷史區塊鏈數據本身是模型的新的豐富數據源,而像 Grass 這樣的某些項目也旨在利用加密激勵措施從開放互聯網中管理新的數據集。在這方面,加密有機會提供行業特定的數據集,並激勵創建新的有價值的數據集。(我們認爲,Reddit 最近與 Google 達成的每年 6000 萬美元的數據許可協議預示着數據集貨幣化的未來。)
許多早期模型(例如 GPT 3)混合使用了 CommonCrawl、WebText2、書籍和維基百科等開放數據集,以及 Hugging Face 上免費提供的類似數據集(目前托管超過 110,000 個選項)。然而,可能是爲了保護商業利益,許多最近的閉源模型尚未公布最終的訓練數據集組成。專有數據集的趨勢,特別是在商業模型中,將繼續保持下去,並提高數據許可的重要性。
現有的集中式數據市場已在幫助彌合數據提供商和消費者之間的差距,使新的去中心化數據市場解決方案的機會空間夾在開源數據目錄和企業競爭對手之間。如果沒有法律結構的支持,純粹去中心化的數據市場還需要構建標準化的數據接口和管道,驗證數據完整性和配置,並解決其產品的冷啓動問題——並同時平衡市場參與者之間的代幣激勵。
另外,去中心化存儲解決方案最終也可能在人工智能行業找到一席之地,盡管這方面仍然存在諸多挑戰。一方面,用於分發開源數據集的管線已經存在並被廣泛使用。另一方面,許多專有數據集的所有者有嚴格的安全性和合規性要求。事實上目前不存在在 FIL 和 Arweave 等去中心化存儲平台上托管敏感數據的監管途徑。許多企業仍在從本地服務器過渡到集中式雲存儲提供商。在技術層面上,這些網路的去中心化性質目前也不符合敏感數據存儲的某些地理位置和物理數據孤島要求。
雖然去中心化存儲解決方案和成熟雲提供商之間的價格比較,表明每個去中心化的存儲單元更便宜,但這忽略了重大的前提。首先,與在提供商之間遷移系統相關的前期成本需要考慮到日常運營費用之外。其次,基於加密的去中心化存儲平台需要與過去二十年發展的成熟雲系統更好的工具和集成相匹配。從業務運營的角度來看,雲解決方案還具有更可預測的成本,提供合同義務和專門的支持團隊,並且還擁有大量現有的開發人員人才。
還值得注意的是,與「三大」雲提供商(亞馬遜網路服務、谷歌雲平台和微軟 Azure)的粗略比較是不完整的。還有數十家成本較低的雲公司也在通過提供更便宜的基礎服務器機架來爭奪市場份額。我們認爲,對於成本敏感的消費者來說,這些才是真正的近期主要競爭對手。
也就是說,最近的創新,如 FIL 的數據計算和 Arweave 的 ao 計算環境,可能會爲即將到來的利用不太敏感數據集的綠地項目或尚未成爲供應商的對成本最敏感(可能規模較小)的公司發揮作用。
因此,雖然數據空間中肯定存在新型加密產品的空間,但最近的技術顛覆將發生在它們可以產生獨特價值主張的地方。去中心化產品與傳統和開源競爭對手正面競爭的領域將需要更多時間才能取得進展。
Training and Inferencing Models
加密行業的去中心化計算(DeComp)領域也旨在成爲集中式雲計算的替代方案,部分原因是現有的 GPU 供應緊張。針對這一短缺問題提出的一種解決方案是在集體網路中重新利用閒置計算資源,並降低集中式雲提供商的成本,Akash 和 Render 等協議應用了類似的解決方案。根據初步指標,此類項目在用戶和供應商方面的使用似乎都在增加。例如,今年迄今爲止,Akash 的活躍租約(即用戶數量)增加了三倍(參見圖 3),這主要是由於其存儲和計算資源的使用量增加所致。
然而,自 2023 年 12 月的峯值以來,支付給網路的費用實際上有所下降,因爲可用 GPU 的供應超過了這些資源的需求增長。也就是說,隨着越來越多的提供商加入網路,租賃的 GPU 數量(按比例來看,這似乎是最大的收入驅動因素)已經下降(參見圖 4)。對於計算定價可以根據供需變化而變化的網路,尚不清楚如果供應方的增長超過需求方的增長,最終會在哪裏出現對原生代幣的持續的、使用驅動的需求。盡管此類變化的長期影響尚不明確,未來可能需要重新審視此類代幣經濟模型,以針對市場變化進行優化。
在技術層面上,去中心化計算解決方案也面臨着網路帶寬限制的挑戰。對於需要多節點訓練的大型模型,物理網路基礎設施層起着至關重要的作用。數據傳輸速度、同步開銷以及對某些分布式訓練算法的支持意味着需要特定的網路配置和自定義網路通信(如 InfiniBand)來促進高性能執行。當超過一定的集羣規模時,則很難以分散的方式實現
總的來說,去中心化計算(和存儲)的長期成功面臨着來自中心化雲提供商的激烈競爭。任何運用至少都將是一個類似於雲採用時間表的長期過程。鑑於去中心化網路開發的技術復雜性不斷增加,加上缺乏類似的可擴展開發和銷售團隊,完全執行去中心化計算願景將是一個艱難的旅程。
Validating and Trusting Models
隨着人工智能模型在生活中愈發重要,人們越來越擔心它們的輸出質量和偏差。某些加密項目旨在通過利用一套算法來評估不同類別的輸出,找到一個去中心化的、基於市場的解決方案來解決這個問題。然而,上述圍繞模型基準測試的挑戰,以及明顯的成本、吞吐量和質量權衡,使得面對面的比較具有挑戰性。BitTensor 是此類中最大的專注於人工智能的加密貨幣之一,旨在解決這個問題,盡管存在許多突出的技術挑戰可能會阻礙其廣泛採用(參見附錄 1)。
另外,無需信任的模型推理(即證明模型輸出實際上是由所聲稱的模型生成的)是加密人工智能重疊領域的另一個活躍研究領域。然而,隨着開源模型規模的縮小,此類解決方案可能會面臨需求方面的挑戰。在模型可以在本地下載和運行並且通過完善的文件哈希/校驗和方法驗證內容完整性的世界中,去信任推理的作用不太明確。誠然,許多 LLM 還無法通過手機等輕型設備進行培訓和操作,但功能強大的臺式計算機(如用於高端遊戲的計算機)已經可以用於運行許多高性能模型。
Data Provenance and Identity
隨着生成式人工智能的輸出與人類的輸出越來越難以區分,辨識和跟蹤 AI 生成內容的重要性也逐漸成爲人們關注的焦點。GPT 4 通過圖靈測試的速度是 GPT 3.5 的 3 倍,而且我們幾乎不可避免地會在某一天無法區分機器人和人類。在這樣的世界中,確定在線用戶的身分以及對人工智能生成的內容加水印將是關鍵功能。
像 Worldcoin 這樣的去中心化標識符和身分證明機制旨在解決之前在鏈上識別人類的問題。同樣,將數據哈希發布到區塊鏈可以通過驗證內容的時間標志和來源來幫助確定數據來源。然而,與前面的部分類似,我們認爲必須權衡基於加密的解決方案的可行性與集中式替代方案。
中國等一些國家將網路人格與政府控制的數據庫聯系起來。盡管世界其他地區的中心化程度並不高,但了解你的客戶 (KYC) 提供商聯盟也可以提供獨立於區塊鏈技術的身分證明解決方案(可能與構成了當今互聯網安全的基石的受信任的證書頒發機構類似)。目前還正在進行人工智能水印研究,以在文本和圖像輸出中嵌入隱藏信號,以便算法能夠檢測內容是否是人工智能生成的。許多領先的人工智能公司,包括微軟、Anthropic 和亞馬遜,都公開承諾在其生成的內容中添加此類水印。
此外,許多現有的內容提供商已經被委托嚴格記錄內容的元數據,以滿足合規要求。因此,用戶通常會委托社交媒體帖子關聯的元數據(但不信任其截圖),即使它們是集中存儲的。這裏需要注意的是,任何基於加密的數據來源和身分解決方案都需要與用戶平台集成才能廣泛有效。因此,雖然用於證明身分和數據來源的基於加密的解決方案在技術上是可行的,但我們也認爲它們的採用並不是既定的,最終將取決於業務、合規性和監管要求。
Trading the AI Narrative
盡管存在上述難點,但從 2023 年第四季度開始,許多人工智能代幣的表現優於比特幣和以太幣,也優於英偉達和微軟等主要人工智能股票。這是因爲人工智能代幣通常受益於更廣泛的加密市場以及相關人工智能新聞頭條的強勁相關表現(參見附錄 2)。因此,即使比特幣價格下跌,以人工智能爲中心的代幣價格也可能漲波動,這會導致比特幣下跌期間出現上行波動。圖 5 直觀地顯示了 AI 代幣在比特幣交易下跌期間的分散情況。
總體而言,人工智能敘事貿易中仍然缺少許多短期持續需求驅動因素。由於缺乏明確的採用預測和指標,導致了廣泛的模因式投機,這可能無法長期持續下去。最終,價格和效用將會趨同——懸而未決的問題是這需要多長時間,以及效用是否會上升以滿足價格,反之亦然。也就是說,持續建設的加密貨幣市場和表現出色的人工智能行業可能會在一段時間內維持強大的加密貨幣人工智能敘事。
加密貨幣在人工智能中的作用並不是憑空存在的——任何去中心化平台都在與現有的中心化替代方案相競爭,必須在更廣泛的業務和監管要求背景下進行分析。因此,純粹爲了「去中心化」而取代中心化提供商不足以推動有意義的進步。生成式人工智能模型已經存在了幾年,並且由於市場競爭和開源軟件,已經保留了一定程度的去中心化。
本報告中反復出現的一個主題是,承認基於加密的解決方案雖然在技術上通常是可行的,但仍然需要大量的工作才能達到與更集中的平台相同的功能,而平台並不會在未來的發展中停滯不前。事實上,由於共識機制的原因,集中式開發通常比分散式開發更快,這可能會給人工智能這樣快速發展的領域帶來挑戰。
有鑑於此,人工智能和加密貨幣的交疊仍處於初級階段,隨着更廣泛的人工智能領域的發展,未來幾年可能會迅速發生變化。正如加密行業許多人目前所設想的那樣,去中心化的人工智能未來並不能得到保證——事實上,人工智能行業本身的未來在很大程度上仍然不確定。因此,我們認爲謹慎的做法是謹慎地駕馭這樣的市場,更深入地研究基於加密貨幣的解決方案以及如何真正提供更好的替代方案,或者理解潛在的交易敘事。
本文轉載自[theblockbeats],原文標題“Crypto’s AI Mirage”,著作權歸屬原作者[David Han],如對轉載有異議,請聯系Gate Learn團隊,團隊會根據相關流程盡速處理。
免責聲明:本文所表達的觀點和意見僅代表作者個人觀點,不構成任何投資建議。
文章其他語言版本由Gate Learn團隊翻譯, 在未提及Gate.io的情況下不得復制、傳播或抄襲經翻譯文章。