近年、特に生成的人工知能の分野での人工知能の継続的な突破は、人工知能業界に大きな注目を集め、両者の交差点に位置する暗号プロジェクトに機会を提供しています。以前、2023年6月の初期レポートでセクターの可能性の一部を取り上げ、全体的な暗号通貨への資本配分が人工知能への投資不足であることを指摘しました。その後、暗号AIの分野は莫大に成長しており、広範な採用を妨げる可能性のある実務上の課題のいくつかを指摘することが重要だと考えています。
AIの急速な変化により、暗号資産中心のプラットフォームが業界を変革するために特異な立場にあるという大胆な主張には慎重にならざるを得ません。これにより、ほとんどのAIトークンが長期的かつ持続可能な価値の向上経路を持つと考えています。道は不確実性でいっぱいであり、特に固定のトークン経済モデルを持つプロジェクトにとってはそうです。むしろ、AIのいくつかの新興トレンドは、より広範な市場競争と規制を考慮すると、暗号通貨ベースの革新の採用を困難にするかもしれないと考えています。
それは言うまでもなく、AIと暗号資産の間のポイントは広範囲で多様な機会を持っており、多くの分野にすでにマーケティングされていないトークンが欠如しているにもかかわらず、特定のサブセグメントでの採用が速くなる可能性が高いと考えています。それでも、それは投資家の関心をそそることにはなっていないようです。AI関連の暗号トークンのパフォーマンスは、AI市場の見出しに支えられており、ビットコインの取引が低調な日でも価格が上昇する可能性があります。したがって、AI関連のトークンの多くがAIの進歩の表れとして取引され続けると考えています。
暗号資産関連の人工知能分野における最も重要なトレンドの1つは、オープンソースモデルを中心とした持続的な文化です。 Hugging Faceには、研究者やユーザーが操作や微調整を行うために公開されているモデルが53万以上あります。 Hugging FaceのAIコラボレーションにおける役割は、コードホスティングにGitHubを、コミュニティ管理にDiscordを頼ることと同様です(どちらも暗号空間で広く使用されています)。 深刻な誤管理を除いて、この状況は近い将来変わる可能性は低いです。
Hugging Faceで利用可能なモデルは、大規模言語モデル(LLM)から生成画像およびビデオモデルまで幅広く、Open AI、Meta、Googleなどの主要業界プレーヤーや独立開発者による作成物が含まれます。一部のオープンソース言語モデルは、スループットにおいて最先端のクローズドソースモデルに対して性能上の優位性を持ちつつ(出力品質を維持しながら)、オープンソースと商用モデルの間で競争が行われていることが確認されます(図1を参照)。重要なことは、この活気あるオープンソースエコシステムと高い競争力を持つ商業セクターが組み合わさり、悪質なモデルが競争から駆逐される産業を可能にしているという点です。
第二のトレンドは、より高品質でコスト効果の高い小型モデルの増加です(2020年のLLM研究とMicrosoftの最近の論文で強調されています)。これはさらにハイエンドのパフォーマンスを可能にするオープンソース文化と重なっており、一部の微調整されたオープンソースモデルは、特定のベンチマークで主要なクローズドソースモデルを凌駕することさえあります。そのような世界では、一部のAIモデルをローカルで実行し、分散化を最大限に活用することができます。もちろん、既存のテクノロジーカンパニーは引き続きクラウド上でより大規模なモデルのトレーニングと実行を行うでしょうが、その間の設計空間では、トレードオフが必要とされるでしょう。
さらに、AIモデルのベンチマークタスクの複雑さが増していることを考慮すると(データの汚染やテスト範囲の変動を含む)、モデルの出力を生成することは、最終的にはエンドユーザーによって自由市場で最良の評価がなされるかもしれません。実際、エンドユーザーは、同じ操作を行うベンチマーク企業とモデルの出力を並べて比較するために既存のツールを使用することができます。生成AIベンチマークの難しさのおおまかな考えは、成長するさまざまなオープンLLMベンチマーク(MMLU、HellaSwag、TriviaQA、BoolQなどを含む)から得られます。それぞれが常識推論、学術的トピック、さまざまな質問形式など、異なるユースケースをテストしています。
AIスペースで観察される3つ目のトレンドは、既存のプラットフォームが強力なユーザーの定着度を持っているか、特定のビジネス問題を解決している場合、AIの統合から不均衡に利益を得ることができるということです。たとえば、GitHub Copilotのコードエディターへの統合は、すでに強力な開発者環境を向上させています。電子メールクライアントからスプレッドシート、顧客関係管理ソフトウェアへのAIインタフェースの埋め込みも、AIの自然な使用例です(たとえば、KlarnaのAIアシスタントは700人の常勤カスタマーサービススタッフの仕事を行います)。
ただし、これらのシナリオの多くでは、AIモデルが新しいプラットフォームを生み出すのではなく、既存のものを強化するだけであることに注意する価値があります。他のAIモデルは、従来のビジネスプロセスを内部で向上させる(例:MetaのLatticeシステムは、App Tracking Transparencyを導入した後、Appleの広告パフォーマンスを従来の水準に回復させるのに役立ちました)場合も、プロプライエタリデータとクローズドシステムに依存することがよくあります。このタイプのAIモデルは、主要製品に垂直統合されており、プロプライエタリデータを使用しているため、おそらく閉源のままでしょう。
AIハードウェアとコンピューティングの世界では、関連する2つのトレンドが見られます。1つ目は、コンピューティングの使用がトレーニングから推論へと移行していることです。つまり、人工知能モデルが最初に開発される際には、大量のコンピューティングリソースが使われて、大規模なデータセットを与えることでモデルを「トレーニング」します。現在は、そのモデルを展開してクエリを実行する段階に移行しました。
2024年2月のNVIDIAの決算電話会議では、約40%が推論用に使用されていることが示されました。サティア・ナデラは、1月のマイクロソフトの決算電話会議で同様の発言をし、Azure AIのほとんどが推論用であることを指摘しました。このトレンドが続くにつれて、モデルを収益化しようとする企業は、安全かつ本番用に信頼してモデルを実行できるプラットフォームを優先すると考えています。
第2の主要なトレンドは、ハードウェア・アーキテクチャを取り巻く競争環境です。NvidiaのH200プロセッサは2024年第2四半期から利用可能になる予定で、次世代のB100では性能がさらに2倍に向上すると予想されています。さらに、Googleの独自のTensor Processing Unit(TPU)への継続的なサポートやGroqの新しいLanguage Processing Unit(LPU)によって、これらの代替製品としての市場シェアが今後数年間で拡大する可能性もあります(図2参照)。こうした動向は人工知能産業のコストダイナミクスを変え、クラウドサービスプロバイダに利益をもたらし、迅速に方針を転換し、ハードウェアを大量購入し、関連する物理ネットワーキング要件や開発者ツールを構成することが可能になるかもしれません。
全体的に、人工知能の分野は新興で急速に発展している分野です。ChatGPTが2022年11月に初めて市場に登場してから1.5年も経っていないにもかかわらず(その基礎となるGPT 3モデルは2020年6月以来存在しています)、その後の空間での急速な成長は驚異的でした。いくつかの生成的AIモデルにおけるバイアスに関する疑問のある行動にもかかわらず、市場では性能の低いモデルがより良い代替手段のために段階的に淘汰される可能性があります。業界の急速な成長と今後の規制の可能性から、業界の問題は新しい解決策が利用可能になるたびに定期的に変化しています。
この急速に革新する分野において、よく言われる「中央集権化された解決策[XXX]」が早まった結論となるのは時期尚早です。また、必ずしも存在しない中央集権化の問題を予防的に解決しようとすることもあります。実際のところ、AI業界は、多くの異なる企業やオープンソースプロジェクトの競争を通じて、技術とビジネスの垂直分野全体で大規模な分散化を達成しています。さらに、彼らの意思決定とコンセンサスプロセスの性質により、分散型プロトコルは技術的および社会的レベルの両面で、集中型プロトコルよりも遅れて進化します。これは、AIの発展段階において分散化と競争力のある製品のバランスを取ろうとする際に障害を生む可能性があります。言い換えれば、仮想通貨と人工知能の間には、長期にわたって意味のあるシナジーが生まれる可能性があります。
大まかに言えば、人工知能と暗号資産の交差点を広く2つの大きなカテゴリに分けています。最初のカテゴリは、AI製品が暗号通貨産業を改善するユースケースです。これには、人間が読み取れる取引の作成やブロックチェーンデータ分析の改善、パーミッションレスプロトコルの一部としてオンチェーンモデルの出力を活用するなどのシナリオが含まれます。2番目のカテゴリは、暗号通貨が分散コンピューティング、検証、アイデンティティなどを通じて従来のAIパイプラインを破壊しようとするユースケースです。
前者のビジネス関連シナリオのユースケースは明確であり、重要な技術的課題が残っていると考えていますが、より複雑なオンチェーン推論モデルシナリオには長期的な展望もあります。中央集権型AIモデルは、開発者ツールやコード監査の改善から、人間の言語をオンチェーンのアクションに翻訳するまで、他の技術に焦点を当てた産業と同様に、暗号資産を改善することができます。ただし、この分野への投資は通常、ベンチャーキャピタルを通じて民間企業に流れ込むため、一般市場にはしばしば無視されます。
しかし、暗号資産が既存のAIパイプラインにどのように影響を与えるかの意味や利点は、私たちにとってはそれほど確かではありません。後者のカテゴリにおける困難は、単なる技術的な課題だけでなく(私たちは一般的に長期的に解決可能であると考えています)、より広範囲の市場や規制上の力との厳しい戦いでもあります。最近の人工知能と暗号通貨に関する注目の多くは、このカテゴリに焦点を当てられており、これらのユースケースは流動的なトークンを所有するにはより適しています。これは、現在、暗号通貨における集中型AIツールに関連する流動性トークンが比較的少ないため、私たちの次のセクションの焦点となっています。
問題を過度に単純化するリスクを冒しながら、AIパイプラインの4つの主要段階における暗号通貨の人工知能への潜在的な影響を考慮しています。
データ収集、保存、および処理
モデルトレーニングと推論
モデル出力の検証
人工知能モデルの出力を追跡します
これらの分野で多くの新しい暗号資産AIプロジェクトが登場しています。しかし、需要側の誘発と中央集権企業やオープンソースソリューションからの激しい競争により、多くのプロジェクトが短中期に深刻な課題に直面することになるでしょう。
独自データ
データはすべてのAIモデルの基盤であり、プロフェッショナルなAIモデルのパフォーマンスにおいて鍵となる要素です。歴史的なブロックチェーンデータ自体がモデルのための新たな豊富なデータソースであり、Grassのようなプロジェクトでは、暗号資産のインセンティブを活用してオープンインターネットから新たなデータセットをキュレーションしようとしています。この点において、暗号資産は業界固有のデータセットを提供し、新たな価値あるデータセットの創出をインセンティブとする機会があります。(RedditのGoogleとの最近の年間6000万ドルのデータライセンス取引は、データセットの収益化の未来に良い兆候だと考えています。)
多くの初期モデル(例:GPT 3)は、CommonCrawl、WebText2、Books、Wikipediaなどのオープンデータセットと、Hugging Face(現在110,000以上のオプションをホスト)で自由に利用できる類似のデータセットを組み合わせて使用していました。しかし、商業的な利益を保護するために、最近の多くのクローズドソースモデルは、まだ最終的なトレーニングデータセットの構成を公開していません。特にビジネスモデルでは、プロプライエタリなデータセットへの傾向が続き、データライセンスの重要性が高まります。
既存の中央集権的なデータマーケットプレイスは、すでにデータの提供者と消費者の間のギャップを埋めるのに役立っており、オープンソースのデータカタログと企業競合他の間に新しい分散型データマーケットプレイスソリューションの機会スペースを残しています。法的構造のサポートがない場合、純粋に分散型のデータマーケットも標準化されたデータインタフェースとパイプラインを構築し、データの整合性と構成を検証し、製品の冷間起動問題を解決する必要があります。同時に、市場参加者間のトークンインセンティブをバランスさせる必要があります。
さらに、分散型ストレージソリューションは、人工知能産業においても、多くの課題を抱えながら最終的には場所を見つけるかもしれません。一方で、オープンソースのデータセットを配布するためのパイプラインは既に存在し、広く使用されています。一方で、多くの独自のデータセットの所有者は厳格なセキュリティおよびコンプライアンスの要件を持っています。
現在、FilecoinやArweaveのような分散型ストレージプラットフォームに重要なデータをホスティングするための規制経路は存在していません。多くの企業は、オンプレミスサーバーから中央集権型クラウドストレージプロバイダーに移行中です。さらに、これらネットワークの分散性は、現在、特定の地理的位置や物理的データ分離の要件を満たしておらず、重要データを保存するための技術レベルではありません。
分散型ストレージソリューションと確立したクラウドプロバイダーとの価格比較は、分散型ストレージユニットが単位あたりよりも安価であることを示唆していますが、これは重要な前提を無視しています。まず、プロバイダー間のシステムの移行に関連する前払い費用は、日々の運用費用の上に考慮する必要があります。第二に、暗号資産ベースの分散型ストレージプラットフォームは、過去20年間に開発された成熟したクラウドシステムとのより良いツールや統合を実現する必要があります。クラウドソリューションは、ビジネス運営の観点からもより予測可能なコストを持ち、契約上の義務や専任サポートチームを提供し、既存の開発者の豊富なプールを持っています。
それに加えて、Amazon Web Services、Google Cloud Platform、およびMicrosoft Azureの3つの主要なクラウドプロバイダーとの簡単な比較は不完全であることに注意する価値があります。低コストのクラウド企業は数十社あり、より安価な基本サーバーラックを提供することで市場シェアを競い合っています。これらが、コスト意識のある消費者にとって本当の近い将来の主要な競合他社だと考えています。
言い換えれば、Filecoinのデータ計算やArweaveのAO計算環境など、最近の革新は、より敏感でないデータセットを利用する新しいプロジェクトや、まだコストに敏感でない企業(規模が小さい可能性もあります)において、役割を果たすかもしれません。
したがって、データ空間には新しい暗号化製品に十分な余地がある一方、最近の技術的な破壊は、固有の価値提案を生み出すことができる場所で発生します。分散型の製品が従来のオープンソースの競合他社と直接競合する分野は、進展するまでに時間がかかります。
モデルのトレーニングと推論
暗号資産業界の分散コンピューティング(DeComp)領域は、既存のGPU供給不足のために、中央集権型クラウドコンピューティングに代わる選択肢としても機能することを目指しています。この稀少性の問題に対処するための提案の1つは、集合的なネットワーク内でのアイドル状態のコンピューティングリソースの再利用であり、これにより中央集権型クラウドプロバイダーのコストが削減されます。AkashやRenderなどのプロトコルは、同様の解決策を実装しています。初期の指標から、このようなプロジェクトは利用者とサプライヤーの両方からの利用が増加しているということが示唆されています。たとえば、Akashのアクティブなリース(つまり、利用者数)は、年初来で3倍に増加しています(図3を参照)、これは主にストレージとコンピューティングリソースの利用が増加したためです。
ただし、利用されるネットワークへの支払いは、これらのリソースの需要の成長を上回る利用可能なGPUの供給がピーク時の2023年12月以降実際に減少しています。これに関しては、より多くのプロバイダーがネットワークに参加すると、借りられるGPUの数(比例的に最大の収益ドライバーのようです)が減少しています(図4を参照)。計算価格が供給と需要の変化に基づいて変化するネットワークの場合、供給側の成長が需要側の成長を上回ると、ネイティブトークンへの持続的で使用に基づく需要が最終的にどこに現れるかは不明です。このような変化の長期的な影響は不明ですが、このようなトークン経済モデルは、将来的に市場変化に最適化するために再検討される必要があるかもしれません。
技術的なレベルで、分散コンピューティングソリューションもネットワーク帯域幅の制限に直面しています。マルチノードトレーニングが必要な大規模モデルの場合、物理ネットワークインフラストラクチャ層が重要な役割を果たします。データ転送速度、同期オーバーヘッド、および特定の分散トレーニングアルゴリズムのサポートにより、特定のネットワーク構成とカスタムネットワーク通信(InfiniBandなど)が高性能な実行を容易にするために必要です。あるクラスタサイズを超えると、分散型で実装するのは難しいです。
要約すると、分散コンピューティング(およびストレージ)の長期的な成功は、中央集権化されたクラウドプロバイダーからの激しい競争に直面しています。 任意の採用は、クラウドの採用タイムラインに類似した長期的なプロセスになります。 分散型ネットワークの開発の技術的複雑さの増加に加えて、類似のスケーラブルな開発と販売チームの不足があるため、分散コンピューティングのビジョンを完全に実現するための道のりは厳しいものになるでしょう。
モデルの検証と信頼
人工知能モデルが日常生活でますます重要になるにつれて、その出力品質やバイアスに関する懸念が高まっています。一部の暗号資産プロジェクトは、さまざまなカテゴリにわたる出力を評価するアルゴリズムアプローチを活用することで、分散化された市場ベースの解決策を模索しています。ただし、モデルのベンチマーキングをめぐる課題や、コスト、スループット、品質の間の明らかなトレードオフにより、対面比較が困難になっています。BitTensorは、AIに焦点を当てた最大の暗号資産の1つで、この問題に取り組もうとしていますが、数多くの著名な技術的課題が普及を妨げる可能性があります(付録1を参照)。
さらに、信頼できないモデル推論(つまり、モデルの出力が宣言されたモデルによって生成されたものであることを証明すること)は、暗号通貨とAIの交差点でのもう1つの活発な研究分野です。ただし、オープンソースモデルの規模が縮小するにつれて、そのようなソリューションは需要面で課題に直面する可能性があります。モデルがダウンロードされてローカルで実行され、コンテンツの整合性が頑丈なファイルハッシュ/チェックサム方法を通じて検証できる世界では、信頼できない推論の役割はそれほど明確ではありません。確かに、多くの大規模言語モデル(LLM)はまだスマートフォンなどの軽量デバイスでトレーニングおよび運用することができませんが、強力なデスクトップコンピュータ(たとえば、ハイエンドゲーミング用に使用されるもの)ではすでに多くの高性能モデルを実行できます。
データの出典とアイデンティティ
生成AIの出力が人間の出力と区別がつかなくなるにつれ、AIが生成するものを特定して追跡する重要性が注目されています。GPT 4はGPT 3.5よりもチューリング・テストを3倍速く通過し、いつかはロボットと人間の違いがわからなくなることはほぼ避けられないでしょう。そのような世界では、オンラインユーザーの特定とAIが生成したコンテンツに透かしを入れることが重要な能力となります。
分散型識別子やWorldcoinなどの身元確認メカニズムは、チェーン上での人間の識別に関する以前の課題に取り組むことを目指しています。同様に、ブロックチェーンへのデータハッシュの公開は、コンテンツのタイムスタンプとソースの検証を確立するのに役立ちます。ただし、前述の部分的な解決策と同様に、暗号資産ベースのソリューションの実現可能性と中央集権的な代替手段とのバランスが取れていると考えています。
中国などの一部の国々では、オンラインのアイデンティティを政府が管理するデータベースにリンクしています。世界の他の地域の中央集権の程度が高くないかもしれませんが、KYC(顧客の身元確認)プロバイダーの連合も、ブロックチェーン技術とは独立した身元確認ソリューションを提供できます(今日のインターネットセキュリティの基盤となっている信頼できる証明機関と同様)。現在、テキストや画像の出力に隠された信号を埋め込む人工知能の透かしに関する研究が進行中で、アルゴリズムがコンテンツがAIによって生成されたものかどうかを検出できるようになる予定です。Microsoft、Anthropic、Amazonなどの多くの主要なAI企業が、生成されたコンテンツにそのような透かしを追加することを公式に約束しています。
さらに、多くの既存のコンテンツプロバイダーは、コンプライアンス要件を満たすためにコンテンツのメタデータを厳密に記録するように委託されています。そのため、ユーザーは、ソーシャルメディア投稿に関連するメタデータをしばしば委託します(スクリーンショットを信頼しない)。これらは中央に保存されていても。暗号資産ベースのデータソーシングとアイデンティティーソリューションは、広範な効果を実現するためにユーザープラットフォームと統合する必要があります。したがって、アイデンティティとデータソーシングの証明のための暗号資産ベースのソリューションは技術的に実現可能ですが、その採用は必然的ではないと考えており、最終的にはビジネス、コンプライアンス、規制要件に依存すると考えています。
AIナラティブの取引
これらの困難にもかかわらず、2023年第4四半期以降、多くのAIトークンがBitcoinやEthereumを上回る性能を発揮してきました。また、NvidiaやMicrosoftなどの主要なAI株も同様です。これは、AIトークンが一般的に広範な暗号市場や関連するAIニュースの見出しで強い相対パフォーマンスを享受しているためです(付録2を参照)。したがって、Bitcoinの価格が下落しても、AIに焦点を当てたトークンの価格は上昇する可能性があり、Bitcoinの下落中に上昇の変動が生じる可能性があります。図5は、Bitcoin取引の減少中にAIトークンの分散を視覚的に示しています。
全体的に、仮想通貨空間のAIの物語には、多くの短期的な需要を促進する要因がまだ不足しています。明確な採用予測やメトリクスの欠如は、広範なミームのような憶測を引き起こし、長期的には持続可能でない可能性があります。最終的には、価格とユーティリティが収束するでしょう—未解決の問題は、これがどのくらいかかるか、そしてユーティリティが価格に追いつくか、それとも逆かです。言うまでもなく、仮想通貨市場の構築と繁栄するAI産業の進行は、しばらくの間、仮想通貨AIの強力な物語を維持する可能性があります。
暗号資産の役割は、単なる抽象ではなく、任意の分散型プラットフォームは既存の中央集権的な代替手段と競合し、より広範なビジネスおよび規制要件に対して分析される必要があります。したがって、単に中央集権的なプロバイダーを「分散型」のものと置き換えるだけでは、意味のある進歩をもたらすには不十分です。生成型AIモデルは数年前から存在しており、市場競争とオープンソースソフトウェアによって一定の分散化が維持されています。
このレポートでの繰り返しのテーマは、暗号資産ベースのソリューションは技術的には実現可能であることが多いが、より中央集権的なプラットフォームと同等の機能を実現するには、相当な作業が必要であり、将来の展開で止まることはないであろう。実際、コンセンサスメカニズムにより、中央集権的な開発の方が分散型の開発よりも進展が速いことが多く、急速に進化しているAIのような分野にとって課題を提起する可能性がある。
このため、AIと暗号資産の交差点はまだ初期段階にあり、AI分野の広範な発展に伴い、今後数年間で急激な変化が起こる可能性があります。分散型AIの未来は、多くの暗号業界関係者が描いているように、保証されていません。実際、AI業界自体の未来はほとんど不確実なままです。したがって、私たちは、こうした市場を慎重に航行し、暗号資産ベースの解決策にさらに深く入り、より良い代替案を提供する方法を実際に理解し、潜在的な取引の物語を把握することが重要だと考えています。
この記事はもともと「加密世界のAI海市蜃楼」というタイトルで、[ から転載されましたtheblockbeats]. すべての著作権は元の著者に帰属します [David Han]. If you have any objection to the reprint, please contactGate Learnチーム、チームはできるだけ早く対処します。
免責事項:この記事で表現されている見解や意見は、筆者個人の見解を表すものであり、投資アドバイスを構成するものではありません。
他の言語への記事の翻訳はGate Learnチームによって行われます。言及されていない限り、翻訳された記事のコピー、配布、または盗作は禁止されています。
แชร์
近年、特に生成的人工知能の分野での人工知能の継続的な突破は、人工知能業界に大きな注目を集め、両者の交差点に位置する暗号プロジェクトに機会を提供しています。以前、2023年6月の初期レポートでセクターの可能性の一部を取り上げ、全体的な暗号通貨への資本配分が人工知能への投資不足であることを指摘しました。その後、暗号AIの分野は莫大に成長しており、広範な採用を妨げる可能性のある実務上の課題のいくつかを指摘することが重要だと考えています。
AIの急速な変化により、暗号資産中心のプラットフォームが業界を変革するために特異な立場にあるという大胆な主張には慎重にならざるを得ません。これにより、ほとんどのAIトークンが長期的かつ持続可能な価値の向上経路を持つと考えています。道は不確実性でいっぱいであり、特に固定のトークン経済モデルを持つプロジェクトにとってはそうです。むしろ、AIのいくつかの新興トレンドは、より広範な市場競争と規制を考慮すると、暗号通貨ベースの革新の採用を困難にするかもしれないと考えています。
それは言うまでもなく、AIと暗号資産の間のポイントは広範囲で多様な機会を持っており、多くの分野にすでにマーケティングされていないトークンが欠如しているにもかかわらず、特定のサブセグメントでの採用が速くなる可能性が高いと考えています。それでも、それは投資家の関心をそそることにはなっていないようです。AI関連の暗号トークンのパフォーマンスは、AI市場の見出しに支えられており、ビットコインの取引が低調な日でも価格が上昇する可能性があります。したがって、AI関連のトークンの多くがAIの進歩の表れとして取引され続けると考えています。
暗号資産関連の人工知能分野における最も重要なトレンドの1つは、オープンソースモデルを中心とした持続的な文化です。 Hugging Faceには、研究者やユーザーが操作や微調整を行うために公開されているモデルが53万以上あります。 Hugging FaceのAIコラボレーションにおける役割は、コードホスティングにGitHubを、コミュニティ管理にDiscordを頼ることと同様です(どちらも暗号空間で広く使用されています)。 深刻な誤管理を除いて、この状況は近い将来変わる可能性は低いです。
Hugging Faceで利用可能なモデルは、大規模言語モデル(LLM)から生成画像およびビデオモデルまで幅広く、Open AI、Meta、Googleなどの主要業界プレーヤーや独立開発者による作成物が含まれます。一部のオープンソース言語モデルは、スループットにおいて最先端のクローズドソースモデルに対して性能上の優位性を持ちつつ(出力品質を維持しながら)、オープンソースと商用モデルの間で競争が行われていることが確認されます(図1を参照)。重要なことは、この活気あるオープンソースエコシステムと高い競争力を持つ商業セクターが組み合わさり、悪質なモデルが競争から駆逐される産業を可能にしているという点です。
第二のトレンドは、より高品質でコスト効果の高い小型モデルの増加です(2020年のLLM研究とMicrosoftの最近の論文で強調されています)。これはさらにハイエンドのパフォーマンスを可能にするオープンソース文化と重なっており、一部の微調整されたオープンソースモデルは、特定のベンチマークで主要なクローズドソースモデルを凌駕することさえあります。そのような世界では、一部のAIモデルをローカルで実行し、分散化を最大限に活用することができます。もちろん、既存のテクノロジーカンパニーは引き続きクラウド上でより大規模なモデルのトレーニングと実行を行うでしょうが、その間の設計空間では、トレードオフが必要とされるでしょう。
さらに、AIモデルのベンチマークタスクの複雑さが増していることを考慮すると(データの汚染やテスト範囲の変動を含む)、モデルの出力を生成することは、最終的にはエンドユーザーによって自由市場で最良の評価がなされるかもしれません。実際、エンドユーザーは、同じ操作を行うベンチマーク企業とモデルの出力を並べて比較するために既存のツールを使用することができます。生成AIベンチマークの難しさのおおまかな考えは、成長するさまざまなオープンLLMベンチマーク(MMLU、HellaSwag、TriviaQA、BoolQなどを含む)から得られます。それぞれが常識推論、学術的トピック、さまざまな質問形式など、異なるユースケースをテストしています。
AIスペースで観察される3つ目のトレンドは、既存のプラットフォームが強力なユーザーの定着度を持っているか、特定のビジネス問題を解決している場合、AIの統合から不均衡に利益を得ることができるということです。たとえば、GitHub Copilotのコードエディターへの統合は、すでに強力な開発者環境を向上させています。電子メールクライアントからスプレッドシート、顧客関係管理ソフトウェアへのAIインタフェースの埋め込みも、AIの自然な使用例です(たとえば、KlarnaのAIアシスタントは700人の常勤カスタマーサービススタッフの仕事を行います)。
ただし、これらのシナリオの多くでは、AIモデルが新しいプラットフォームを生み出すのではなく、既存のものを強化するだけであることに注意する価値があります。他のAIモデルは、従来のビジネスプロセスを内部で向上させる(例:MetaのLatticeシステムは、App Tracking Transparencyを導入した後、Appleの広告パフォーマンスを従来の水準に回復させるのに役立ちました)場合も、プロプライエタリデータとクローズドシステムに依存することがよくあります。このタイプのAIモデルは、主要製品に垂直統合されており、プロプライエタリデータを使用しているため、おそらく閉源のままでしょう。
AIハードウェアとコンピューティングの世界では、関連する2つのトレンドが見られます。1つ目は、コンピューティングの使用がトレーニングから推論へと移行していることです。つまり、人工知能モデルが最初に開発される際には、大量のコンピューティングリソースが使われて、大規模なデータセットを与えることでモデルを「トレーニング」します。現在は、そのモデルを展開してクエリを実行する段階に移行しました。
2024年2月のNVIDIAの決算電話会議では、約40%が推論用に使用されていることが示されました。サティア・ナデラは、1月のマイクロソフトの決算電話会議で同様の発言をし、Azure AIのほとんどが推論用であることを指摘しました。このトレンドが続くにつれて、モデルを収益化しようとする企業は、安全かつ本番用に信頼してモデルを実行できるプラットフォームを優先すると考えています。
第2の主要なトレンドは、ハードウェア・アーキテクチャを取り巻く競争環境です。NvidiaのH200プロセッサは2024年第2四半期から利用可能になる予定で、次世代のB100では性能がさらに2倍に向上すると予想されています。さらに、Googleの独自のTensor Processing Unit(TPU)への継続的なサポートやGroqの新しいLanguage Processing Unit(LPU)によって、これらの代替製品としての市場シェアが今後数年間で拡大する可能性もあります(図2参照)。こうした動向は人工知能産業のコストダイナミクスを変え、クラウドサービスプロバイダに利益をもたらし、迅速に方針を転換し、ハードウェアを大量購入し、関連する物理ネットワーキング要件や開発者ツールを構成することが可能になるかもしれません。
全体的に、人工知能の分野は新興で急速に発展している分野です。ChatGPTが2022年11月に初めて市場に登場してから1.5年も経っていないにもかかわらず(その基礎となるGPT 3モデルは2020年6月以来存在しています)、その後の空間での急速な成長は驚異的でした。いくつかの生成的AIモデルにおけるバイアスに関する疑問のある行動にもかかわらず、市場では性能の低いモデルがより良い代替手段のために段階的に淘汰される可能性があります。業界の急速な成長と今後の規制の可能性から、業界の問題は新しい解決策が利用可能になるたびに定期的に変化しています。
この急速に革新する分野において、よく言われる「中央集権化された解決策[XXX]」が早まった結論となるのは時期尚早です。また、必ずしも存在しない中央集権化の問題を予防的に解決しようとすることもあります。実際のところ、AI業界は、多くの異なる企業やオープンソースプロジェクトの競争を通じて、技術とビジネスの垂直分野全体で大規模な分散化を達成しています。さらに、彼らの意思決定とコンセンサスプロセスの性質により、分散型プロトコルは技術的および社会的レベルの両面で、集中型プロトコルよりも遅れて進化します。これは、AIの発展段階において分散化と競争力のある製品のバランスを取ろうとする際に障害を生む可能性があります。言い換えれば、仮想通貨と人工知能の間には、長期にわたって意味のあるシナジーが生まれる可能性があります。
大まかに言えば、人工知能と暗号資産の交差点を広く2つの大きなカテゴリに分けています。最初のカテゴリは、AI製品が暗号通貨産業を改善するユースケースです。これには、人間が読み取れる取引の作成やブロックチェーンデータ分析の改善、パーミッションレスプロトコルの一部としてオンチェーンモデルの出力を活用するなどのシナリオが含まれます。2番目のカテゴリは、暗号通貨が分散コンピューティング、検証、アイデンティティなどを通じて従来のAIパイプラインを破壊しようとするユースケースです。
前者のビジネス関連シナリオのユースケースは明確であり、重要な技術的課題が残っていると考えていますが、より複雑なオンチェーン推論モデルシナリオには長期的な展望もあります。中央集権型AIモデルは、開発者ツールやコード監査の改善から、人間の言語をオンチェーンのアクションに翻訳するまで、他の技術に焦点を当てた産業と同様に、暗号資産を改善することができます。ただし、この分野への投資は通常、ベンチャーキャピタルを通じて民間企業に流れ込むため、一般市場にはしばしば無視されます。
しかし、暗号資産が既存のAIパイプラインにどのように影響を与えるかの意味や利点は、私たちにとってはそれほど確かではありません。後者のカテゴリにおける困難は、単なる技術的な課題だけでなく(私たちは一般的に長期的に解決可能であると考えています)、より広範囲の市場や規制上の力との厳しい戦いでもあります。最近の人工知能と暗号通貨に関する注目の多くは、このカテゴリに焦点を当てられており、これらのユースケースは流動的なトークンを所有するにはより適しています。これは、現在、暗号通貨における集中型AIツールに関連する流動性トークンが比較的少ないため、私たちの次のセクションの焦点となっています。
問題を過度に単純化するリスクを冒しながら、AIパイプラインの4つの主要段階における暗号通貨の人工知能への潜在的な影響を考慮しています。
データ収集、保存、および処理
モデルトレーニングと推論
モデル出力の検証
人工知能モデルの出力を追跡します
これらの分野で多くの新しい暗号資産AIプロジェクトが登場しています。しかし、需要側の誘発と中央集権企業やオープンソースソリューションからの激しい競争により、多くのプロジェクトが短中期に深刻な課題に直面することになるでしょう。
独自データ
データはすべてのAIモデルの基盤であり、プロフェッショナルなAIモデルのパフォーマンスにおいて鍵となる要素です。歴史的なブロックチェーンデータ自体がモデルのための新たな豊富なデータソースであり、Grassのようなプロジェクトでは、暗号資産のインセンティブを活用してオープンインターネットから新たなデータセットをキュレーションしようとしています。この点において、暗号資産は業界固有のデータセットを提供し、新たな価値あるデータセットの創出をインセンティブとする機会があります。(RedditのGoogleとの最近の年間6000万ドルのデータライセンス取引は、データセットの収益化の未来に良い兆候だと考えています。)
多くの初期モデル(例:GPT 3)は、CommonCrawl、WebText2、Books、Wikipediaなどのオープンデータセットと、Hugging Face(現在110,000以上のオプションをホスト)で自由に利用できる類似のデータセットを組み合わせて使用していました。しかし、商業的な利益を保護するために、最近の多くのクローズドソースモデルは、まだ最終的なトレーニングデータセットの構成を公開していません。特にビジネスモデルでは、プロプライエタリなデータセットへの傾向が続き、データライセンスの重要性が高まります。
既存の中央集権的なデータマーケットプレイスは、すでにデータの提供者と消費者の間のギャップを埋めるのに役立っており、オープンソースのデータカタログと企業競合他の間に新しい分散型データマーケットプレイスソリューションの機会スペースを残しています。法的構造のサポートがない場合、純粋に分散型のデータマーケットも標準化されたデータインタフェースとパイプラインを構築し、データの整合性と構成を検証し、製品の冷間起動問題を解決する必要があります。同時に、市場参加者間のトークンインセンティブをバランスさせる必要があります。
さらに、分散型ストレージソリューションは、人工知能産業においても、多くの課題を抱えながら最終的には場所を見つけるかもしれません。一方で、オープンソースのデータセットを配布するためのパイプラインは既に存在し、広く使用されています。一方で、多くの独自のデータセットの所有者は厳格なセキュリティおよびコンプライアンスの要件を持っています。
現在、FilecoinやArweaveのような分散型ストレージプラットフォームに重要なデータをホスティングするための規制経路は存在していません。多くの企業は、オンプレミスサーバーから中央集権型クラウドストレージプロバイダーに移行中です。さらに、これらネットワークの分散性は、現在、特定の地理的位置や物理的データ分離の要件を満たしておらず、重要データを保存するための技術レベルではありません。
分散型ストレージソリューションと確立したクラウドプロバイダーとの価格比較は、分散型ストレージユニットが単位あたりよりも安価であることを示唆していますが、これは重要な前提を無視しています。まず、プロバイダー間のシステムの移行に関連する前払い費用は、日々の運用費用の上に考慮する必要があります。第二に、暗号資産ベースの分散型ストレージプラットフォームは、過去20年間に開発された成熟したクラウドシステムとのより良いツールや統合を実現する必要があります。クラウドソリューションは、ビジネス運営の観点からもより予測可能なコストを持ち、契約上の義務や専任サポートチームを提供し、既存の開発者の豊富なプールを持っています。
それに加えて、Amazon Web Services、Google Cloud Platform、およびMicrosoft Azureの3つの主要なクラウドプロバイダーとの簡単な比較は不完全であることに注意する価値があります。低コストのクラウド企業は数十社あり、より安価な基本サーバーラックを提供することで市場シェアを競い合っています。これらが、コスト意識のある消費者にとって本当の近い将来の主要な競合他社だと考えています。
言い換えれば、Filecoinのデータ計算やArweaveのAO計算環境など、最近の革新は、より敏感でないデータセットを利用する新しいプロジェクトや、まだコストに敏感でない企業(規模が小さい可能性もあります)において、役割を果たすかもしれません。
したがって、データ空間には新しい暗号化製品に十分な余地がある一方、最近の技術的な破壊は、固有の価値提案を生み出すことができる場所で発生します。分散型の製品が従来のオープンソースの競合他社と直接競合する分野は、進展するまでに時間がかかります。
モデルのトレーニングと推論
暗号資産業界の分散コンピューティング(DeComp)領域は、既存のGPU供給不足のために、中央集権型クラウドコンピューティングに代わる選択肢としても機能することを目指しています。この稀少性の問題に対処するための提案の1つは、集合的なネットワーク内でのアイドル状態のコンピューティングリソースの再利用であり、これにより中央集権型クラウドプロバイダーのコストが削減されます。AkashやRenderなどのプロトコルは、同様の解決策を実装しています。初期の指標から、このようなプロジェクトは利用者とサプライヤーの両方からの利用が増加しているということが示唆されています。たとえば、Akashのアクティブなリース(つまり、利用者数)は、年初来で3倍に増加しています(図3を参照)、これは主にストレージとコンピューティングリソースの利用が増加したためです。
ただし、利用されるネットワークへの支払いは、これらのリソースの需要の成長を上回る利用可能なGPUの供給がピーク時の2023年12月以降実際に減少しています。これに関しては、より多くのプロバイダーがネットワークに参加すると、借りられるGPUの数(比例的に最大の収益ドライバーのようです)が減少しています(図4を参照)。計算価格が供給と需要の変化に基づいて変化するネットワークの場合、供給側の成長が需要側の成長を上回ると、ネイティブトークンへの持続的で使用に基づく需要が最終的にどこに現れるかは不明です。このような変化の長期的な影響は不明ですが、このようなトークン経済モデルは、将来的に市場変化に最適化するために再検討される必要があるかもしれません。
技術的なレベルで、分散コンピューティングソリューションもネットワーク帯域幅の制限に直面しています。マルチノードトレーニングが必要な大規模モデルの場合、物理ネットワークインフラストラクチャ層が重要な役割を果たします。データ転送速度、同期オーバーヘッド、および特定の分散トレーニングアルゴリズムのサポートにより、特定のネットワーク構成とカスタムネットワーク通信(InfiniBandなど)が高性能な実行を容易にするために必要です。あるクラスタサイズを超えると、分散型で実装するのは難しいです。
要約すると、分散コンピューティング(およびストレージ)の長期的な成功は、中央集権化されたクラウドプロバイダーからの激しい競争に直面しています。 任意の採用は、クラウドの採用タイムラインに類似した長期的なプロセスになります。 分散型ネットワークの開発の技術的複雑さの増加に加えて、類似のスケーラブルな開発と販売チームの不足があるため、分散コンピューティングのビジョンを完全に実現するための道のりは厳しいものになるでしょう。
モデルの検証と信頼
人工知能モデルが日常生活でますます重要になるにつれて、その出力品質やバイアスに関する懸念が高まっています。一部の暗号資産プロジェクトは、さまざまなカテゴリにわたる出力を評価するアルゴリズムアプローチを活用することで、分散化された市場ベースの解決策を模索しています。ただし、モデルのベンチマーキングをめぐる課題や、コスト、スループット、品質の間の明らかなトレードオフにより、対面比較が困難になっています。BitTensorは、AIに焦点を当てた最大の暗号資産の1つで、この問題に取り組もうとしていますが、数多くの著名な技術的課題が普及を妨げる可能性があります(付録1を参照)。
さらに、信頼できないモデル推論(つまり、モデルの出力が宣言されたモデルによって生成されたものであることを証明すること)は、暗号通貨とAIの交差点でのもう1つの活発な研究分野です。ただし、オープンソースモデルの規模が縮小するにつれて、そのようなソリューションは需要面で課題に直面する可能性があります。モデルがダウンロードされてローカルで実行され、コンテンツの整合性が頑丈なファイルハッシュ/チェックサム方法を通じて検証できる世界では、信頼できない推論の役割はそれほど明確ではありません。確かに、多くの大規模言語モデル(LLM)はまだスマートフォンなどの軽量デバイスでトレーニングおよび運用することができませんが、強力なデスクトップコンピュータ(たとえば、ハイエンドゲーミング用に使用されるもの)ではすでに多くの高性能モデルを実行できます。
データの出典とアイデンティティ
生成AIの出力が人間の出力と区別がつかなくなるにつれ、AIが生成するものを特定して追跡する重要性が注目されています。GPT 4はGPT 3.5よりもチューリング・テストを3倍速く通過し、いつかはロボットと人間の違いがわからなくなることはほぼ避けられないでしょう。そのような世界では、オンラインユーザーの特定とAIが生成したコンテンツに透かしを入れることが重要な能力となります。
分散型識別子やWorldcoinなどの身元確認メカニズムは、チェーン上での人間の識別に関する以前の課題に取り組むことを目指しています。同様に、ブロックチェーンへのデータハッシュの公開は、コンテンツのタイムスタンプとソースの検証を確立するのに役立ちます。ただし、前述の部分的な解決策と同様に、暗号資産ベースのソリューションの実現可能性と中央集権的な代替手段とのバランスが取れていると考えています。
中国などの一部の国々では、オンラインのアイデンティティを政府が管理するデータベースにリンクしています。世界の他の地域の中央集権の程度が高くないかもしれませんが、KYC(顧客の身元確認)プロバイダーの連合も、ブロックチェーン技術とは独立した身元確認ソリューションを提供できます(今日のインターネットセキュリティの基盤となっている信頼できる証明機関と同様)。現在、テキストや画像の出力に隠された信号を埋め込む人工知能の透かしに関する研究が進行中で、アルゴリズムがコンテンツがAIによって生成されたものかどうかを検出できるようになる予定です。Microsoft、Anthropic、Amazonなどの多くの主要なAI企業が、生成されたコンテンツにそのような透かしを追加することを公式に約束しています。
さらに、多くの既存のコンテンツプロバイダーは、コンプライアンス要件を満たすためにコンテンツのメタデータを厳密に記録するように委託されています。そのため、ユーザーは、ソーシャルメディア投稿に関連するメタデータをしばしば委託します(スクリーンショットを信頼しない)。これらは中央に保存されていても。暗号資産ベースのデータソーシングとアイデンティティーソリューションは、広範な効果を実現するためにユーザープラットフォームと統合する必要があります。したがって、アイデンティティとデータソーシングの証明のための暗号資産ベースのソリューションは技術的に実現可能ですが、その採用は必然的ではないと考えており、最終的にはビジネス、コンプライアンス、規制要件に依存すると考えています。
AIナラティブの取引
これらの困難にもかかわらず、2023年第4四半期以降、多くのAIトークンがBitcoinやEthereumを上回る性能を発揮してきました。また、NvidiaやMicrosoftなどの主要なAI株も同様です。これは、AIトークンが一般的に広範な暗号市場や関連するAIニュースの見出しで強い相対パフォーマンスを享受しているためです(付録2を参照)。したがって、Bitcoinの価格が下落しても、AIに焦点を当てたトークンの価格は上昇する可能性があり、Bitcoinの下落中に上昇の変動が生じる可能性があります。図5は、Bitcoin取引の減少中にAIトークンの分散を視覚的に示しています。
全体的に、仮想通貨空間のAIの物語には、多くの短期的な需要を促進する要因がまだ不足しています。明確な採用予測やメトリクスの欠如は、広範なミームのような憶測を引き起こし、長期的には持続可能でない可能性があります。最終的には、価格とユーティリティが収束するでしょう—未解決の問題は、これがどのくらいかかるか、そしてユーティリティが価格に追いつくか、それとも逆かです。言うまでもなく、仮想通貨市場の構築と繁栄するAI産業の進行は、しばらくの間、仮想通貨AIの強力な物語を維持する可能性があります。
暗号資産の役割は、単なる抽象ではなく、任意の分散型プラットフォームは既存の中央集権的な代替手段と競合し、より広範なビジネスおよび規制要件に対して分析される必要があります。したがって、単に中央集権的なプロバイダーを「分散型」のものと置き換えるだけでは、意味のある進歩をもたらすには不十分です。生成型AIモデルは数年前から存在しており、市場競争とオープンソースソフトウェアによって一定の分散化が維持されています。
このレポートでの繰り返しのテーマは、暗号資産ベースのソリューションは技術的には実現可能であることが多いが、より中央集権的なプラットフォームと同等の機能を実現するには、相当な作業が必要であり、将来の展開で止まることはないであろう。実際、コンセンサスメカニズムにより、中央集権的な開発の方が分散型の開発よりも進展が速いことが多く、急速に進化しているAIのような分野にとって課題を提起する可能性がある。
このため、AIと暗号資産の交差点はまだ初期段階にあり、AI分野の広範な発展に伴い、今後数年間で急激な変化が起こる可能性があります。分散型AIの未来は、多くの暗号業界関係者が描いているように、保証されていません。実際、AI業界自体の未来はほとんど不確実なままです。したがって、私たちは、こうした市場を慎重に航行し、暗号資産ベースの解決策にさらに深く入り、より良い代替案を提供する方法を実際に理解し、潜在的な取引の物語を把握することが重要だと考えています。
この記事はもともと「加密世界のAI海市蜃楼」というタイトルで、[ から転載されましたtheblockbeats]. すべての著作権は元の著者に帰属します [David Han]. If you have any objection to the reprint, please contactGate Learnチーム、チームはできるだけ早く対処します。
免責事項:この記事で表現されている見解や意見は、筆者個人の見解を表すものであり、投資アドバイスを構成するものではありません。
他の言語への記事の翻訳はGate Learnチームによって行われます。言及されていない限り、翻訳された記事のコピー、配布、または盗作は禁止されています。