コンピューティングパワー短缺下の大モデル商機:新型コンピューティングパワーサービスモデルの台頭

コンピューティングパワーサービスが新しいビジネスモデルになる中、大モデル「錬丹」ブームの後、どのように転換するか?

最近、世界中の40年の気象データを使用し、200枚のGPUカードを利用して約2ヶ月間の事前トレーニングを行い、数億のパラメータを持つ気象大モデルが誕生しました。これは、清華大学を卒業して3年の若者が大モデルを訓練した経験です。

コストの観点から見ると、1時間あたり7.8元/枚のGPUで計算した場合、この気象大モデルのトレーニングコストは200万元を超える可能性があります。一方、汎用大モデルをトレーニングする場合、コストは100倍に増える可能性があります。

データによると、中国には現在100を超える10億パラメータ規模の大モデルが存在します。しかし、業界が殺到する大モデルの"錬金術"は、高性能GPUの不足という困難に直面しています。コンピューティングパワーのコストは依然として高く、コンピューティングパワーと資金の不足が業界が直面する最も明白な問題となっています。

ハイエンドGPUの不足

"確かに不足していますが、私たちにはどうしようもありません。"ある大企業の幹部がGPU不足の問題にこう答えました。

これは業界で認められた難題となっているようです。ピーク時には、NVIDIA A100の価格が20万〜30万元にまで高騰し、単体のA100サーバーの月額レンタル料金も5万〜7万元に急上昇しました。それでも、高価格が必ずしもチップを手に入れることができるわけではなく、一部のコンピューティングパワー供給業者は供給業者の違約といった稀な状況に直面したこともあります。

あるクラウドコンピューティング業界の高管は次のように述べています:"コンピューティングパワーの不足は確かに存在します。多くの顧客が高性能GPUリソースを求めていますが、現在のところ広範な市場の需要に完全に応えることはできません。"

短期的に、高性能GPUの不足は業界全体で解決が難しい。大規模モデルのブームにより、市場のコンピューティングパワーの需要が急速に増加しているが、供給量の増加速度はそれに遠く及ばない。長期的には、コンピューティングパワーの供給は必然的に売り手市場から買い手市場に移行するが、そのプロセスにどれだけの時間がかかるかは現在のところ未知数である。

各社は自社が保有するNVIDIA GPUの数を計算し、それによって市場シェアを判断しています。関係者は例を挙げて言います。「もし手元に約1万枚のカードがあり、市場全体が10万枚であれば、シェアは10%です。年末までに保有量が4万枚に達し、市場全体が20万枚であれば、20%の市場シェアを占める可能性があります。」

一方ではGPUカードが購入できず、もう一方では大規模モデルのトレーニングの敷居が業界の宣伝ほど簡単ではありません。前述の気象大規模モデルのトレーニングコストは200万元を超える可能性がありますが、注意が必要なのは、これは一般的な大規模モデルを基にした垂直分野モデルのトレーニングコストであり、パラメータ規模は億レベルです。もし十億またはそれ以上の規模の一般的な大規模モデルをトレーニングしようとすると、コストは十倍、百倍に増加する可能性があります。

あるテクノロジー企業の幹部が明らかにした:"現在、投資規模が最も大きいのはモデルのトレーニングであり、数十億の資本投入がなければ、大規模なモデルを持続的に拡大することは非常に難しい。"

ある起業家は現在の大規模モデルの競争状況を次のように説明しています:"速く走るためには、少なくとも資金が尽きる前に成果を得て次のラウンドの'資金調達'を得る必要があります。もし何百億または何千億の資金の支援がなければ、この道は非常に難しいです。"

この状況下、業界では一般的に、大規模モデル市場の競争が進むにつれて、市場も熱狂から理性に移行し、企業も期待の変化に応じてコストを管理し、戦略を調整すると考えられています。

コンピューティングパワー不足への積極的な取り組み

条件がなくても条件を作り出す - これはほとんどの大規模モデルの参加者の心態のようです。各企業は実際に存在する問題に対処する方法を探しています。

高性能GPUチップの不足により、中国市場で使用できるGPUは最新世代ではなく、性能が通常低いため、企業は大規模モデルのトレーニングにより長い時間を必要としています。これらの企業は、コンピューティングパワーの不足を補うための革新的な方法を模索しています。

その方法の一つは、より高品質なデータを使用してトレーニングを行い、トレーニング効率を向上させることです。最近発表された業界レポートでは、データ品質に関して人工的なラベリングと確認を導入し、原データから一定の割合を選び出してラベリングを行い、高品質なデータセットを構築することを提案しています。

高品質なデータを通じて大規模モデルのコストを削減するだけでなく、インフラストラクチャの能力を向上させ、千カロリー以上の安定した運用を2週間維持することも、技術的な難点と最適化の方向性の一つです。

あるクラウドサービスプロバイダーの幹部は次のように述べています。「クラウドサービスプロバイダーとして、私たちは顧客が安定した信頼性のあるインフラを構築するのを支援します。GPUサーバーは安定性が低く、いかなる障害もトレーニングの中断を引き起こし、全体のトレーニング時間を増加させます。高性能計算クラスターは、顧客により安定したサービスを提供し、トレーニング時間を相対的に短縮し、一部のコンピューティングパワーの問題を解決します。」

同時に、コンピューティングパワーカードのリソース調整は、サービスプロバイダーの技術力を試すものです。あるインターネットソリューション責任者は言いました:"コンピューティングパワーカードのリソースを持っているだけでは不十分で、カードリソースを調整して実際に使用する方法が、より挑戦的な核心能力とエンジニアリング能力です。1つのカードを複数の小さなカードに分割し、分散型の精密な調整を実現することで、コンピューティングパワーコストをさらに削減できます。"

ネットワークは大規模モデルのトレーニング速度と効率にも影響を与えます。大規模モデルのトレーニングには、何千枚ものGPUカードが必要で、数百台のGPUサーバーを接続するため、ネットワーク速度に対する要求は非常に高く、ネットワークの混雑はトレーニング速度と効率に深刻な影響を与える可能性があります。

いくつかのメーカーは新たな道を切り開き、クラウドコンピューティングアーキテクチャからスーパーコンピュータアーキテクチャに転換することがコスト削減の方法となっています。ユーザーのニーズを満たす中で、非高スループット計算タスクや並列タスクシナリオにおいて、スーパーコンピュータクラウドの価格はクラウドスーパーコンピュータの約半分であり、さらにパフォーマンスの最適化によりリソースの利用率を30%から60%に引き上げることができます。

さらに、国内のプラットフォームを使用して大規模モデルのトレーニングと推論を行うことを選択する企業もあります。ある企業の幹部は、彼らがHuaweiと共同で発表したオールインワン機器は、国内のプラットフォーム上でトレーニングと推論が可能であり、HuaweiのGPUの性能はNVIDIAに匹敵するようになったと述べています。

上述の方法はそれぞれ大規模なプロジェクトであり、一般企業が自社でデータセンターを構築してニーズを満たすのは難しいため、多くのアルゴリズムチームは専門のコンピューティングパワー業者にサポートを依頼しています。並列ストレージも大きなコストと技術的な課題であり、さらにIDCの可用性ゾーンの電力コスト、ソフトウェアプラットフォームのコスト、人的コストなどの運営コストも考慮する必要があります。

千カロリー級GPUクラスターで規模の効果を実現するためには、コンピューティングパワーサービスプロバイダーを選ぶことが、限界コストがゼロに近づくことを意味します。

あるアカデミー会員は、AIGCが人工知能産業の爆発をもたらしたと指摘し、スマート技術の大規模な応用には典型的なロングテール問題が存在すると述べました。強力なAI能力を持つ部門、研究機関、大中企業は、算力の需要主体の約20%を占めており、残りの80%は中小企業です。これらの主体は規模や予算に制約されているため、算力リソースを取得することが難しい場合や、高額な価格に制限され、AI時代において発展の恩恵を得ることが困難です。

したがって、スマート技術の大規模な適用を実現し、人工知能産業が「称賛」と「収益」の両方を得るためには、大量の廉価で使いやすいスマートコンピューティングパワーが必要であり、中小企業も便利で低コストでコンピューティングパワーを利用できるようにする必要があります。

大規模モデルのコンピューティングパワーに対する切実な需要や、コンピューティングパワーの応用過程で解決すべきさまざまな課題は、新しい変化を反映しています: コンピューティングパワーは、市場の需要と技術のイテレーションの過程で、新しいサービスモデルとなりました。

新しいコンピューティングパワーサービスモデルの探求

私たちが争い合っている大規模モデルのコンピューティングパワーとは一体何なのでしょうか?この問題を解決するには、まずコンピューティングパワーサービスから説明する必要があります。

コンピューティングパワーは、汎用コンピューティングパワー、スマートコンピューティングパワー、スーパーコンピューティングパワーに分かれ、これらのコンピューティングパワーはサービスの一種となり、市場と技術の二重の駆動の結果です。

業界のホワイトペーパーは、コンピューティングパワーサービスを以下のように定義しています:多様なコンピューティングパワーを基盤とし、コンピューティングパワーネットワークでつながり、効果的なコンピューティングパワーの供給を目指すコンピューティングパワー産業の新しい分野。

コンピューティングパワーサービスの本質は、新しい計算技術を通じて異種コンピューティングパワーの統一出力を実現し、クラウド、大データ、AIなどの技術と交差融合することです。コンピューティングパワーサービスは、単にコンピューティングパワーを含むだけでなく、コンピューティングパワー、ストレージ、ネットワークなどのリソースの統一パッケージでもあり、サービス形式(としてAPI)を通じてコンピューティングパワーの提供を完了します。

この点を理解すると、NVIDIAのチップを争っている大部分はコンピューティングパワーサービスプロバイダー、つまりコンピューティングパワーの生産者であることがわかります。実際に前面でコンピューティングパワーAPIを呼び出す業界ユーザーは、相応のコンピューティングパワーの需要を提示するだけで済みます。

ソフトウェアの観点から見ると、すべてのソフトウェアインタラクションによって生成される大モデルの使用は3種類に分かれます。1つ目は大モデルAPI呼び出しで、各社が価格を提示し、価格に基づいて決済します。2つ目は自社の小モデルで、コンピューティングパワーを自ら購入し、さらには自分で展開することもあります。3つ目は大モデルのベンダーとクラウドベンダーが協力するもので、専用のクラウドを用意し、月ごとに支払います。あるオフィスソフトウェア会社の幹部は、彼らは主にAPI呼び出しを採用し、内部の小モデルは自社でコンピューティングパワーのスケジューリングプラットフォームを構築していると述べました。

つまり、コンピューティングパワー産業チェーンの構造において、上流企業は主に汎用コンピューティングパワー、インテリジェントコンピューティングパワー、スーパーコンピューティングパワー、ストレージおよびネットワークなどのコンピューティングパワーサービスを支えるリソースの供給を行います。例えば、大モデルのコンピューティングパワー争奪戦において、NVIDIAは上流のコンピューティングパワー基礎リソース供給者に属し、業界にチップを供給しています。

中游企業はクラウドサービスプロバイダーや新型コンピューティングパワーサービスプロバイダーを中心に構成され、彼らはコンピューティングパワーの編成、スケジューリング、取引技術を通じてコンピューティングパワーの生産を実現し、API などの方法でコンピューティングパワーの供給を行います。コンピューティングパワーサービスの中游企業のサービス化能力が強いほど、アプリケーション側のハードルは低くなり、コンピューティングパワーの普及と普遍的な発展に寄与します。

下流企業は、コンピューティングパワーサービスが提供する計算能力を利用して付加価値サービスを生産する産業チェーンの役割を担っており、業界ユーザーなどが含まれます。この部分のユーザーは、要求を提出するだけで、コンピューティングパワーの生産者は要求に応じて対応するコンピューティングパワーを配置し、ユーザーが指示した"コンピューティングパワーのタスク"を完了します。

これは、元々サーバーを購入して大規模モデルのコンピューティングパワー環境を構築するよりも、コストと技術の利点があります。

コンピューティングパワーのビジネスモデルの迭代

ある早期にリリースされた汎用大モデルを例にとると、公開された情報によれば、国内の多くの主要なAIコンピューティングパワーサービスプロバイダーを利用しているとのことです。関係者によれば、理論的にはすべての主要なコンピューティングパワーサービスプロバイダー/クラウドサービスプロバイダーを使い尽くしている可能性があるとのことです。

従量課金と年間・月間定額課金は現在のコンピューティングパワーサービスの主流モデルで、使用ニーズは大きく分けて二つあります。一つは、対応するコンピューティングパワーサービスインスタンスを選択することです。例えば、あるクラウドサービスプロバイダーが提供するNVIDIA A800、A100、V100の三種類の主流GPUを搭載した高性能GPUサーバーです。二つ目は、対応するMaaSサービスプラットフォームを選択し、プラットフォーム内で大規模モデルの業界特化調整を行うことです。

現在の業界では、コンピューティングパワーサービスの「算ネット一体化融合」を推進しています。計算タスク、コンピューティングパワーリソースの状態などの情報を総合的に判断し、アーキテクチャ、地域、サービスプロバイダーを超えたスケジューリングをサポートするコンピューティングパワー編成プランを形成し、関連リソースの展開を完了します。例えば、資金を事前に預け入れるだけで、コンピューティングパワーネットワーク内の区画を自由に呼び出すことができ、アプリケーションの特性に応じて最適で最速、またはコストパフォーマンスの高い区画を選択し、時間に応じて課金し、預け入れた資金から費用が差し引かれます。

クラウドサービスプロバイダーも同様で、コンピューティングパワーサービスはクラウドサービスの独特な製品であり、彼らは迅速にコンピューティングパワー産業チェーンに参加することができます。

工信部のデータによると、2022年の中国のコンピューティングパワーの総規模は180EFLOPSに達し、世界で2位となっています。2022年までに、中国のコンピューティングパワー産業の規模は1.8兆元に達しました。大規模モデルのコンピューティングパワーは、コンピューティングパワー産業の発展を大いに加速させました。

現在のコンピューティングパワーサービスは、実際には新しいタイプの「電力販売」モデルであるという見解があります。ただし、役割の違いに応じて、一部のコンピューティングパワーサービスプロバイダーは、ユーザーに対して、システム性能の調整、ソフトウェアのインストール、大規模な作業の運用監視、運用特性分析など、最終段階の運用管理作業を提供する必要があるかもしれません。

大規模モデルの高性能コンピューティング需要が常態化する中、クラウドサービスから派生したコンピューティングパワーサービスが急速に一般の視野に入ってきて、独自の産業チェーンとビジネスモデルを形成しました。ただし、コンピューティングパワー産業が大規模モデルによって爆発的に成長した初期には、高性能GPUが不足し、コンピューティングコストが高騰し、チップの争奪戦がこの時代の独特な風景を形成しました。

関係者はコメントしています:"現在、競争はサプライチェーンの中で誰がGPUカードを獲得できるかです。NVIDIAは現在、業界全体の王者であり、すべての市場を支配しています。これが現状です。"供給が需要に追いつかない中で、誰がGPUカードを獲得できるかが、ビジネスを提供できるかを決定します。

しかし、すべての人がGPUカードを奪い合っているわけではなく、供給不足は一時的なものであり、問題は最終的に解決されるだろう。"長期的な研究者は実際には急いで購入する必要はなく、通常通り待つことができる。なぜなら、彼らは倒産しないからだ。現在、GPUカードを本当に奪い合っているのは主に一部のスタートアップ企業であり、彼らは来年まで生き残ることを確保する必要がある。"と上記の人物は述べた。

多くの不確実性の中で、コンピューティングパワーがサービスとして確定的なトレンドになることは明らかです。コンピューティングパワーサービスプロバイダーは、事前に備え、大規模モデルが理性的に戻り、市場の風向きが迅速に変わる際に備える必要があります。

原文表示
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • 報酬
  • 4
  • 共有
コメント
0/400
FlashLoanPrincevip
· 07-13 10:09
200万は少ない方だ、金を燃やしているね
原文表示返信0
FromMinerToFarmervip
· 07-13 10:08
二百万円はどう考えているの? 金を燃やすの?
原文表示返信0
GasFeePhobiavip
· 07-13 10:06
喪炉の爆破で鉱山が崩れ、飢え死にする。
原文表示返信0
EntryPositionAnalystvip
· 07-13 10:02
本当にこんなに内巻きになってお金を使うのか。
原文表示返信0
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)