Bilgi İşlem Gücü hizmetleri yeni bir iş modeli haline geldi, büyük model "dan" ateşi sonrası nasıl dönüşüm sağlanır?
Son günlerde, dünya çapında 40 yıllık hava durumu verilerini kullanarak, yaklaşık 2 ay süren bir ön eğitim gerçekleştirilmiş ve milyar seviyesinde parametreye sahip büyük bir meteoroloji modeli ortaya çıkmıştır. Bu, Tsinghua Üniversitesi'nden 3 yıl önce mezun olan bir gencin büyük modeli eğitme deneyimidir.
Maliyet açısından bakıldığında, saat başına 7.8 yuan/grafik işlemci (GPU) hesaplandığında, bu hava durumu büyük modelinin eğitim maliyeti 2 milyon yuan'ı aşabilir. Eğer eğitilen model genel bir büyük model ise, maliyet yüz kat artabilir.
Verilere göre, Çin'de şu anda 100'den fazla 10 milyar parametre ölçeğinde büyük model bulunmaktadır. Ancak, sektörün akın ettiği büyük model "çözümler" yüksek kaliteli GPU kıtlığı ile karşı karşıya. Bilgi İşlem Gücü maliyetleri yüksek kalmaya devam ediyor, bilgi işlem gücü ve sermaye eksikliği, sektördeki en somut sorun haline geldi.
Yüksek Performanslı GPU Kıtlığı Durumu
"Gerçekten çok eksik, ama yapacak bir şeyimiz de yok." Bir büyük şirketin üst düzey yöneticisi, GPU kıtlığı sorununa böyle yanıt verdi.
Bu, sektörde kabul görmüş bir zorluk haline gelmiş gibi görünüyor. Zirve dönemlerinde bir NVIDIA A100'ün fiyatı 20-30 bin yuan'a yükseldi, tek bir A100 sunucusunun aylık kirası da 5-7 bin yuan'a fırladı. Yine de, yüksek fiyatlar bile çip almayı garanti etmiyor; bazı bilgi işlem gücü sağlayıcıları, tedarikçi sözleşmesinin ihlal edilmesi gibi nadir durumlarla bile karşılaşabiliyor.
Bir bulut bilişim sektörü yöneticisi de şunları belirtti: "Bilgi İşlem Gücü eksikliği gerçekten var. Birçok müşteri yüksek kaliteli GPU kaynakları istiyor, ancak şu anda geniş pazar talebini tam olarak karşılayamıyoruz."
Kısa vadede, yüksek kaliteli GPU kıtlığı sektör genelinde zor çözülecek. Büyük model patlaması, piyasalardaki bilgi işlem gücü talebinin hızlı bir şekilde artmasına neden oldu, ancak arz artış hızı çok geride kaldı. Uzun vadede, bilgi işlem gücü arzının kesinlikle satıcı pazarından alıcı pazarına geçmesi gerekecek, ancak bu sürecin ne kadar süreceği hala belirsiz.
Her şirket, elinde ne kadar Nvidia GPU bulundurduğunu hesaplayarak pazar payını belirliyor. Bilgili kişiler, eğer elinde yaklaşık 10.000 kart varsa ve pazar toplamı 100.000 kart ise, o zaman pazar payı %10'dur. "Yıl sonuna kadar elinde 40.000 karta ulaşabilir, eğer pazar toplamı 200.000 kart ise, o zaman %20'lik bir pazar payına sahip olabilir."
Bir tarafta GPU kartı bulamamak, diğer tarafta ise büyük model eğitiminin sektörde tanıtıldığı kadar kolay bir başlangıç olmadığı gerçeği var. Önceki bölümde bahsedilen meteoroloji büyük model eğitim maliyeti 2 milyon yuanı aşabilir, ancak dikkat edilmesi gereken, bunun genel büyük model temelinde eğitim alınan dikey alan modelinin maliyeti olduğu ve parametre ölçeğinin yüz milyon seviyesinde olduğudur. Eğer on milyar veya daha büyük ölçekli genel bir büyük model eğitilmek isteniyorsa, maliyet on kat, yüz kat artabilir.
Bir teknoloji şirketinin üst düzey yöneticisi şunları açıkladı: "Şu anda en büyük yatırım ölçeği model eğitimi, on milyarlarca sermaye yatırımı olmadan büyük modelleri sürdürülebilir şekilde büyütmek zor."
Bir girişimci, mevcut büyük model rekabet ortamını şu şekilde tanımladı: "Hızlı koşmak için, en azından fonlar tükenmeden önce bir sonuç elde etmek gerekiyor ki bir sonraki 'finansmanı' alabilelim. Eğer yüzlerce milyar veya binlerce milyar destek yoksa, bu yolda ilerlemek oldukça zor."
Bu durum altında, sektörde genel olarak büyük model pazarındaki rekabetle birlikte, pazarın da coşkudan rasyonelliğe geçeceği, işletmelerin de beklentilere bağlı olarak maliyetleri kontrol edeceği ve stratejileri ayarlayacağı düşünülmektedir.
Bilgi İşlem Gücü Kıtlığına Karşı Alınan Olumlu Önlemler
Koşul olmadan da koşul yaratmak - bu, çoğu büyük model katılımcısının zihniyeti gibi görünüyor. Her şirket, mevcut olan sorunlara karşı bir çözüm arayışında.
Yüksek kaliteli GPU çiplerinin kıtlığı nedeniyle ve Çin pazarında mevcut olan GPU'lar en son nesil olmadığı için, performans genellikle daha düşüktür, bu nedenle şirketlerin büyük modelleri eğitmek için daha uzun zamana ihtiyacı vardır. Bu şirketler ayrıca bilgi işlem gücü eksikliğini telafi etmek için yenilikçi yöntemler aramaktadır.
Bunlardan biri, eğitim verimliliğini artırmak için daha yüksek kaliteli veriler kullanarak eğitim yapmaktır. Yakın zamanda yayımlanan bir sektör raporu, veri kalitesine yapay etiketleme ve onaylama dahil edilmesini önerdi; ham verilerden belirli bir oran seçilerek etiketlenmiş yüksek kaliteli veri setleri oluşturulması gerektiğini belirtti.
Yüksek kaliteli verilerle büyük model maliyetlerini düşürmenin yanı sıra, altyapı yeteneklerini artırmak, 1000 kalori üzerindeki istikrarlı çalışmayı iki hafta boyunca kesintisiz sağlamak da teknik zorluklar ve optimizasyon yönlerinden biridir.
Bir bulut hizmeti sağlayıcısı yöneticisi şunları söyledi: "Bir bulut hizmeti sağlayıcısı olarak, müşterilere istikrarlı ve güvenilir bir altyapı kurmalarına yardımcı olacağız. Çünkü GPU sunucularının stabilitesi düşük, herhangi bir arıza eğitim kesintilerine neden oluyor ve toplam eğitim süresini artırıyor. Yüksek performanslı hesaplama kümeleri, müşterilere daha istikrarlı hizmetler sunabilir, eğitim sürelerini kısaltabilir ve bazı Bilgi İşlem Gücü sorunlarını çözebilir."
Aynı zamanda, bilgi işlem gücü kartı kaynaklarının dağıtımı, hizmet sağlayıcıların teknik yeteneklerini de test etmektedir. Bir internet çözüm yöneticisi şöyle dedi: "Bilgi işlem gücü kartı kaynaklarına sahip olmak bir yön, ancak kart kaynaklarını nasıl dağıtıp gerçekten kullanıma sokacağınız, daha zorlu bir çekirdek yetenek ve mühendislik yeteneğidir. Bir kartı birden fazla küçük karta bölmek, dağıtılmış ince dağıtımı sağlamak, bilgi işlem maliyetlerini daha da düşürebilir."
Ağ, büyük model eğitim hızı ve verimliliğini de etkilemektedir. Büyük model eğitimi genellikle binlerce GPU kartı gerektirir, yüzlerce GPU sunucusunu bağlamak için ağ hızı çok yüksek gereksinimlere sahiptir, ağ tıkanıklığı eğitim hızı ve verimliliğini ciddi şekilde etkileyebilir.
Bazı üreticiler, maliyetleri azaltmanın bir yolu olarak bulut bilişim mimarisinden süper bilgisayar mimarisine geçiş yapmayı tercih etmektedir. Kullanıcı ihtiyaçlarını karşılarken, yüksek hacimli hesaplama görevleri ve paralel görev senaryoları için süper bilgisayar bulutunun fiyatı, bulut süper bilgisayarının fiyatının yaklaşık yarısıdır. Performans optimizasyonu ile kaynak kullanım oranı %30'dan %60'a çıkarılabilir.
Ayrıca, bazı firmalar, kıt olan NVIDIA GPU'ları yerine yerli platformlar kullanarak büyük model eğitimi ve çıkarımında bulunmayı tercih ediyor. Bir şirketin üst düzey yöneticisi, Huawei ile ortaklaşa geliştirdikleri entegre sistemin yerli platformda eğitim ve çıkarım yapabileceğini, Huawei GPU'sunun performansının artık NVIDIA ile rekabet edebileceğini belirtti.
Yukarıda belirtilen yöntemlerin her biri büyük bir projedir, genellikle şirketlerin kendi veri merkezlerini kurarak talepleri karşılaması zordur, birçok algoritma ekibi profesyonel bilgi işlem gücü sağlayıcılarından destek almayı tercih etmektedir. Paralel depolama da büyük bir maliyet ve teknik zorluktur, ayrıca IDC kullanılabilir alanı elektrik maliyeti, yazılım platformu maliyeti, personel maliyeti gibi işletme maliyetlerini de dikkate almak gerekmektedir.
Bin kalori seviyesindeki GPU kümeleri, ölçek etkisini gerçekleştirebilir; bilgi işlem gücü sağlayıcısını seçmek, marjinal maliyetin sıfıra yaklaşması anlamına gelir.
Bir akademisyen, AIGC'nin yapay zeka endüstrisinde bir patlama getirdiğini, ancak akıllı teknolojilerin ölçeklenebilir uygulamalarının tipik bir uzun kuyruk sorunuyla karşı karşıya olduğunu belirtti. Güçlü AI yeteneklerine sahip olan departmanlar, araştırma enstitüleri ve büyük ve orta ölçekli işletmeler, bilgi işlem gücü talebinin yaklaşık %20'sini oluşturmaktadır; diğer %80'i ise küçük ve orta ölçekli işletmelerdir. Bu tür kuruluşlar ölçek ve bütçe kısıtlamalarına tabi oldukları için genellikle bilgi işlem gücü kaynaklarına erişmekte zorlanmakta veya yüksek fiyatlarla sınırlı kalmakta, bu da AI çağında gelişim avantajı elde etmelerini zorlaştırmaktadır.
Bu nedenle, akıllı teknolojilerin ölçeklenerek uygulanabilmesi ve yapay zeka endüstrisinin hem "iyi anılması" hem de "yüksek talep görmesi" için, orta ve küçük ölçekli işletmelerin de kolay ve düşük maliyetle bilgi işlem gücünden yararlanabilmesi amacıyla bol miktarda ucuz ve kullanımı kolay akıllı bilgi işlem gücüne ihtiyaç vardır.
Büyük modellerin bilgi işlem gücüne olan acil ihtiyacı ve bilgi işlem gücü uygulama sürecinde çözülmesi gereken çeşitli zorluklar, yeni bir değişikliği yansıtmaktadır: Bilgi işlem gücü, pazar talebi ve teknoloji iterasyonu sürecinde yeni bir hizmet modeli haline gelmiştir.
Yeni Bilgi İşlem Gücü Hizmet Modelini Keşfet
Bizim kapıştığımız büyük model Bilgi İşlem Gücü tam olarak nedir? Bu sorunun cevabını vermek için önce Bilgi İşlem Gücü hizmetlerinden bahsetmek gerekir.
Bilgi İşlem Gücü, genel bilgi işlem gücü, akıllı bilgi işlem gücü ve süper bilgi işlem gücü olarak üçe ayrılır ve bu bilgi işlem gücü bir hizmet haline gelir; bu, piyasa ve teknoloji tarafından iki yönlü bir şekilde yönlendirilen bir sonuçtur.
Bir sektör beyaz kitabı, bilgi işlem gücü hizmetlerini şu şekilde tanımlar: çeşitlilik bilgi işlem gücüne dayalı, bilgi işlem ağı ile bağlantılı ve etkili bilgi işlem gücü sağlamayı hedefleyen bilgi işlem endüstrisinin yeni bir alanı.
Bilgi İşlem Gücü hizmetinin özünde, yeni hesaplama teknolojileri aracılığıyla heterojen bilgi işlem gücünün birleşik çıktısının sağlanması ve bulut, büyük veri, AI gibi teknolojilerle kesişimsel entegrasyon yer almaktadır. Bilgi İşlem Gücü hizmeti yalnızca bilgi işlem gücünü değil, aynı zamanda bilgi işlem gücü, depolama, ağ gibi kaynakların birleşik paketlemesini de içerir ve hizmet biçiminde ( gibi API ) ile bilgi işlem gücünün teslimini tamamlar.
Bunu anladığınızda, Nvidia çiplerini kapışan büyük bir kısmın bilgi işlem gücü hizmet sağlayıcıları, yani bilgi işlem üreticileri olduğunu göreceksiniz. Gerçekten de bilgi işlem API'sini ön uçta çağıran endüstri kullanıcıları, yalnızca ilgili bilgi işlem gücü talebinde bulunmak zorundadır.
Edinilen bilgilere göre, yazılım açısından, tüm yazılım etkileşimlerinden kaynaklanan büyük model kullanımı üç şekilde sınıflandırılmaktadır: birincisi büyük model API çağrılarıdır, her firma fiyatlandırma yapmaktadır ve fiyata göre hesaplanmaktadır; ikincisi kendi küçük modellerini kullanmak, bilgi işlem gücü satın almak ve hatta kendi başlarına dağıtım yapmaktır; üçüncüsü büyük model sağlayıcılarının bulut sağlayıcılarıyla işbirliği yapmasıdır, yani özel bulut, aylık ödeme ile yapılmaktadır. Bir ofis yazılım şirketinin üst düzey yöneticisi, öncelikle API çağrılarını kullandıklarını ve iç küçük modellerinin ise kendi bilgi işlem gücü planlama platformunu inşa ettiğini belirtmiştir.
Yani, hesaplama gücü endüstri zinciri yapısında, yukarı akış şirketleri esas olarak genel hesaplama gücü, akıllı hesaplama gücü, süper hesaplama gücü, depolama ve ağ gibi hesaplama hizmeti destek kaynaklarının tedarikini tamamlar. Örneğin, büyük model hesaplama gücü rekabetinde, Nvidia yukarı akış hesaplama temeli kaynak tedarikçisidir ve sektöre çip temin etmektedir.
Orta seviye işletmeler, bulut hizmet sağlayıcıları ve yeni nesil Bilgi İşlem Gücü hizmet sağlayıcıları ile öne çıkmaktadır. Bu işletmeler, Bilgi İşlem Gücü üretimini gerçekleştirmek için Bilgi İşlem Gücü düzenlemesi, planlaması ve ticaret teknolojilerini kullanır ve Bilgi İşlem Gücü tedarikini API gibi yollarla tamamlar. Orta seviye Bilgi İşlem Gücü hizmeti sunan işletmelerin hizmet yetenekleri ne kadar güçlü olursa, uygulama tarafı için engel o kadar düşük olur ve bu, Bilgi İşlem Gücü'nün yaygın ve evrensel gelişimine daha fazla katkıda bulunur.
Aşağı akıştaki işletmeler, bilgi işlem gücü hizmetleri tarafından sağlanan hesaplama kapasitesine dayanarak katma değer hizmetleri üreten endüstri zinciri rolündedir, örneğin sektör kullanıcıları gibi. Bu kullanıcılar sadece ihtiyaçlarını belirtmekle yükümlüdür, bilgi işlem gücü üreticileri ise ihtiyaçlara göre ilgili bilgi işlem gücünü yapılandırarak kullanıcıların verdiği "bilgi işlem gücü görevlerini" tamamlar.
Bu, başlangıçta kendi sunucularını satın alarak büyük model bilgi işlem gücü ortamı kurmaktan daha maliyet ve teknik avantajlar sunuyor.
Bilgi İşlem Gücü Ticari Modeli İterasyonu
Örneğin, erken dönemde piyasaya sürülen genel bir büyük model, kamuya açık bilgilere göre, ülke içindeki birçok önde gelen AI Bilgi İşlem Gücü hizmet sağlayıcısını kullanmıştır. Konuyla ilgili kişiler, teorik olarak tüm önde gelen Bilgi İşlem Gücü hizmet sağlayıcılarını/bulut hizmet sağlayıcılarını kullanmış olabileceğini belirtmiştir.
Talep edilen hizmetler, iki ana modele dayanan mevcut bilgi işlem gücü hizmetleri olan ölçüye göre faturalama ve yıllık/aylık faturalama şeklindedir: Birincisi, belirli bilgi işlem gücü hizmeti örneklerini seçmektir. Örneğin, bir bulut hizmet sağlayıcısı, NVIDIA A800, A100, V100 gibi üç ana akıllı kart ile donatılmış yüksek performanslı GPU sunucuları sunmaktadır; İkincisi, uygun MaaS hizmet platformunu seçmektir; bu platformda büyük modellerin sektör bazında ince ayarını yapabilirsiniz.
Mevcut sektörde, bilgi işlem gücü hizmetlerinin "hesaplama ve ağın entegrasyonu"nu ilerletme çabaları sürüyor. Hesaplama görevleri, bilgi işlem ağı kaynak durumları gibi bilgilerin kapsamlı değerlendirmesi yoluyla, farklı mimariler, bölgeler ve hizmet sağlayıcılar arasında planlama yapabilen bilgi işlem ağı düzenleme planları oluşturulmakta ve ilgili kaynak dağıtımı tamamlanmaktadır. Örneğin, sadece önceden fon sağlamak yeterlidir; böylece bilgi işlem ağı içindeki bölümlerde serbestçe çağrı yapılabilir, uygulama özelliklerine göre en uygun, en hızlı veya en maliyet etkin bölümler seçilebilir ve süreye göre ücretlendirilip önceden sağlanan fonlardan kesinti yapılabilir.
Bulut hizmet sağlayıcıları da aynı şekilde, bilgi işlem gücü hizmeti bulut hizmetinin benzersiz bir ürünü olarak, onları hızla bilgi işlem endüstri zincirine katılmalarını sağladı.
Çin Sanayi ve Bilgi Teknolojileri Bakanlığı verilerine göre, 2022 yılında Çin'in toplam bilgi işlem gücü 180 EFLOPS'a ulaşarak dünya genelinde ikinci sırada yer aldı. 2022 yılı itibarıyla, Çin'in bilgi işlem endüstrisinin ölçüsü 1.8 trilyon yuan'a ulaşmıştır. Büyük model bilgi işlem gücü, bilgi işlem endüstrisinin gelişimini büyük ölçüde hızlandırmıştır.
Bazı görüşler, mevcut bilgi işlem gücü hizmetlerinin aslında yeni bir "elektrik satışı" modeli olduğunu öne sürüyor. Sadece farklı iş bölümü nedeniyle, bazı bilgi işlem gücü sağlayıcıları, kullanıcılar için daha fazla sistem performansı ayarı, yazılım kurulumu, büyük ölçekli işlerin çalıştırılması ve çalışma özelliklerinin analizi gibi son kilometre operasyon işleri sağlamaları gerekebilir.
Büyük model yüksek performans hesaplama talebinin norm haline gelmesiyle, bulut hizmetlerinden doğan bilgi işlem gücü hizmetleri hızla geniş kitlelerin gözünde yer almaya başladı ve benzersiz bir endüstri zinciri ve iş modeli oluşturdu. Ancak bilgi işlem endüstrisi büyük model nedeniyle patlak verdiğinde, yüksek kaliteli GPU eksikliği, bilgi işlem maliyetinin yüksekliği ve çip kapma yarışı bu dönemin benzersiz manzarasını oluşturdu.
Bir kaynak, "Şu anda rekabet, tedarik zincirinde GPU kartını kim alabiliyor? NVIDIA, şu anda tüm sektörün kralı, tüm pazarı kontrol ediyor, bu durum böyle." dedi. Talebin arzı aştığı bir ortamda, GPU kartını kim alabiliyorsa, o işini teslim edebilir.
Ama herkes GPU kartlarını kapışmıyor, çünkü kıtlık geçici ve sorun nihayetinde çözülecek. "Uzun vadeli araştırmacılar aslında acele etmiyor, normal bir şekilde bekleyebilirler, çünkü batmazlar. Şu anda gerçekten GPU kartlarını kapışanlar esasen birkaç girişimci, hayatta kalmayı sağlamaları gerekiyor." Bu kişiyi ifade etti.
Birçok belirsizlik içinde, Bilgi İşlem Gücü bir hizmet haline gelmesi kesin bir trenddir, Bilgi İşlem Gücü hizmet sağlayıcıları hazırlıklı olmalı, büyük modellerin rasyonelliğe geri dönmesi ve piyasa yönünün hızlı değişimi için hazırlık yapmalıdır.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
13 Likes
Reward
13
4
Share
Comment
0/400
FlashLoanPrince
· 22h ago
İki milyon az sayılır, para yakmak bu.
View OriginalReply0
FromMinerToFarmer
· 22h ago
İki milyon ne düşünüyorsun, para yakıyorlar.
View OriginalReply0
GasFeePhobia
· 22h ago
Kayıp ocak, açlıktan öldüm.
View OriginalReply0
EntryPositionAnalyst
· 22h ago
Gerçekten bu kadar içe kapanıp para harcıyor musun?
Bilgi İşlem Gücü kıtlığındaki büyük model iş fırsatları: Yeni nesil bilgi işlem hizmeti modeli yükseliyor
Bilgi İşlem Gücü hizmetleri yeni bir iş modeli haline geldi, büyük model "dan" ateşi sonrası nasıl dönüşüm sağlanır?
Son günlerde, dünya çapında 40 yıllık hava durumu verilerini kullanarak, yaklaşık 2 ay süren bir ön eğitim gerçekleştirilmiş ve milyar seviyesinde parametreye sahip büyük bir meteoroloji modeli ortaya çıkmıştır. Bu, Tsinghua Üniversitesi'nden 3 yıl önce mezun olan bir gencin büyük modeli eğitme deneyimidir.
Maliyet açısından bakıldığında, saat başına 7.8 yuan/grafik işlemci (GPU) hesaplandığında, bu hava durumu büyük modelinin eğitim maliyeti 2 milyon yuan'ı aşabilir. Eğer eğitilen model genel bir büyük model ise, maliyet yüz kat artabilir.
Verilere göre, Çin'de şu anda 100'den fazla 10 milyar parametre ölçeğinde büyük model bulunmaktadır. Ancak, sektörün akın ettiği büyük model "çözümler" yüksek kaliteli GPU kıtlığı ile karşı karşıya. Bilgi İşlem Gücü maliyetleri yüksek kalmaya devam ediyor, bilgi işlem gücü ve sermaye eksikliği, sektördeki en somut sorun haline geldi.
Yüksek Performanslı GPU Kıtlığı Durumu
"Gerçekten çok eksik, ama yapacak bir şeyimiz de yok." Bir büyük şirketin üst düzey yöneticisi, GPU kıtlığı sorununa böyle yanıt verdi.
Bu, sektörde kabul görmüş bir zorluk haline gelmiş gibi görünüyor. Zirve dönemlerinde bir NVIDIA A100'ün fiyatı 20-30 bin yuan'a yükseldi, tek bir A100 sunucusunun aylık kirası da 5-7 bin yuan'a fırladı. Yine de, yüksek fiyatlar bile çip almayı garanti etmiyor; bazı bilgi işlem gücü sağlayıcıları, tedarikçi sözleşmesinin ihlal edilmesi gibi nadir durumlarla bile karşılaşabiliyor.
Bir bulut bilişim sektörü yöneticisi de şunları belirtti: "Bilgi İşlem Gücü eksikliği gerçekten var. Birçok müşteri yüksek kaliteli GPU kaynakları istiyor, ancak şu anda geniş pazar talebini tam olarak karşılayamıyoruz."
Kısa vadede, yüksek kaliteli GPU kıtlığı sektör genelinde zor çözülecek. Büyük model patlaması, piyasalardaki bilgi işlem gücü talebinin hızlı bir şekilde artmasına neden oldu, ancak arz artış hızı çok geride kaldı. Uzun vadede, bilgi işlem gücü arzının kesinlikle satıcı pazarından alıcı pazarına geçmesi gerekecek, ancak bu sürecin ne kadar süreceği hala belirsiz.
Her şirket, elinde ne kadar Nvidia GPU bulundurduğunu hesaplayarak pazar payını belirliyor. Bilgili kişiler, eğer elinde yaklaşık 10.000 kart varsa ve pazar toplamı 100.000 kart ise, o zaman pazar payı %10'dur. "Yıl sonuna kadar elinde 40.000 karta ulaşabilir, eğer pazar toplamı 200.000 kart ise, o zaman %20'lik bir pazar payına sahip olabilir."
Bir tarafta GPU kartı bulamamak, diğer tarafta ise büyük model eğitiminin sektörde tanıtıldığı kadar kolay bir başlangıç olmadığı gerçeği var. Önceki bölümde bahsedilen meteoroloji büyük model eğitim maliyeti 2 milyon yuanı aşabilir, ancak dikkat edilmesi gereken, bunun genel büyük model temelinde eğitim alınan dikey alan modelinin maliyeti olduğu ve parametre ölçeğinin yüz milyon seviyesinde olduğudur. Eğer on milyar veya daha büyük ölçekli genel bir büyük model eğitilmek isteniyorsa, maliyet on kat, yüz kat artabilir.
Bir teknoloji şirketinin üst düzey yöneticisi şunları açıkladı: "Şu anda en büyük yatırım ölçeği model eğitimi, on milyarlarca sermaye yatırımı olmadan büyük modelleri sürdürülebilir şekilde büyütmek zor."
Bir girişimci, mevcut büyük model rekabet ortamını şu şekilde tanımladı: "Hızlı koşmak için, en azından fonlar tükenmeden önce bir sonuç elde etmek gerekiyor ki bir sonraki 'finansmanı' alabilelim. Eğer yüzlerce milyar veya binlerce milyar destek yoksa, bu yolda ilerlemek oldukça zor."
Bu durum altında, sektörde genel olarak büyük model pazarındaki rekabetle birlikte, pazarın da coşkudan rasyonelliğe geçeceği, işletmelerin de beklentilere bağlı olarak maliyetleri kontrol edeceği ve stratejileri ayarlayacağı düşünülmektedir.
Bilgi İşlem Gücü Kıtlığına Karşı Alınan Olumlu Önlemler
Koşul olmadan da koşul yaratmak - bu, çoğu büyük model katılımcısının zihniyeti gibi görünüyor. Her şirket, mevcut olan sorunlara karşı bir çözüm arayışında.
Yüksek kaliteli GPU çiplerinin kıtlığı nedeniyle ve Çin pazarında mevcut olan GPU'lar en son nesil olmadığı için, performans genellikle daha düşüktür, bu nedenle şirketlerin büyük modelleri eğitmek için daha uzun zamana ihtiyacı vardır. Bu şirketler ayrıca bilgi işlem gücü eksikliğini telafi etmek için yenilikçi yöntemler aramaktadır.
Bunlardan biri, eğitim verimliliğini artırmak için daha yüksek kaliteli veriler kullanarak eğitim yapmaktır. Yakın zamanda yayımlanan bir sektör raporu, veri kalitesine yapay etiketleme ve onaylama dahil edilmesini önerdi; ham verilerden belirli bir oran seçilerek etiketlenmiş yüksek kaliteli veri setleri oluşturulması gerektiğini belirtti.
Yüksek kaliteli verilerle büyük model maliyetlerini düşürmenin yanı sıra, altyapı yeteneklerini artırmak, 1000 kalori üzerindeki istikrarlı çalışmayı iki hafta boyunca kesintisiz sağlamak da teknik zorluklar ve optimizasyon yönlerinden biridir.
Bir bulut hizmeti sağlayıcısı yöneticisi şunları söyledi: "Bir bulut hizmeti sağlayıcısı olarak, müşterilere istikrarlı ve güvenilir bir altyapı kurmalarına yardımcı olacağız. Çünkü GPU sunucularının stabilitesi düşük, herhangi bir arıza eğitim kesintilerine neden oluyor ve toplam eğitim süresini artırıyor. Yüksek performanslı hesaplama kümeleri, müşterilere daha istikrarlı hizmetler sunabilir, eğitim sürelerini kısaltabilir ve bazı Bilgi İşlem Gücü sorunlarını çözebilir."
Aynı zamanda, bilgi işlem gücü kartı kaynaklarının dağıtımı, hizmet sağlayıcıların teknik yeteneklerini de test etmektedir. Bir internet çözüm yöneticisi şöyle dedi: "Bilgi işlem gücü kartı kaynaklarına sahip olmak bir yön, ancak kart kaynaklarını nasıl dağıtıp gerçekten kullanıma sokacağınız, daha zorlu bir çekirdek yetenek ve mühendislik yeteneğidir. Bir kartı birden fazla küçük karta bölmek, dağıtılmış ince dağıtımı sağlamak, bilgi işlem maliyetlerini daha da düşürebilir."
Ağ, büyük model eğitim hızı ve verimliliğini de etkilemektedir. Büyük model eğitimi genellikle binlerce GPU kartı gerektirir, yüzlerce GPU sunucusunu bağlamak için ağ hızı çok yüksek gereksinimlere sahiptir, ağ tıkanıklığı eğitim hızı ve verimliliğini ciddi şekilde etkileyebilir.
Bazı üreticiler, maliyetleri azaltmanın bir yolu olarak bulut bilişim mimarisinden süper bilgisayar mimarisine geçiş yapmayı tercih etmektedir. Kullanıcı ihtiyaçlarını karşılarken, yüksek hacimli hesaplama görevleri ve paralel görev senaryoları için süper bilgisayar bulutunun fiyatı, bulut süper bilgisayarının fiyatının yaklaşık yarısıdır. Performans optimizasyonu ile kaynak kullanım oranı %30'dan %60'a çıkarılabilir.
Ayrıca, bazı firmalar, kıt olan NVIDIA GPU'ları yerine yerli platformlar kullanarak büyük model eğitimi ve çıkarımında bulunmayı tercih ediyor. Bir şirketin üst düzey yöneticisi, Huawei ile ortaklaşa geliştirdikleri entegre sistemin yerli platformda eğitim ve çıkarım yapabileceğini, Huawei GPU'sunun performansının artık NVIDIA ile rekabet edebileceğini belirtti.
Yukarıda belirtilen yöntemlerin her biri büyük bir projedir, genellikle şirketlerin kendi veri merkezlerini kurarak talepleri karşılaması zordur, birçok algoritma ekibi profesyonel bilgi işlem gücü sağlayıcılarından destek almayı tercih etmektedir. Paralel depolama da büyük bir maliyet ve teknik zorluktur, ayrıca IDC kullanılabilir alanı elektrik maliyeti, yazılım platformu maliyeti, personel maliyeti gibi işletme maliyetlerini de dikkate almak gerekmektedir.
Bin kalori seviyesindeki GPU kümeleri, ölçek etkisini gerçekleştirebilir; bilgi işlem gücü sağlayıcısını seçmek, marjinal maliyetin sıfıra yaklaşması anlamına gelir.
Bir akademisyen, AIGC'nin yapay zeka endüstrisinde bir patlama getirdiğini, ancak akıllı teknolojilerin ölçeklenebilir uygulamalarının tipik bir uzun kuyruk sorunuyla karşı karşıya olduğunu belirtti. Güçlü AI yeteneklerine sahip olan departmanlar, araştırma enstitüleri ve büyük ve orta ölçekli işletmeler, bilgi işlem gücü talebinin yaklaşık %20'sini oluşturmaktadır; diğer %80'i ise küçük ve orta ölçekli işletmelerdir. Bu tür kuruluşlar ölçek ve bütçe kısıtlamalarına tabi oldukları için genellikle bilgi işlem gücü kaynaklarına erişmekte zorlanmakta veya yüksek fiyatlarla sınırlı kalmakta, bu da AI çağında gelişim avantajı elde etmelerini zorlaştırmaktadır.
Bu nedenle, akıllı teknolojilerin ölçeklenerek uygulanabilmesi ve yapay zeka endüstrisinin hem "iyi anılması" hem de "yüksek talep görmesi" için, orta ve küçük ölçekli işletmelerin de kolay ve düşük maliyetle bilgi işlem gücünden yararlanabilmesi amacıyla bol miktarda ucuz ve kullanımı kolay akıllı bilgi işlem gücüne ihtiyaç vardır.
Büyük modellerin bilgi işlem gücüne olan acil ihtiyacı ve bilgi işlem gücü uygulama sürecinde çözülmesi gereken çeşitli zorluklar, yeni bir değişikliği yansıtmaktadır: Bilgi işlem gücü, pazar talebi ve teknoloji iterasyonu sürecinde yeni bir hizmet modeli haline gelmiştir.
Yeni Bilgi İşlem Gücü Hizmet Modelini Keşfet
Bizim kapıştığımız büyük model Bilgi İşlem Gücü tam olarak nedir? Bu sorunun cevabını vermek için önce Bilgi İşlem Gücü hizmetlerinden bahsetmek gerekir.
Bilgi İşlem Gücü, genel bilgi işlem gücü, akıllı bilgi işlem gücü ve süper bilgi işlem gücü olarak üçe ayrılır ve bu bilgi işlem gücü bir hizmet haline gelir; bu, piyasa ve teknoloji tarafından iki yönlü bir şekilde yönlendirilen bir sonuçtur.
Bir sektör beyaz kitabı, bilgi işlem gücü hizmetlerini şu şekilde tanımlar: çeşitlilik bilgi işlem gücüne dayalı, bilgi işlem ağı ile bağlantılı ve etkili bilgi işlem gücü sağlamayı hedefleyen bilgi işlem endüstrisinin yeni bir alanı.
Bilgi İşlem Gücü hizmetinin özünde, yeni hesaplama teknolojileri aracılığıyla heterojen bilgi işlem gücünün birleşik çıktısının sağlanması ve bulut, büyük veri, AI gibi teknolojilerle kesişimsel entegrasyon yer almaktadır. Bilgi İşlem Gücü hizmeti yalnızca bilgi işlem gücünü değil, aynı zamanda bilgi işlem gücü, depolama, ağ gibi kaynakların birleşik paketlemesini de içerir ve hizmet biçiminde ( gibi API ) ile bilgi işlem gücünün teslimini tamamlar.
Bunu anladığınızda, Nvidia çiplerini kapışan büyük bir kısmın bilgi işlem gücü hizmet sağlayıcıları, yani bilgi işlem üreticileri olduğunu göreceksiniz. Gerçekten de bilgi işlem API'sini ön uçta çağıran endüstri kullanıcıları, yalnızca ilgili bilgi işlem gücü talebinde bulunmak zorundadır.
Edinilen bilgilere göre, yazılım açısından, tüm yazılım etkileşimlerinden kaynaklanan büyük model kullanımı üç şekilde sınıflandırılmaktadır: birincisi büyük model API çağrılarıdır, her firma fiyatlandırma yapmaktadır ve fiyata göre hesaplanmaktadır; ikincisi kendi küçük modellerini kullanmak, bilgi işlem gücü satın almak ve hatta kendi başlarına dağıtım yapmaktır; üçüncüsü büyük model sağlayıcılarının bulut sağlayıcılarıyla işbirliği yapmasıdır, yani özel bulut, aylık ödeme ile yapılmaktadır. Bir ofis yazılım şirketinin üst düzey yöneticisi, öncelikle API çağrılarını kullandıklarını ve iç küçük modellerinin ise kendi bilgi işlem gücü planlama platformunu inşa ettiğini belirtmiştir.
Yani, hesaplama gücü endüstri zinciri yapısında, yukarı akış şirketleri esas olarak genel hesaplama gücü, akıllı hesaplama gücü, süper hesaplama gücü, depolama ve ağ gibi hesaplama hizmeti destek kaynaklarının tedarikini tamamlar. Örneğin, büyük model hesaplama gücü rekabetinde, Nvidia yukarı akış hesaplama temeli kaynak tedarikçisidir ve sektöre çip temin etmektedir.
Orta seviye işletmeler, bulut hizmet sağlayıcıları ve yeni nesil Bilgi İşlem Gücü hizmet sağlayıcıları ile öne çıkmaktadır. Bu işletmeler, Bilgi İşlem Gücü üretimini gerçekleştirmek için Bilgi İşlem Gücü düzenlemesi, planlaması ve ticaret teknolojilerini kullanır ve Bilgi İşlem Gücü tedarikini API gibi yollarla tamamlar. Orta seviye Bilgi İşlem Gücü hizmeti sunan işletmelerin hizmet yetenekleri ne kadar güçlü olursa, uygulama tarafı için engel o kadar düşük olur ve bu, Bilgi İşlem Gücü'nün yaygın ve evrensel gelişimine daha fazla katkıda bulunur.
Aşağı akıştaki işletmeler, bilgi işlem gücü hizmetleri tarafından sağlanan hesaplama kapasitesine dayanarak katma değer hizmetleri üreten endüstri zinciri rolündedir, örneğin sektör kullanıcıları gibi. Bu kullanıcılar sadece ihtiyaçlarını belirtmekle yükümlüdür, bilgi işlem gücü üreticileri ise ihtiyaçlara göre ilgili bilgi işlem gücünü yapılandırarak kullanıcıların verdiği "bilgi işlem gücü görevlerini" tamamlar.
Bu, başlangıçta kendi sunucularını satın alarak büyük model bilgi işlem gücü ortamı kurmaktan daha maliyet ve teknik avantajlar sunuyor.
Bilgi İşlem Gücü Ticari Modeli İterasyonu
Örneğin, erken dönemde piyasaya sürülen genel bir büyük model, kamuya açık bilgilere göre, ülke içindeki birçok önde gelen AI Bilgi İşlem Gücü hizmet sağlayıcısını kullanmıştır. Konuyla ilgili kişiler, teorik olarak tüm önde gelen Bilgi İşlem Gücü hizmet sağlayıcılarını/bulut hizmet sağlayıcılarını kullanmış olabileceğini belirtmiştir.
Talep edilen hizmetler, iki ana modele dayanan mevcut bilgi işlem gücü hizmetleri olan ölçüye göre faturalama ve yıllık/aylık faturalama şeklindedir: Birincisi, belirli bilgi işlem gücü hizmeti örneklerini seçmektir. Örneğin, bir bulut hizmet sağlayıcısı, NVIDIA A800, A100, V100 gibi üç ana akıllı kart ile donatılmış yüksek performanslı GPU sunucuları sunmaktadır; İkincisi, uygun MaaS hizmet platformunu seçmektir; bu platformda büyük modellerin sektör bazında ince ayarını yapabilirsiniz.
Mevcut sektörde, bilgi işlem gücü hizmetlerinin "hesaplama ve ağın entegrasyonu"nu ilerletme çabaları sürüyor. Hesaplama görevleri, bilgi işlem ağı kaynak durumları gibi bilgilerin kapsamlı değerlendirmesi yoluyla, farklı mimariler, bölgeler ve hizmet sağlayıcılar arasında planlama yapabilen bilgi işlem ağı düzenleme planları oluşturulmakta ve ilgili kaynak dağıtımı tamamlanmaktadır. Örneğin, sadece önceden fon sağlamak yeterlidir; böylece bilgi işlem ağı içindeki bölümlerde serbestçe çağrı yapılabilir, uygulama özelliklerine göre en uygun, en hızlı veya en maliyet etkin bölümler seçilebilir ve süreye göre ücretlendirilip önceden sağlanan fonlardan kesinti yapılabilir.
Bulut hizmet sağlayıcıları da aynı şekilde, bilgi işlem gücü hizmeti bulut hizmetinin benzersiz bir ürünü olarak, onları hızla bilgi işlem endüstri zincirine katılmalarını sağladı.
Çin Sanayi ve Bilgi Teknolojileri Bakanlığı verilerine göre, 2022 yılında Çin'in toplam bilgi işlem gücü 180 EFLOPS'a ulaşarak dünya genelinde ikinci sırada yer aldı. 2022 yılı itibarıyla, Çin'in bilgi işlem endüstrisinin ölçüsü 1.8 trilyon yuan'a ulaşmıştır. Büyük model bilgi işlem gücü, bilgi işlem endüstrisinin gelişimini büyük ölçüde hızlandırmıştır.
Bazı görüşler, mevcut bilgi işlem gücü hizmetlerinin aslında yeni bir "elektrik satışı" modeli olduğunu öne sürüyor. Sadece farklı iş bölümü nedeniyle, bazı bilgi işlem gücü sağlayıcıları, kullanıcılar için daha fazla sistem performansı ayarı, yazılım kurulumu, büyük ölçekli işlerin çalıştırılması ve çalışma özelliklerinin analizi gibi son kilometre operasyon işleri sağlamaları gerekebilir.
Büyük model yüksek performans hesaplama talebinin norm haline gelmesiyle, bulut hizmetlerinden doğan bilgi işlem gücü hizmetleri hızla geniş kitlelerin gözünde yer almaya başladı ve benzersiz bir endüstri zinciri ve iş modeli oluşturdu. Ancak bilgi işlem endüstrisi büyük model nedeniyle patlak verdiğinde, yüksek kaliteli GPU eksikliği, bilgi işlem maliyetinin yüksekliği ve çip kapma yarışı bu dönemin benzersiz manzarasını oluşturdu.
Bir kaynak, "Şu anda rekabet, tedarik zincirinde GPU kartını kim alabiliyor? NVIDIA, şu anda tüm sektörün kralı, tüm pazarı kontrol ediyor, bu durum böyle." dedi. Talebin arzı aştığı bir ortamda, GPU kartını kim alabiliyorsa, o işini teslim edebilir.
Ama herkes GPU kartlarını kapışmıyor, çünkü kıtlık geçici ve sorun nihayetinde çözülecek. "Uzun vadeli araştırmacılar aslında acele etmiyor, normal bir şekilde bekleyebilirler, çünkü batmazlar. Şu anda gerçekten GPU kartlarını kapışanlar esasen birkaç girişimci, hayatta kalmayı sağlamaları gerekiyor." Bu kişiyi ifade etti.
Birçok belirsizlik içinde, Bilgi İşlem Gücü bir hizmet haline gelmesi kesin bir trenddir, Bilgi İşlem Gücü hizmet sağlayıcıları hazırlıklı olmalı, büyük modellerin rasyonelliğe geri dönmesi ve piyasa yönünün hızlı değişimi için hazırlık yapmalıdır.