Khả năng tính toán dịch vụ trở thành mô hình kinh doanh mới, sau cơn sốt "luyện đan" của mô hình lớn thì làm thế nào để chuyển hướng?
Gần đây, sử dụng dữ liệu thời tiết toàn cầu trong 40 năm, với 200 thẻ GPU được sử dụng trong khoảng 2 tháng để huấn luyện trước, một mô hình khí tượng lớn với hàng triệu tham số đã ra đời. Đây là trải nghiệm của một người trẻ tuổi tốt nghiệp từ Đại học Thanh Hoa 3 năm trước trong việc huấn luyện mô hình lớn.
Xét từ góc độ chi phí, với mức tính toán 7,8 nhân dân tệ/giờ/chiếc GPU, chi phí đào tạo của mô hình khí tượng lớn này có thể vượt quá 2 triệu nhân dân tệ. Còn nếu đào tạo là mô hình lớn tổng quát, chi phí có thể tăng gấp trăm lần.
Dữ liệu cho thấy, Trung Quốc hiện đã có hơn 100 mô hình lớn với quy mô 10 tỷ tham số. Tuy nhiên, ngành công nghiệp đang đổ xô vào việc "luyện đan" các mô hình lớn lại đang phải đối mặt với tình trạng thiếu hụt GPU cao cấp. Khả năng tính toán vẫn ở mức cao, thiếu hụt khả năng tính toán và vốn đã trở thành vấn đề rõ ràng nhất mà ngành công nghiệp phải đối mặt.
Tình trạng thiếu GPU cao cấp
"Quả thật là thiếu, nhưng chúng tôi cũng không thể làm gì." Một giám đốc điều hành lớn đã phản hồi như vậy về vấn đề thiếu hụt GPU.
Điều này dường như đã trở thành một vấn đề được công nhận trong ngành. Vào giờ cao điểm, giá của một chiếc A100 của Nvidia đã bị đẩy lên từ 200.000 đến 300.000 nhân dân tệ, và giá thuê tháng của một máy chủ A100 đã tăng vọt lên từ 50.000 đến 70.000 nhân dân tệ. Dù vậy, giá cao cũng không chắc chắn có thể mua được chip, một số nhà cung cấp khả năng tính toán thậm chí đã gặp phải tình huống hiếm hoi như nhà cung cấp vi phạm hợp đồng.
Một giám đốc điều hành trong ngành điện toán đám mây cũng cho biết: "Khả năng tính toán thiếu hụt thực sự tồn tại. Nhiều khách hàng muốn có tài nguyên GPU cao cấp, nhưng chúng tôi hiện không thể hoàn toàn đáp ứng nhu cầu thị trường rộng lớn."
Trong ngắn hạn, sự thiếu hụt GPU cao cấp khó có thể được giải quyết trong toàn ngành. Cơn sốt mô hình lớn đã khiến nhu cầu về khả năng tính toán trên thị trường tăng nhanh, nhưng tốc độ cung cấp không theo kịp. Mặc dù trong dài hạn, cung cấp khả năng tính toán chắc chắn sẽ chuyển từ thị trường người bán sang thị trường người mua, nhưng quá trình này sẽ mất bao lâu vẫn còn là một ẩn số.
Các công ty đều đang tính toán xem mình có bao nhiêu GPU Nvidia và dựa vào đó để xác định thị phần. Một người có thông tin cho biết, nếu trong tay có gần 10.000 thẻ, trong khi tổng thị trường là 100.000 thẻ, thì thị phần là 10%. "Đến cuối năm, số lượng có thể đạt 40.000 thẻ, nếu tổng thị trường là 200.000 thẻ, thì có thể chiếm 20% thị phần."
Một bên là không thể mua được thẻ GPU, bên kia là ngưỡng đào tạo mô hình lớn không dễ dàng như ngành công nghiệp quảng bá. Chi phí đào tạo mô hình khí tượng lớn được đề cập ở trên có thể vượt quá 2 triệu nhân dân tệ, nhưng cần lưu ý rằng, đây là mô hình lĩnh vực cụ thể được đào tạo trên mô hình lớn chung, với quy mô tham số lên đến hàng trăm triệu. Nếu muốn đào tạo mô hình lớn chung với quy mô một tỷ hoặc lớn hơn, chi phí có thể tăng gấp mười, gấp trăm lần.
Một giám đốc điều hành của một công ty công nghệ tiết lộ: "Hiện tại quy mô đầu tư lớn nhất là đào tạo mô hình, nếu không có hàng chục tỷ vốn đầu tư, rất khó để tiếp tục mở rộng mô hình."
Một doanh nhân đã mô tả tình hình cạnh tranh của các mô hình lớn hiện nay: "Để chạy nhanh, ít nhất phải có kết quả trước khi hết vốn để có được vòng 'gọi vốn' tiếp theo. Nếu không có hàng trăm triệu hoặc hàng tỷ vốn hỗ trợ, con đường này rất khó đi."
Trong bối cảnh này, ngành công nghiệp đều cho rằng, với sự cạnh tranh của thị trường mô hình lớn, thị trường sẽ chuyển từ cuồng nhiệt sang lý trí, các doanh nghiệp cũng sẽ điều chỉnh chi phí và chiến lược theo sự thay đổi của kỳ vọng.
Các biện pháp tích cực ứng phó với sự thiếu hụt khả năng tính toán
Không có điều kiện cũng phải tạo ra điều kiện - dường như đây là tâm lý của hầu hết những người tham gia vào các mô hình lớn. Các doanh nghiệp đều đang tìm cách để đối phó với những vấn đề thực tế tồn tại.
Do thiếu hụt chip GPU cao cấp và GPU có sẵn trên thị trường Trung Quốc không phải là thế hệ mới nhất, hiệu suất thường thấp hơn, nên các doanh nghiệp cần nhiều thời gian hơn để huấn luyện các mô hình lớn. Những công ty này cũng đang tìm kiếm những phương pháp sáng tạo để bù đắp cho Khả năng tính toán yếu kém.
Một trong những phương pháp là sử dụng dữ liệu chất lượng cao hơn để đào tạo, nhằm nâng cao hiệu quả đào tạo. Một báo cáo ngành được phát hành gần đây đã đề xuất việc đưa vào đánh dấu và xác nhận thủ công trong việc đảm bảo chất lượng dữ liệu, chọn một tỷ lệ nhất định từ dữ liệu gốc để đánh dấu, xây dựng bộ dữ liệu chất lượng cao.
Ngoài việc giảm chi phí mô hình lớn thông qua dữ liệu chất lượng cao, nâng cao khả năng hạ tầng và đạt được khả năng hoạt động ổn định trên 1000 kcal trong hai tuần mà không bị rớt thẻ, đây cũng là một trong những điểm khó khăn và hướng tối ưu hóa.
Một giám đốc điều hành của một nhà cung cấp dịch vụ đám mây cho biết: "Là nhà cung cấp dịch vụ đám mây, chúng tôi sẽ giúp khách hàng xây dựng cơ sở hạ tầng ổn định và đáng tin cậy. Bởi vì tính ổn định của máy chủ GPU kém, bất kỳ sự cố nào cũng sẽ dẫn đến gián đoạn quá trình huấn luyện, làm tăng tổng thời gian huấn luyện. Cụm tính toán hiệu suất cao có thể cung cấp dịch vụ ổn định hơn cho khách hàng, tương đối rút ngắn thời gian huấn luyện, giải quyết một phần vấn đề khả năng tính toán."
Đồng thời, việc điều phối tài nguyên thẻ tính toán cũng thử thách khả năng kỹ thuật của nhà cung cấp dịch vụ. Một người phụ trách giải pháp internet nói: "Có tài nguyên thẻ tính toán chỉ là một phần, cách thức điều phối tài nguyên thẻ để thực sự đưa vào sử dụng mới là khả năng cốt lõi và khả năng kỹ thuật đầy thách thức hơn. Chia một thẻ thành nhiều thẻ nhỏ, thực hiện điều phối tinh vi phân tán, có thể giảm thêm chi phí tính toán."
Mạng cũng ảnh hưởng đến tốc độ và hiệu quả đào tạo mô hình lớn. Việc đào tạo mô hình lớn thường cần hàng nghìn thẻ GPU, kết nối hàng trăm máy chủ GPU yêu cầu tốc độ mạng rất cao, sự tắc nghẽn mạng sẽ ảnh hưởng nghiêm trọng đến tốc độ và hiệu quả đào tạo.
Một số nhà sản xuất đã tìm ra hướng đi mới, chuyển từ kiến trúc điện toán đám mây sang kiến trúc siêu máy tính cũng trở thành một cách để giảm chi phí. Trong khi vẫn đáp ứng nhu cầu của người dùng, đối với các nhiệm vụ tính toán không có lưu lượng cao và các kịch bản nhiệm vụ song song, giá siêu máy tính đám mây khoảng bằng một nửa so với đám mây siêu máy tính, và thông qua tối ưu hóa hiệu suất, có thể nâng cao tỷ lệ sử dụng tài nguyên từ 30% lên 60%.
Ngoài ra, cũng có nhà sản xuất chọn sử dụng nền tảng nội địa để đào tạo và suy diễn mô hình lớn, thay thế cho GPU Nvidia đang khan hiếm. Một giám đốc điều hành của một doanh nghiệp cho biết, họ đã hợp tác với Huawei để phát triển một máy tính tích hợp có thể thực hiện đào tạo và suy diễn trên nền tảng nội địa, hiệu suất GPU của Huawei hiện đã có thể so sánh với Nvidia.
Mỗi phương pháp trên đều là một dự án lớn, các doanh nghiệp thông thường rất khó để tự xây dựng trung tâm dữ liệu nhằm đáp ứng nhu cầu, nhiều đội ngũ thuật toán chọn các nhà cung cấp khả năng tính toán chuyên nghiệp để được hỗ trợ. Lưu trữ song song cũng là một thách thức lớn về chi phí và công nghệ, ngoài ra còn cần xem xét chi phí điện năng khu vực IDC, chi phí nền tảng phần mềm, chi phí nhân sự và các chi phí vận hành khác.
Cụm GPU cấp nghìn calo mới có thể đạt được hiệu ứng quy mô, việc chọn nhà cung cấp dịch vụ khả năng tính toán có nghĩa là chi phí biên gần như bằng không.
Một viện sĩ chỉ ra rằng, AIGC mang đến sự bùng nổ cho ngành công nghiệp trí tuệ nhân tạo, trong khi việc ứng dụng quy mô công nghệ thông minh gặp vấn đề đuôi dài điển hình. Các bộ phận, trường nghiên cứu và doanh nghiệp lớn và vừa có khả năng AI mạnh chỉ chiếm khoảng 20% nhu cầu về khả năng tính toán, trong khi 80% còn lại là các doanh nghiệp nhỏ và vừa. Các chủ thể này bị giới hạn bởi quy mô và ngân sách, thường khó khăn trong việc tiếp cận tài nguyên khả năng tính toán hoặc bị hạn chế bởi giá cả cao, khó có thể đạt được lợi ích phát triển trong thời đại AI.
Do đó, để hiện thực hóa việc ứng dụng công nghệ thông minh trên quy mô lớn, khiến ngành công nghiệp trí tuệ nhân tạo vừa "được khen" vừa "được mua", cần một lượng lớn khả năng tính toán rẻ và dễ sử dụng, giúp các doanh nghiệp nhỏ và vừa cũng có thể dễ dàng và với chi phí thấp sử dụng khả năng tính toán.
Dù là nhu cầu cấp bách về khả năng tính toán từ các mô hình lớn, hay các vấn đề cần giải quyết trong quá trình ứng dụng khả năng tính toán, tất cả đều phản ánh một sự thay đổi mới: khả năng tính toán đã trở thành một mô hình dịch vụ mới trong quá trình nhu cầu thị trường và phát triển công nghệ.
Khám phá mô hình dịch vụ khả năng tính toán mới
Chúng ta đang tranh giành khả năng tính toán của mô hình lớn, thực sự là gì? Để giải đáp câu hỏi này, cần bắt đầu từ dịch vụ khả năng tính toán.
Khả năng tính toán được chia thành khả năng tính toán chung, khả năng tính toán thông minh và khả năng tính toán siêu. Những khả năng tính toán này trở thành một dịch vụ, là kết quả của sự thúc đẩy từ cả thị trường và công nghệ.
Một tài liệu trắng trong ngành định nghĩa dịch vụ khả năng tính toán là: dựa trên khả năng tính toán đa dạng, liên kết bằng mạng khả năng tính toán, với mục tiêu cung cấp khả năng tính toán hiệu quả trong lĩnh vực mới của ngành khả năng tính toán.
Bản chất của dịch vụ khả năng tính toán là thông qua công nghệ tính toán mới để thực hiện đầu ra khả năng tính toán đồng nhất từ các nguồn khác nhau, và tích hợp chéo với các công nghệ như đám mây, dữ liệu lớn, AI, v.v. Dịch vụ khả năng tính toán không chỉ bao gồm khả năng tính toán, mà còn là sự đóng gói đồng nhất các nguồn lực như khả năng tính toán, lưu trữ, mạng, v.v. dưới dạng dịch vụ ( như API ) để hoàn thành việc giao khả năng tính toán.
Hiểu điều này sẽ nhận ra rằng, một phần lớn trong việc tranh giành chip Nvidia là các nhà cung cấp dịch vụ khả năng tính toán, tức là các nhà sản xuất khả năng tính toán. Người dùng ngành thực sự gọi API khả năng tính toán ở phía trước chỉ cần đưa ra yêu cầu khả năng tính toán tương ứng.
Theo thông tin, từ góc độ phần mềm, việc sử dụng mô hình lớn từ tất cả các tương tác phần mềm được chia thành ba loại: thứ nhất là gọi API mô hình lớn, mỗi công ty có báo giá, thanh toán theo giá; thứ hai là mô hình nhỏ tự có, tự mua khả năng tính toán, thậm chí tự triển khai; thứ ba là các nhà sản xuất mô hình lớn hợp tác với các nhà cung cấp đám mây, tức là đám mây chuyên dụng, thanh toán hàng tháng. Một giám đốc điều hành của một công ty phần mềm văn phòng cho biết, họ chủ yếu sử dụng gọi API, trong khi mô hình nhỏ nội bộ thì tự xây dựng nền tảng điều độ khả năng tính toán.
Cũng có nghĩa là, trong cấu trúc chuỗi công nghiệp khả năng tính toán, doanh nghiệp thượng nguồn chủ yếu hoàn thành việc cung cấp các tài nguyên hỗ trợ dịch vụ khả năng tính toán như khả năng tính toán chung, khả năng tính toán thông minh, khả năng tính toán siêu máy tính, lưu trữ và mạng. Ví dụ, trong cuộc chiến giành khả năng tính toán cho mô hình lớn, Nvidia thuộc nhà cung cấp tài nguyên cơ sở khả năng tính toán thượng nguồn, cung cấp chip cho ngành.
Các doanh nghiệp trung gian chủ yếu là nhà cung cấp dịch vụ đám mây và nhà cung cấp dịch vụ tính toán mới, họ thực hiện sản xuất tính toán thông qua công nghệ lập trình, điều phối và giao dịch tính toán, và hoàn thành việc cung cấp tính toán thông qua các phương thức như API. Khả năng dịch vụ của các doanh nghiệp trung gian cung cấp dịch vụ tính toán càng mạnh, thì ngưỡng đối với các ứng dụng càng thấp, càng có lợi cho sự phát triển phổ cập và lan tỏa của tính toán.
Các doanh nghiệp hạ nguồn dựa vào khả năng tính toán do dịch vụ tính toán cung cấp để sản xuất các dịch vụ gia tăng, như người dùng trong ngành. Nhóm người dùng này chỉ cần đưa ra yêu cầu, nhà sản xuất khả năng tính toán sẽ cấu hình khả năng tính toán tương ứng theo nhu cầu để hoàn thành "nhiệm vụ khả năng tính toán" mà người dùng giao.
Điều này có lợi thế về chi phí và công nghệ hơn so với việc tự mua máy chủ để xây dựng môi trường tính toán cho mô hình lớn.
Khả năng tính toán mô hình kinh doanh lặp lại
Ví dụ về một mô hình lớn phổ biến được ra mắt sớm, theo thông tin công khai, nó đã sử dụng nhiều nhà cung cấp dịch vụ AI khả năng tính toán hàng đầu trong nước. Những người trong cuộc cho biết, về lý thuyết, nó có thể đã sử dụng hết tất cả các nhà cung cấp dịch vụ khả năng tính toán/đám mây hàng đầu.
Mô hình tính phí theo lượng và tính phí theo gói năm hoặc tháng là các mô hình chính của dịch vụ tính toán hiện nay, nhu cầu sử dụng chủ yếu có hai loại: một là chọn dịch vụ tính toán tương ứng, chẳng hạn như nhà cung cấp dịch vụ đám mây nào đó cung cấp máy chủ GPU hiệu suất cao trang bị ba loại card đồ họa chính là Nvidia A800, A100, V100; hai là chọn nền tảng dịch vụ MaaS tương ứng, trên nền tảng đó tiến hành tinh chỉnh ngành cho mô hình lớn.
Ngành công nghiệp hiện tại cũng đang thúc đẩy "sự tích hợp năng lực tính toán và mạng tính toán", thông qua việc đánh giá tổng hợp thông tin về nhiệm vụ tính toán, trạng thái tài nguyên mạng tính toán, tạo ra các phương án điều phối mạng tính toán hỗ trợ cho việc điều phối qua kiến trúc, khu vực và nhà cung cấp dịch vụ khác nhau, và hoàn thành việc triển khai các tài nguyên liên quan. Ví dụ, chỉ cần nạp sẵn tiền, có thể tự do gọi sử dụng trong các phân vùng của mạng tính toán, lựa chọn phân vùng phù hợp nhất, nhanh nhất hoặc có giá trị tốt nhất theo đặc điểm ứng dụng, tính phí theo thời gian và trừ phí từ số tiền đã nạp sẵn.
Nhà cung cấp dịch vụ đám mây cũng vậy, dịch vụ khả năng tính toán như một sản phẩm độc đáo của dịch vụ đám mây, giúp họ nhanh chóng tham gia vào chuỗi công nghiệp khả năng tính toán.
Dữ liệu từ Bộ Công nghiệp và Công nghệ thông tin cho thấy, vào năm 2022, tổng quy mô khả năng tính toán của Trung Quốc đạt 180EFLOPS, đứng thứ hai toàn cầu. Tính đến năm 2022, quy mô ngành khả năng tính toán của Trung Quốc đã đạt 1,8 nghìn tỷ nhân dân tệ. Khả năng tính toán của các mô hình lớn đã thúc đẩy rất lớn sự phát triển của ngành khả năng tính toán.
Có quan điểm cho rằng, dịch vụ khả năng tính toán hiện nay thực chất là một mô hình "bán điện" mới. Chỉ là do sự phân công khác nhau, một số nhà cung cấp dịch vụ khả năng tính toán có thể cần cung cấp cho người dùng nhiều công việc bảo trì cuối cùng hơn như tinh chỉnh hiệu suất hệ thống, cài đặt phần mềm, giám sát thực hiện các công việc quy mô lớn và phân tích đặc điểm hoạt động.
Với nhu cầu tính toán hiệu suất cao của mô hình lớn trở thành bình thường, dịch vụ khả năng tính toán xuất phát từ dịch vụ đám mây nhanh chóng vào tầm nhìn của công chúng, hình thành một chuỗi công nghiệp và mô hình kinh doanh độc đáo. Chỉ có điều, khi ngành khả năng tính toán bùng nổ do mô hình lớn, sự thiếu hụt GPU cao cấp, chi phí khả năng tính toán cao, và cuộc cạnh tranh giành chip đã tạo ra một phong cảnh độc đáo của thời đại này.
Có người trong cuộc bình luận: "Hiện tại, người đang cạnh tranh là ai có thể có được thẻ GPU trong chuỗi cung ứng, NVIDIA là vua của toàn ngành hiện nay, kiểm soát tất cả các thị trường, đó là thực trạng. " Trong tình huống cầu vượt quá cung, ai có thể có được thẻ GPU, người đó sẽ có thể giao dịch.
Nhưng không phải ai cũng đang tranh giành thẻ GPU, vì tình trạng thiếu hụt chỉ là tạm thời, vấn đề cuối cùng sẽ được giải quyết. "Những nhà nghiên cứu lâu dài thực sự không vội vã mua sắm, họ chỉ cần chờ đợi bình thường, vì họ sẽ không phá sản. Hiện tại, những người đang thực sự mua sắm thẻ GPU chủ yếu là một nhóm các công ty khởi nghiệp, họ cần đảm bảo có thể sống sót đến năm sau." Người trên cho biết.
Trong nhiều sự không chắc chắn, khả năng tính toán trở thành một loại dịch vụ là xu hướng chắc chắn, các nhà cung cấp dịch vụ khả năng tính toán cần chuẩn bị trước, sẵn sàng cho sự trở lại lý trí của các mô hình lớn và sự thay đổi nhanh chóng của thị trường.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
13 thích
Phần thưởng
13
4
Chia sẻ
Bình luận
0/400
FlashLoanPrince
· 22giờ trước
Hai triệu vẫn được coi là ít, đốt tiền đó.
Xem bản gốcTrả lời0
FromMinerToFarmer
· 22giờ trước
Hai triệu thì nghĩ sao? Đốt tiền thôi.
Xem bản gốcTrả lời0
GasFeePhobia
· 22giờ trước
Sập lò, chết đói rồi.
Xem bản gốcTrả lời0
EntryPositionAnalyst
· 22giờ trước
Thực sự chỉ là đốt tiền trong sự cạnh tranh như vậy thôi.
Khả năng tính toán ngắn hạn dưới cơ hội kinh doanh mô hình lớn: sự trỗi dậy của mô hình dịch vụ khả năng tính toán mới
Khả năng tính toán dịch vụ trở thành mô hình kinh doanh mới, sau cơn sốt "luyện đan" của mô hình lớn thì làm thế nào để chuyển hướng?
Gần đây, sử dụng dữ liệu thời tiết toàn cầu trong 40 năm, với 200 thẻ GPU được sử dụng trong khoảng 2 tháng để huấn luyện trước, một mô hình khí tượng lớn với hàng triệu tham số đã ra đời. Đây là trải nghiệm của một người trẻ tuổi tốt nghiệp từ Đại học Thanh Hoa 3 năm trước trong việc huấn luyện mô hình lớn.
Xét từ góc độ chi phí, với mức tính toán 7,8 nhân dân tệ/giờ/chiếc GPU, chi phí đào tạo của mô hình khí tượng lớn này có thể vượt quá 2 triệu nhân dân tệ. Còn nếu đào tạo là mô hình lớn tổng quát, chi phí có thể tăng gấp trăm lần.
Dữ liệu cho thấy, Trung Quốc hiện đã có hơn 100 mô hình lớn với quy mô 10 tỷ tham số. Tuy nhiên, ngành công nghiệp đang đổ xô vào việc "luyện đan" các mô hình lớn lại đang phải đối mặt với tình trạng thiếu hụt GPU cao cấp. Khả năng tính toán vẫn ở mức cao, thiếu hụt khả năng tính toán và vốn đã trở thành vấn đề rõ ràng nhất mà ngành công nghiệp phải đối mặt.
Tình trạng thiếu GPU cao cấp
"Quả thật là thiếu, nhưng chúng tôi cũng không thể làm gì." Một giám đốc điều hành lớn đã phản hồi như vậy về vấn đề thiếu hụt GPU.
Điều này dường như đã trở thành một vấn đề được công nhận trong ngành. Vào giờ cao điểm, giá của một chiếc A100 của Nvidia đã bị đẩy lên từ 200.000 đến 300.000 nhân dân tệ, và giá thuê tháng của một máy chủ A100 đã tăng vọt lên từ 50.000 đến 70.000 nhân dân tệ. Dù vậy, giá cao cũng không chắc chắn có thể mua được chip, một số nhà cung cấp khả năng tính toán thậm chí đã gặp phải tình huống hiếm hoi như nhà cung cấp vi phạm hợp đồng.
Một giám đốc điều hành trong ngành điện toán đám mây cũng cho biết: "Khả năng tính toán thiếu hụt thực sự tồn tại. Nhiều khách hàng muốn có tài nguyên GPU cao cấp, nhưng chúng tôi hiện không thể hoàn toàn đáp ứng nhu cầu thị trường rộng lớn."
Trong ngắn hạn, sự thiếu hụt GPU cao cấp khó có thể được giải quyết trong toàn ngành. Cơn sốt mô hình lớn đã khiến nhu cầu về khả năng tính toán trên thị trường tăng nhanh, nhưng tốc độ cung cấp không theo kịp. Mặc dù trong dài hạn, cung cấp khả năng tính toán chắc chắn sẽ chuyển từ thị trường người bán sang thị trường người mua, nhưng quá trình này sẽ mất bao lâu vẫn còn là một ẩn số.
Các công ty đều đang tính toán xem mình có bao nhiêu GPU Nvidia và dựa vào đó để xác định thị phần. Một người có thông tin cho biết, nếu trong tay có gần 10.000 thẻ, trong khi tổng thị trường là 100.000 thẻ, thì thị phần là 10%. "Đến cuối năm, số lượng có thể đạt 40.000 thẻ, nếu tổng thị trường là 200.000 thẻ, thì có thể chiếm 20% thị phần."
Một bên là không thể mua được thẻ GPU, bên kia là ngưỡng đào tạo mô hình lớn không dễ dàng như ngành công nghiệp quảng bá. Chi phí đào tạo mô hình khí tượng lớn được đề cập ở trên có thể vượt quá 2 triệu nhân dân tệ, nhưng cần lưu ý rằng, đây là mô hình lĩnh vực cụ thể được đào tạo trên mô hình lớn chung, với quy mô tham số lên đến hàng trăm triệu. Nếu muốn đào tạo mô hình lớn chung với quy mô một tỷ hoặc lớn hơn, chi phí có thể tăng gấp mười, gấp trăm lần.
Một giám đốc điều hành của một công ty công nghệ tiết lộ: "Hiện tại quy mô đầu tư lớn nhất là đào tạo mô hình, nếu không có hàng chục tỷ vốn đầu tư, rất khó để tiếp tục mở rộng mô hình."
Một doanh nhân đã mô tả tình hình cạnh tranh của các mô hình lớn hiện nay: "Để chạy nhanh, ít nhất phải có kết quả trước khi hết vốn để có được vòng 'gọi vốn' tiếp theo. Nếu không có hàng trăm triệu hoặc hàng tỷ vốn hỗ trợ, con đường này rất khó đi."
Trong bối cảnh này, ngành công nghiệp đều cho rằng, với sự cạnh tranh của thị trường mô hình lớn, thị trường sẽ chuyển từ cuồng nhiệt sang lý trí, các doanh nghiệp cũng sẽ điều chỉnh chi phí và chiến lược theo sự thay đổi của kỳ vọng.
Các biện pháp tích cực ứng phó với sự thiếu hụt khả năng tính toán
Không có điều kiện cũng phải tạo ra điều kiện - dường như đây là tâm lý của hầu hết những người tham gia vào các mô hình lớn. Các doanh nghiệp đều đang tìm cách để đối phó với những vấn đề thực tế tồn tại.
Do thiếu hụt chip GPU cao cấp và GPU có sẵn trên thị trường Trung Quốc không phải là thế hệ mới nhất, hiệu suất thường thấp hơn, nên các doanh nghiệp cần nhiều thời gian hơn để huấn luyện các mô hình lớn. Những công ty này cũng đang tìm kiếm những phương pháp sáng tạo để bù đắp cho Khả năng tính toán yếu kém.
Một trong những phương pháp là sử dụng dữ liệu chất lượng cao hơn để đào tạo, nhằm nâng cao hiệu quả đào tạo. Một báo cáo ngành được phát hành gần đây đã đề xuất việc đưa vào đánh dấu và xác nhận thủ công trong việc đảm bảo chất lượng dữ liệu, chọn một tỷ lệ nhất định từ dữ liệu gốc để đánh dấu, xây dựng bộ dữ liệu chất lượng cao.
Ngoài việc giảm chi phí mô hình lớn thông qua dữ liệu chất lượng cao, nâng cao khả năng hạ tầng và đạt được khả năng hoạt động ổn định trên 1000 kcal trong hai tuần mà không bị rớt thẻ, đây cũng là một trong những điểm khó khăn và hướng tối ưu hóa.
Một giám đốc điều hành của một nhà cung cấp dịch vụ đám mây cho biết: "Là nhà cung cấp dịch vụ đám mây, chúng tôi sẽ giúp khách hàng xây dựng cơ sở hạ tầng ổn định và đáng tin cậy. Bởi vì tính ổn định của máy chủ GPU kém, bất kỳ sự cố nào cũng sẽ dẫn đến gián đoạn quá trình huấn luyện, làm tăng tổng thời gian huấn luyện. Cụm tính toán hiệu suất cao có thể cung cấp dịch vụ ổn định hơn cho khách hàng, tương đối rút ngắn thời gian huấn luyện, giải quyết một phần vấn đề khả năng tính toán."
Đồng thời, việc điều phối tài nguyên thẻ tính toán cũng thử thách khả năng kỹ thuật của nhà cung cấp dịch vụ. Một người phụ trách giải pháp internet nói: "Có tài nguyên thẻ tính toán chỉ là một phần, cách thức điều phối tài nguyên thẻ để thực sự đưa vào sử dụng mới là khả năng cốt lõi và khả năng kỹ thuật đầy thách thức hơn. Chia một thẻ thành nhiều thẻ nhỏ, thực hiện điều phối tinh vi phân tán, có thể giảm thêm chi phí tính toán."
Mạng cũng ảnh hưởng đến tốc độ và hiệu quả đào tạo mô hình lớn. Việc đào tạo mô hình lớn thường cần hàng nghìn thẻ GPU, kết nối hàng trăm máy chủ GPU yêu cầu tốc độ mạng rất cao, sự tắc nghẽn mạng sẽ ảnh hưởng nghiêm trọng đến tốc độ và hiệu quả đào tạo.
Một số nhà sản xuất đã tìm ra hướng đi mới, chuyển từ kiến trúc điện toán đám mây sang kiến trúc siêu máy tính cũng trở thành một cách để giảm chi phí. Trong khi vẫn đáp ứng nhu cầu của người dùng, đối với các nhiệm vụ tính toán không có lưu lượng cao và các kịch bản nhiệm vụ song song, giá siêu máy tính đám mây khoảng bằng một nửa so với đám mây siêu máy tính, và thông qua tối ưu hóa hiệu suất, có thể nâng cao tỷ lệ sử dụng tài nguyên từ 30% lên 60%.
Ngoài ra, cũng có nhà sản xuất chọn sử dụng nền tảng nội địa để đào tạo và suy diễn mô hình lớn, thay thế cho GPU Nvidia đang khan hiếm. Một giám đốc điều hành của một doanh nghiệp cho biết, họ đã hợp tác với Huawei để phát triển một máy tính tích hợp có thể thực hiện đào tạo và suy diễn trên nền tảng nội địa, hiệu suất GPU của Huawei hiện đã có thể so sánh với Nvidia.
Mỗi phương pháp trên đều là một dự án lớn, các doanh nghiệp thông thường rất khó để tự xây dựng trung tâm dữ liệu nhằm đáp ứng nhu cầu, nhiều đội ngũ thuật toán chọn các nhà cung cấp khả năng tính toán chuyên nghiệp để được hỗ trợ. Lưu trữ song song cũng là một thách thức lớn về chi phí và công nghệ, ngoài ra còn cần xem xét chi phí điện năng khu vực IDC, chi phí nền tảng phần mềm, chi phí nhân sự và các chi phí vận hành khác.
Cụm GPU cấp nghìn calo mới có thể đạt được hiệu ứng quy mô, việc chọn nhà cung cấp dịch vụ khả năng tính toán có nghĩa là chi phí biên gần như bằng không.
Một viện sĩ chỉ ra rằng, AIGC mang đến sự bùng nổ cho ngành công nghiệp trí tuệ nhân tạo, trong khi việc ứng dụng quy mô công nghệ thông minh gặp vấn đề đuôi dài điển hình. Các bộ phận, trường nghiên cứu và doanh nghiệp lớn và vừa có khả năng AI mạnh chỉ chiếm khoảng 20% nhu cầu về khả năng tính toán, trong khi 80% còn lại là các doanh nghiệp nhỏ và vừa. Các chủ thể này bị giới hạn bởi quy mô và ngân sách, thường khó khăn trong việc tiếp cận tài nguyên khả năng tính toán hoặc bị hạn chế bởi giá cả cao, khó có thể đạt được lợi ích phát triển trong thời đại AI.
Do đó, để hiện thực hóa việc ứng dụng công nghệ thông minh trên quy mô lớn, khiến ngành công nghiệp trí tuệ nhân tạo vừa "được khen" vừa "được mua", cần một lượng lớn khả năng tính toán rẻ và dễ sử dụng, giúp các doanh nghiệp nhỏ và vừa cũng có thể dễ dàng và với chi phí thấp sử dụng khả năng tính toán.
Dù là nhu cầu cấp bách về khả năng tính toán từ các mô hình lớn, hay các vấn đề cần giải quyết trong quá trình ứng dụng khả năng tính toán, tất cả đều phản ánh một sự thay đổi mới: khả năng tính toán đã trở thành một mô hình dịch vụ mới trong quá trình nhu cầu thị trường và phát triển công nghệ.
Khám phá mô hình dịch vụ khả năng tính toán mới
Chúng ta đang tranh giành khả năng tính toán của mô hình lớn, thực sự là gì? Để giải đáp câu hỏi này, cần bắt đầu từ dịch vụ khả năng tính toán.
Khả năng tính toán được chia thành khả năng tính toán chung, khả năng tính toán thông minh và khả năng tính toán siêu. Những khả năng tính toán này trở thành một dịch vụ, là kết quả của sự thúc đẩy từ cả thị trường và công nghệ.
Một tài liệu trắng trong ngành định nghĩa dịch vụ khả năng tính toán là: dựa trên khả năng tính toán đa dạng, liên kết bằng mạng khả năng tính toán, với mục tiêu cung cấp khả năng tính toán hiệu quả trong lĩnh vực mới của ngành khả năng tính toán.
Bản chất của dịch vụ khả năng tính toán là thông qua công nghệ tính toán mới để thực hiện đầu ra khả năng tính toán đồng nhất từ các nguồn khác nhau, và tích hợp chéo với các công nghệ như đám mây, dữ liệu lớn, AI, v.v. Dịch vụ khả năng tính toán không chỉ bao gồm khả năng tính toán, mà còn là sự đóng gói đồng nhất các nguồn lực như khả năng tính toán, lưu trữ, mạng, v.v. dưới dạng dịch vụ ( như API ) để hoàn thành việc giao khả năng tính toán.
Hiểu điều này sẽ nhận ra rằng, một phần lớn trong việc tranh giành chip Nvidia là các nhà cung cấp dịch vụ khả năng tính toán, tức là các nhà sản xuất khả năng tính toán. Người dùng ngành thực sự gọi API khả năng tính toán ở phía trước chỉ cần đưa ra yêu cầu khả năng tính toán tương ứng.
Theo thông tin, từ góc độ phần mềm, việc sử dụng mô hình lớn từ tất cả các tương tác phần mềm được chia thành ba loại: thứ nhất là gọi API mô hình lớn, mỗi công ty có báo giá, thanh toán theo giá; thứ hai là mô hình nhỏ tự có, tự mua khả năng tính toán, thậm chí tự triển khai; thứ ba là các nhà sản xuất mô hình lớn hợp tác với các nhà cung cấp đám mây, tức là đám mây chuyên dụng, thanh toán hàng tháng. Một giám đốc điều hành của một công ty phần mềm văn phòng cho biết, họ chủ yếu sử dụng gọi API, trong khi mô hình nhỏ nội bộ thì tự xây dựng nền tảng điều độ khả năng tính toán.
Cũng có nghĩa là, trong cấu trúc chuỗi công nghiệp khả năng tính toán, doanh nghiệp thượng nguồn chủ yếu hoàn thành việc cung cấp các tài nguyên hỗ trợ dịch vụ khả năng tính toán như khả năng tính toán chung, khả năng tính toán thông minh, khả năng tính toán siêu máy tính, lưu trữ và mạng. Ví dụ, trong cuộc chiến giành khả năng tính toán cho mô hình lớn, Nvidia thuộc nhà cung cấp tài nguyên cơ sở khả năng tính toán thượng nguồn, cung cấp chip cho ngành.
Các doanh nghiệp trung gian chủ yếu là nhà cung cấp dịch vụ đám mây và nhà cung cấp dịch vụ tính toán mới, họ thực hiện sản xuất tính toán thông qua công nghệ lập trình, điều phối và giao dịch tính toán, và hoàn thành việc cung cấp tính toán thông qua các phương thức như API. Khả năng dịch vụ của các doanh nghiệp trung gian cung cấp dịch vụ tính toán càng mạnh, thì ngưỡng đối với các ứng dụng càng thấp, càng có lợi cho sự phát triển phổ cập và lan tỏa của tính toán.
Các doanh nghiệp hạ nguồn dựa vào khả năng tính toán do dịch vụ tính toán cung cấp để sản xuất các dịch vụ gia tăng, như người dùng trong ngành. Nhóm người dùng này chỉ cần đưa ra yêu cầu, nhà sản xuất khả năng tính toán sẽ cấu hình khả năng tính toán tương ứng theo nhu cầu để hoàn thành "nhiệm vụ khả năng tính toán" mà người dùng giao.
Điều này có lợi thế về chi phí và công nghệ hơn so với việc tự mua máy chủ để xây dựng môi trường tính toán cho mô hình lớn.
Khả năng tính toán mô hình kinh doanh lặp lại
Ví dụ về một mô hình lớn phổ biến được ra mắt sớm, theo thông tin công khai, nó đã sử dụng nhiều nhà cung cấp dịch vụ AI khả năng tính toán hàng đầu trong nước. Những người trong cuộc cho biết, về lý thuyết, nó có thể đã sử dụng hết tất cả các nhà cung cấp dịch vụ khả năng tính toán/đám mây hàng đầu.
Mô hình tính phí theo lượng và tính phí theo gói năm hoặc tháng là các mô hình chính của dịch vụ tính toán hiện nay, nhu cầu sử dụng chủ yếu có hai loại: một là chọn dịch vụ tính toán tương ứng, chẳng hạn như nhà cung cấp dịch vụ đám mây nào đó cung cấp máy chủ GPU hiệu suất cao trang bị ba loại card đồ họa chính là Nvidia A800, A100, V100; hai là chọn nền tảng dịch vụ MaaS tương ứng, trên nền tảng đó tiến hành tinh chỉnh ngành cho mô hình lớn.
Ngành công nghiệp hiện tại cũng đang thúc đẩy "sự tích hợp năng lực tính toán và mạng tính toán", thông qua việc đánh giá tổng hợp thông tin về nhiệm vụ tính toán, trạng thái tài nguyên mạng tính toán, tạo ra các phương án điều phối mạng tính toán hỗ trợ cho việc điều phối qua kiến trúc, khu vực và nhà cung cấp dịch vụ khác nhau, và hoàn thành việc triển khai các tài nguyên liên quan. Ví dụ, chỉ cần nạp sẵn tiền, có thể tự do gọi sử dụng trong các phân vùng của mạng tính toán, lựa chọn phân vùng phù hợp nhất, nhanh nhất hoặc có giá trị tốt nhất theo đặc điểm ứng dụng, tính phí theo thời gian và trừ phí từ số tiền đã nạp sẵn.
Nhà cung cấp dịch vụ đám mây cũng vậy, dịch vụ khả năng tính toán như một sản phẩm độc đáo của dịch vụ đám mây, giúp họ nhanh chóng tham gia vào chuỗi công nghiệp khả năng tính toán.
Dữ liệu từ Bộ Công nghiệp và Công nghệ thông tin cho thấy, vào năm 2022, tổng quy mô khả năng tính toán của Trung Quốc đạt 180EFLOPS, đứng thứ hai toàn cầu. Tính đến năm 2022, quy mô ngành khả năng tính toán của Trung Quốc đã đạt 1,8 nghìn tỷ nhân dân tệ. Khả năng tính toán của các mô hình lớn đã thúc đẩy rất lớn sự phát triển của ngành khả năng tính toán.
Có quan điểm cho rằng, dịch vụ khả năng tính toán hiện nay thực chất là một mô hình "bán điện" mới. Chỉ là do sự phân công khác nhau, một số nhà cung cấp dịch vụ khả năng tính toán có thể cần cung cấp cho người dùng nhiều công việc bảo trì cuối cùng hơn như tinh chỉnh hiệu suất hệ thống, cài đặt phần mềm, giám sát thực hiện các công việc quy mô lớn và phân tích đặc điểm hoạt động.
Với nhu cầu tính toán hiệu suất cao của mô hình lớn trở thành bình thường, dịch vụ khả năng tính toán xuất phát từ dịch vụ đám mây nhanh chóng vào tầm nhìn của công chúng, hình thành một chuỗi công nghiệp và mô hình kinh doanh độc đáo. Chỉ có điều, khi ngành khả năng tính toán bùng nổ do mô hình lớn, sự thiếu hụt GPU cao cấp, chi phí khả năng tính toán cao, và cuộc cạnh tranh giành chip đã tạo ra một phong cảnh độc đáo của thời đại này.
Có người trong cuộc bình luận: "Hiện tại, người đang cạnh tranh là ai có thể có được thẻ GPU trong chuỗi cung ứng, NVIDIA là vua của toàn ngành hiện nay, kiểm soát tất cả các thị trường, đó là thực trạng. " Trong tình huống cầu vượt quá cung, ai có thể có được thẻ GPU, người đó sẽ có thể giao dịch.
Nhưng không phải ai cũng đang tranh giành thẻ GPU, vì tình trạng thiếu hụt chỉ là tạm thời, vấn đề cuối cùng sẽ được giải quyết. "Những nhà nghiên cứu lâu dài thực sự không vội vã mua sắm, họ chỉ cần chờ đợi bình thường, vì họ sẽ không phá sản. Hiện tại, những người đang thực sự mua sắm thẻ GPU chủ yếu là một nhóm các công ty khởi nghiệp, họ cần đảm bảo có thể sống sót đến năm sau." Người trên cho biết.
Trong nhiều sự không chắc chắn, khả năng tính toán trở thành một loại dịch vụ là xu hướng chắc chắn, các nhà cung cấp dịch vụ khả năng tính toán cần chuẩn bị trước, sẵn sàng cho sự trở lại lý trí của các mô hình lớn và sự thay đổi nhanh chóng của thị trường.