Вычислительная мощность сервисов становится новой бизнес-моделью, как перейти к ней после горячей волны "炼丹" больших моделей?
В последнее время, используя 40-летние данные о погоде по всему миру и применяя 200 графических процессоров (GPU) в течение примерно 2 месяцев для предварительного обучения, был создан большой метеорологический модель с параметрами в миллиардах. Это опыт молодого человека, который окончил Университет Цинхуа 3 года назад, по обучению большой модели.
С точки зрения затрат, при расчете 7,8 юаней за час на одну графическую процессор, стоимость обучения этой метеорологической модели может превысить 2 миллиона юаней. А если речь идет о обучении универсальной модели, затраты могут увеличиться в сто раз.
Данные показывают, что в Китае в настоящее время существует более 100 больших моделей с масштабом в 10 миллиардов параметров. Однако бум в индустрии по созданию больших моделей сталкивается с проблемой нехватки высокопроизводительных GPU. Высокие затраты на вычислительную мощность и нехватка вычислительных ресурсов и средств стали наиболее очевидной проблемой, стоящей перед отраслью.
Дефицит высококлассных GPU
"Действительно, нехватка есть, но мы ничего не можем с этим поделать." Так ответил один из высокопоставленных руководителей крупной компании на вопрос о нехватке GPU.
Это, похоже, стало общепризнанной проблемой в отрасли. В пиковые моменты цена одной видеокарты NVIDIA A100 взлетела до 200-300 тысяч юаней, а месячная аренда одного сервера A100 также поднялась до 50-70 тысяч юаней. Тем не менее, даже высокая цена не всегда гарантирует покупку чипа, некоторые поставщики вычислительной мощности даже сталкивались с редкими случаями нарушения обязательств со стороны поставщиков.
Один из руководителей в области облачных вычислений также заявил: "Вычислительная мощность действительно отсутствует. Многие клиенты хотят ресурсы высокопроизводительных GPU, но мы в настоящее время не можем полностью удовлетворить широкий рынок."
В краткосрочной перспективе нехватка высококлассных GPU будет трудно решена по всей отрасли. Всплеск интереса к большим моделям быстро увеличил спрос на вычислительную мощность, однако темпы роста предложения значительно отстают. Хотя в долгосрочной перспективе предложение вычислительной мощности, безусловно, перейдет от рынка продавцов к рынку покупателей, пока неизвестно, сколько времени займет этот процесс.
Все компании подсчитывают, сколько у них GPU от Nvidia, и на основе этого оценивают свою долю на рынке. Один из осведомленных источников привел пример: "Если у вас почти 10 тысяч карт, а общий объем рынка составляет 100 тысяч, то доля составит 10%. Если к концу года количество достигнет 40 тысяч, а общий объем рынка будет 200 тысяч, то это может составить 20% доли рынка."
С одной стороны, невозможно купить GPU-карты, с другой стороны, порог входа в обучение больших моделей вовсе не так прост, как это рекламируется в отрасли. Упомянутые ранее затраты на обучение метеорологической большой модели могут превышать 2 миллиона юаней, но стоит отметить, что это модель вертикальной области, обученная на основе общего большого модели с параметрами на уровне сотен миллионов. Если нужно обучить общую большую модель с миллиардом или большим количеством параметров, затраты могут увеличиться в десять, сто раз.
Некоторые высокопоставленные чиновники технологической компании сообщили: "На данный момент наибольшие инвестиции идут в обучение моделей, без вложений в десятки миллиардов капитала трудно продолжать развивать большие модели."
Предприниматель описал текущую конкурентную ситуацию в области крупных моделей следующим образом: "Чтобы двигаться быстро, нужно добиться результатов до того, как деньги закончатся, чтобы получить следующий раунд 'финансирования'. Если нет поддержки в сотни миллиардов или тысячу миллиардов, этот путь будет сложно пройти."
В данной ситуации в отрасли широко считается, что с конкуренцией на рынке крупных моделей рынок также перейдет от энтузиазма к рациональности, и компании будут контролировать затраты и корректировать стратегии в зависимости от изменений ожиданий.
Активные меры по борьбе с нехваткой вычислительной мощности
Нет условий, но нужно создать условия — похоже, это психология большинства участников больших моделей. Компании ищут способы справиться с реальными проблемами.
Из-за нехватки высококачественных графических процессоров (GPU) и того, что доступные на китайском рынке GPU не являются последним поколением, их производительность обычно ниже, компании нуждаются в большем времени для обучения больших моделей. Эти компании также ищут инновационные методы, чтобы компенсировать недостаток вычислительной мощности.
Один из способов заключается в использовании данных более высокого качества для обучения, что повышает эффективность обучения. Недавно опубликованный отраслевой отчет предлагает ввести ручную маркировку и подтверждение в отношении качества данных, выбирая определенный процент из исходных данных для маркировки и создавая набор данных высокого качества.
Кроме снижения затрат на большие модели за счет высококачественных данных, повышение инфраструктурных возможностей и обеспечение стабильной работы свыше 1000 калорий в течение двух недель без сбоев также являются техническими сложностями и направлениями оптимизации.
Один из руководителей облачного сервиса сказал: "Как облачный сервис, мы поможем клиентам создать стабильную и надежную инфраструктуру. Поскольку стабильность серверов GPU довольно низка, любые сбои могут привести к прерыванию тренировок, увеличивая общее время тренировки. Кластеры высокопроизводительных вычислений могут предоставить клиентам более стабильные услуги, относительно сократив время тренировки и решив часть проблем с вычислительной мощностью."
В то же время, распределение ресурсов вычислительных карт также проверяет технические возможности поставщиков услуг. Один из руководителей интернет-решений сказал: "Наличие ресурсов вычислительных карт — это лишь одна сторона дела, как правильно распределить ресурсы карт и действительно использовать их — это более сложная основная способность и инженерная способность. Разделение одной карты на несколько маленьких карт для достижения распределенного тонкого распределения может дополнительно снизить стоимость вычислительной мощности."
Сеть также влияет на скорость и эффективность обучения больших моделей. Обучение больших моделей требует тысяч GPU-карт, и подключение сотен GPU-серверов предъявляет высокие требования к скорости сети; сетевые заторы могут серьезно повлиять на скорость и эффективность обучения.
Некоторые производители ищут новые пути, переходя от облачной архитектуры к архитектуре суперкомпьютеров, что также стало способом снижения затрат. При удовлетворении потребностей пользователей, для задач, не требующих высокой пропускной способности, и в сценариях параллельных задач, цена суперкомпьютерного облака составляет примерно половину стоимости облачного суперкомпьютера, а за счет оптимизации производительности можно увеличить коэффициент использования ресурсов с 30% до 60%.
Кроме того, некоторые производители выбирают использование отечественных платформ для обучения и вывода больших моделей, чтобы заменить дефицитные GPU от Nvidia. Один из руководителей компании заявил, что их совместно с Huawei разработанный интегрированный компьютер может выполнять обучение и вывод на отечественной платформе, а производительность GPU от Huawei уже может соперничать с Nvidia.
Каждый из вышеупомянутых методов является довольно крупным проектом, и обычным компаниям трудно удовлетворить потребности, создавая собственные центры обработки данных. Многие команды алгоритмов выбирают поддержку профессиональных поставщиков вычислительной мощности. Параллельное хранение также представляет собой значительные затраты и технологические вызовы, кроме того, необходимо учитывать затраты на электроэнергию в зонах доступности IDC, затраты на программные платформы, затраты на персонал и другие операционные расходы.
Тысячи калорий уровня GPU кластеры могут обеспечить эффект масштаба, выбор поставщика вычислительной мощности означает, что предельные издержки стремятся к нулю.
Один из академиков отметил, что AIGC приводит к взрыву в индустрии искусственного интеллекта, в то время как массовое применение интеллектуальных технологий сталкивается с типичной проблемой долгого хвоста. Секторы, научные учреждения и крупные и средние предприятия с мощными AI-способностями составляют лишь около 20% от основного спроса на вычислительную мощность, а остальные 80% приходятся на малые и средние предприятия. Эти субъекты, ограниченные масштабом и бюджетом, часто испытывают трудности с доступом к ресурсам вычислительной мощности или сталкиваются с высокими ценами, что затрудняет получение выгод от развития в эпоху ИИ.
Поэтому, для реализации масштабного применения интеллектуальных технологий, чтобы индустрия искусственного интеллекта была одновременно "на слуху" и "в спросе", необходимы большие объемы дешевой и удобной вычислительной мощности, чтобы малые и средние предприятия также могли легко и недорого использовать вычислительную мощность.
Независимо от настоятельной потребности больших моделей в вычислительной мощности или различных проблем, которые необходимо решить в процессе применения вычислительной мощности, это отражает новое изменение: вычислительная мощность стала новой моделью обслуживания на рынке и в процессе технологической итерации.
Исследование новых моделей вычислительных мощностей
Что же такое вычислительная мощность большого модели, за которую мы боремся? Чтобы ответить на этот вопрос, нужно сначала поговорить о сервисах вычислительной мощности.
Вычислительная мощность делится на универсальную вычислительную мощность, интеллектуальную вычислительную мощность и супервычислительную мощность, и эти вычислительные мощности становятся услугой, что является результатом двойного воздействия рынка и технологий.
Отраслевой белый документ определяет вычислительную мощность как: новую область вычислительной индустрии, основанную на разнообразной вычислительной мощности, связанной через сеть вычислительной мощности, с целью предоставления эффективной вычислительной мощности.
Суть услуги вычислительной мощности заключается в реализации унифицированного вывода гетерогенной вычислительной мощности с помощью новых вычислительных технологий и их пересечении с облачными, большими данными, AI и другими технологиями. Услуга вычислительной мощности включает не только вычислительную мощность, но и единую упаковку ресурсов, таких как вычислительная мощность, хранение, сеть, в форме услуги (, например, API ) для выполнения доставки вычислительной мощности.
Поняв это, можно заметить, что значительная часть тех, кто борется за чипы NVIDIA, - это поставщики вычислительной мощности, то есть производители вычислительной мощности. На самом деле, пользователям отрасли, которые обращаются к API вычислительной мощности на фронте, нужно только представить соответствующий запрос на вычислительную мощность.
Согласно информации, с точки зрения программного обеспечения, все программные взаимодействия, создающие большие модели, делятся на три типа: первое - вызовы API больших моделей, у каждой компании есть свои расценки, расчет производится по цене; второе - собственные небольшие модели, покупка вычислительной мощности, даже собственное развертывание; третье - сотрудничество между производителями больших моделей и облачными провайдерами, то есть специализированные облачные решения, с ежемесячной оплатой. Один из руководителей офисного программного обеспечения заявил, что они в основном используют вызовы API, а внутренние небольшие модели создают платформу для распределения вычислительной мощности.
То есть, в структуре цепочки поставок вычислительной мощности, upstream-компании в основном обеспечивают поставку ресурсов поддержки вычислительных услуг, таких как общая вычислительная мощность, интеллектуальная вычислительная мощность, супервычислительная мощность, хранение и сеть. Например, в борьбе за вычислительную мощность больших моделей, Nvidia является upstream-поставщиком основных ресурсов вычислительной мощности, поставляя чипы в отрасль.
Средние компании в области вычислительных услуг в основном являются облачными провайдерами и новыми поставщиками вычислительной мощности. Они реализуют производство вычислительной мощности с помощью технологий оркестрации, диспетчеризации и торговли вычислительной мощностью, а также предоставляют вычислительную мощность через API и другие способы. Чем выше способность к сервису у средних компаний в области вычислительных услуг, тем ниже порог для приложений, что способствует более широкому и повсеместному развитию вычислительной мощности.
Нижестоящие предприятия зависят от вычислительной мощности, предоставляемой сервисами, для производства добавленной стоимости в цепочке поставок, например, пользователи отрасли и т.д. Эта часть пользователей должна просто заявить о своих потребностях, а производители вычислительной мощности соответственно настраивают необходимую вычислительную мощность для выполнения "вычислительных задач", поставленных пользователями.
Это имеет более низкие затраты и технические преимущества, чем самостоятельная покупка серверов для создания вычислительной мощности для больших моделей.
Вычислительная мощность бизнес-модели итерации
В качестве примера можно привести одну из ранних моделей общего назначения, согласно публичной информации, она использовала услуги нескольких основных поставщиков вычислительной мощности AI в стране. Осведомленные источники сообщают, что теоретически она могла использовать услуги всех основных поставщиков вычислительной мощности / облачных сервисов.
Оплата по мере использования и годовая или месячная подписка — это основные модели вычислительных услуг в настоящее время, и существует два основных типа потребностей: первое — выбрать соответствующий экземпляр вычислительных услуг, например, высокопроизводительные GPU-серверы с графическими картами Nvidia A800, A100 и V100, предоставляемые некоторыми облачными провайдерами; второе — выбрать соответствующую платформу MaaS, чтобы провести отраслевую настройку больших моделей на платформе.
Текущая отрасль также продвигает интеграцию вычислительных услуг «интеграция вычислений и сети», через комплексное оценивание информации о вычислительных задачах, состоянии ресурсов сети и т.д., формируя планы оркестрации вычислений и сети, которые могут поддерживать планирование между архитектурами, регионами и поставщиками услуг, а также завершать развертывание соответствующих ресурсов. Например, достаточно внести предоплату, чтобы в любой момент вызывать ресурсы в разделах вычислительной сети, выбирая наиболее подходящий, быстрый или эффективный с точки зрения затрат раздел в зависимости от особенностей приложения, с учетом оплаты по времени и вычитанием расходов из предоплаченной суммы.
Облачные провайдеры также действуют так, услуги вычислительной мощности как уникальный продукт облачных услуг позволяют им быстро участвовать в цепочке производства вычислительной мощности.
Согласно данным Министерства промышленности и информационных технологий, в 2022 году общая вычислительная мощность Китая достигла 180 EFLOPS, что ставит страну на второе место в мире. На конец 2022 года объем рынка вычислительной мощности в Китае составил 1,8 триллиона юаней. Вычислительная мощность крупных моделей в значительной степени ускорила развитие индустрии вычислительной мощности.
Существует мнение, что текущие услуги вычислительной мощности на самом деле представляют собой новую модель "продажа электроэнергии". Просто в зависимости от распределения обязанностей некоторые поставщики услуг вычислительной мощности могут быть обязаны предоставлять пользователям больше работ по техническому обслуживанию последней мили, таких как настройка системной производительности, установка программного обеспечения, мониторинг выполнения крупных задач и анализ эксплуатационных характеристик.
С увеличением потребности в высокопроизводительных вычислениях для больших моделей, услуги вычислительной мощности, возникшие на базе облачных сервисов, быстро стали известны широкой аудитории, сформировав уникальную индустриальную цепочку и бизнес-модель. Однако в начале взрыва вычислительной индустрии, вызванного большими моделями, нехватка высококлассных GPU, высокие затраты на вычислительную мощность и борьба за чипы создали уникальную картину этого времени.
Некоторые осведомленные лица комментируют: "В настоящее время конкуренция заключается в том, кто сможет получить GPU-карты в цепочке поставок, Nvidia является нынешним королем всей отрасли, контролируя весь рынок, такова реальность." В условиях нехватки, кто сможет получить GPU-карты, тот сможет предоставить услуги.
Но не все спешат скупать GPU-карты, потому что нехватка временная, проблема в конечном итоге будет решена. "Долгосрочные исследователи на самом деле не торопятся с покупками, они могут спокойно подождать, потому что они не обанкротятся. В настоящее время основными покупателями GPU-карт являются стартапы, которым необходимо обеспечить свое выживание до следующего года", - отметил указанный источник.
Среди множества неопределенностей вычислительная мощность становится определенной тенденцией как услуга, провайдеры вычислительной мощности должны заранее подготовиться к тому, чтобы быть готовыми к возвращению больших моделей к рациональности и быстрому изменению рыночного направления.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
13 Лайков
Награда
13
4
Поделиться
комментарий
0/400
FlashLoanPrince
· 22ч назад
Две сотни миллионов - это еще немного, жечь деньги.
Посмотреть ОригиналОтветить0
FromMinerToFarmer
· 22ч назад
Два миллиона, как вы это себе представляете? Сжигать деньги?
Посмотреть ОригиналОтветить0
GasFeePhobia
· 22ч назад
Сожженные шахты, умираю от голода.
Посмотреть ОригиналОтветить0
EntryPositionAnalyst
· 22ч назад
Так это просто внутреннее соревнование по сжиганию денег?
Возможности большого моделирования на фоне нехватки вычислительной мощности: восходящий новый сервисный режим вычислительной мощности
Вычислительная мощность сервисов становится новой бизнес-моделью, как перейти к ней после горячей волны "炼丹" больших моделей?
В последнее время, используя 40-летние данные о погоде по всему миру и применяя 200 графических процессоров (GPU) в течение примерно 2 месяцев для предварительного обучения, был создан большой метеорологический модель с параметрами в миллиардах. Это опыт молодого человека, который окончил Университет Цинхуа 3 года назад, по обучению большой модели.
С точки зрения затрат, при расчете 7,8 юаней за час на одну графическую процессор, стоимость обучения этой метеорологической модели может превысить 2 миллиона юаней. А если речь идет о обучении универсальной модели, затраты могут увеличиться в сто раз.
Данные показывают, что в Китае в настоящее время существует более 100 больших моделей с масштабом в 10 миллиардов параметров. Однако бум в индустрии по созданию больших моделей сталкивается с проблемой нехватки высокопроизводительных GPU. Высокие затраты на вычислительную мощность и нехватка вычислительных ресурсов и средств стали наиболее очевидной проблемой, стоящей перед отраслью.
Дефицит высококлассных GPU
"Действительно, нехватка есть, но мы ничего не можем с этим поделать." Так ответил один из высокопоставленных руководителей крупной компании на вопрос о нехватке GPU.
Это, похоже, стало общепризнанной проблемой в отрасли. В пиковые моменты цена одной видеокарты NVIDIA A100 взлетела до 200-300 тысяч юаней, а месячная аренда одного сервера A100 также поднялась до 50-70 тысяч юаней. Тем не менее, даже высокая цена не всегда гарантирует покупку чипа, некоторые поставщики вычислительной мощности даже сталкивались с редкими случаями нарушения обязательств со стороны поставщиков.
Один из руководителей в области облачных вычислений также заявил: "Вычислительная мощность действительно отсутствует. Многие клиенты хотят ресурсы высокопроизводительных GPU, но мы в настоящее время не можем полностью удовлетворить широкий рынок."
В краткосрочной перспективе нехватка высококлассных GPU будет трудно решена по всей отрасли. Всплеск интереса к большим моделям быстро увеличил спрос на вычислительную мощность, однако темпы роста предложения значительно отстают. Хотя в долгосрочной перспективе предложение вычислительной мощности, безусловно, перейдет от рынка продавцов к рынку покупателей, пока неизвестно, сколько времени займет этот процесс.
Все компании подсчитывают, сколько у них GPU от Nvidia, и на основе этого оценивают свою долю на рынке. Один из осведомленных источников привел пример: "Если у вас почти 10 тысяч карт, а общий объем рынка составляет 100 тысяч, то доля составит 10%. Если к концу года количество достигнет 40 тысяч, а общий объем рынка будет 200 тысяч, то это может составить 20% доли рынка."
С одной стороны, невозможно купить GPU-карты, с другой стороны, порог входа в обучение больших моделей вовсе не так прост, как это рекламируется в отрасли. Упомянутые ранее затраты на обучение метеорологической большой модели могут превышать 2 миллиона юаней, но стоит отметить, что это модель вертикальной области, обученная на основе общего большого модели с параметрами на уровне сотен миллионов. Если нужно обучить общую большую модель с миллиардом или большим количеством параметров, затраты могут увеличиться в десять, сто раз.
Некоторые высокопоставленные чиновники технологической компании сообщили: "На данный момент наибольшие инвестиции идут в обучение моделей, без вложений в десятки миллиардов капитала трудно продолжать развивать большие модели."
Предприниматель описал текущую конкурентную ситуацию в области крупных моделей следующим образом: "Чтобы двигаться быстро, нужно добиться результатов до того, как деньги закончатся, чтобы получить следующий раунд 'финансирования'. Если нет поддержки в сотни миллиардов или тысячу миллиардов, этот путь будет сложно пройти."
В данной ситуации в отрасли широко считается, что с конкуренцией на рынке крупных моделей рынок также перейдет от энтузиазма к рациональности, и компании будут контролировать затраты и корректировать стратегии в зависимости от изменений ожиданий.
Активные меры по борьбе с нехваткой вычислительной мощности
Нет условий, но нужно создать условия — похоже, это психология большинства участников больших моделей. Компании ищут способы справиться с реальными проблемами.
Из-за нехватки высококачественных графических процессоров (GPU) и того, что доступные на китайском рынке GPU не являются последним поколением, их производительность обычно ниже, компании нуждаются в большем времени для обучения больших моделей. Эти компании также ищут инновационные методы, чтобы компенсировать недостаток вычислительной мощности.
Один из способов заключается в использовании данных более высокого качества для обучения, что повышает эффективность обучения. Недавно опубликованный отраслевой отчет предлагает ввести ручную маркировку и подтверждение в отношении качества данных, выбирая определенный процент из исходных данных для маркировки и создавая набор данных высокого качества.
Кроме снижения затрат на большие модели за счет высококачественных данных, повышение инфраструктурных возможностей и обеспечение стабильной работы свыше 1000 калорий в течение двух недель без сбоев также являются техническими сложностями и направлениями оптимизации.
Один из руководителей облачного сервиса сказал: "Как облачный сервис, мы поможем клиентам создать стабильную и надежную инфраструктуру. Поскольку стабильность серверов GPU довольно низка, любые сбои могут привести к прерыванию тренировок, увеличивая общее время тренировки. Кластеры высокопроизводительных вычислений могут предоставить клиентам более стабильные услуги, относительно сократив время тренировки и решив часть проблем с вычислительной мощностью."
В то же время, распределение ресурсов вычислительных карт также проверяет технические возможности поставщиков услуг. Один из руководителей интернет-решений сказал: "Наличие ресурсов вычислительных карт — это лишь одна сторона дела, как правильно распределить ресурсы карт и действительно использовать их — это более сложная основная способность и инженерная способность. Разделение одной карты на несколько маленьких карт для достижения распределенного тонкого распределения может дополнительно снизить стоимость вычислительной мощности."
Сеть также влияет на скорость и эффективность обучения больших моделей. Обучение больших моделей требует тысяч GPU-карт, и подключение сотен GPU-серверов предъявляет высокие требования к скорости сети; сетевые заторы могут серьезно повлиять на скорость и эффективность обучения.
Некоторые производители ищут новые пути, переходя от облачной архитектуры к архитектуре суперкомпьютеров, что также стало способом снижения затрат. При удовлетворении потребностей пользователей, для задач, не требующих высокой пропускной способности, и в сценариях параллельных задач, цена суперкомпьютерного облака составляет примерно половину стоимости облачного суперкомпьютера, а за счет оптимизации производительности можно увеличить коэффициент использования ресурсов с 30% до 60%.
Кроме того, некоторые производители выбирают использование отечественных платформ для обучения и вывода больших моделей, чтобы заменить дефицитные GPU от Nvidia. Один из руководителей компании заявил, что их совместно с Huawei разработанный интегрированный компьютер может выполнять обучение и вывод на отечественной платформе, а производительность GPU от Huawei уже может соперничать с Nvidia.
Каждый из вышеупомянутых методов является довольно крупным проектом, и обычным компаниям трудно удовлетворить потребности, создавая собственные центры обработки данных. Многие команды алгоритмов выбирают поддержку профессиональных поставщиков вычислительной мощности. Параллельное хранение также представляет собой значительные затраты и технологические вызовы, кроме того, необходимо учитывать затраты на электроэнергию в зонах доступности IDC, затраты на программные платформы, затраты на персонал и другие операционные расходы.
Тысячи калорий уровня GPU кластеры могут обеспечить эффект масштаба, выбор поставщика вычислительной мощности означает, что предельные издержки стремятся к нулю.
Один из академиков отметил, что AIGC приводит к взрыву в индустрии искусственного интеллекта, в то время как массовое применение интеллектуальных технологий сталкивается с типичной проблемой долгого хвоста. Секторы, научные учреждения и крупные и средние предприятия с мощными AI-способностями составляют лишь около 20% от основного спроса на вычислительную мощность, а остальные 80% приходятся на малые и средние предприятия. Эти субъекты, ограниченные масштабом и бюджетом, часто испытывают трудности с доступом к ресурсам вычислительной мощности или сталкиваются с высокими ценами, что затрудняет получение выгод от развития в эпоху ИИ.
Поэтому, для реализации масштабного применения интеллектуальных технологий, чтобы индустрия искусственного интеллекта была одновременно "на слуху" и "в спросе", необходимы большие объемы дешевой и удобной вычислительной мощности, чтобы малые и средние предприятия также могли легко и недорого использовать вычислительную мощность.
Независимо от настоятельной потребности больших моделей в вычислительной мощности или различных проблем, которые необходимо решить в процессе применения вычислительной мощности, это отражает новое изменение: вычислительная мощность стала новой моделью обслуживания на рынке и в процессе технологической итерации.
Исследование новых моделей вычислительных мощностей
Что же такое вычислительная мощность большого модели, за которую мы боремся? Чтобы ответить на этот вопрос, нужно сначала поговорить о сервисах вычислительной мощности.
Вычислительная мощность делится на универсальную вычислительную мощность, интеллектуальную вычислительную мощность и супервычислительную мощность, и эти вычислительные мощности становятся услугой, что является результатом двойного воздействия рынка и технологий.
Отраслевой белый документ определяет вычислительную мощность как: новую область вычислительной индустрии, основанную на разнообразной вычислительной мощности, связанной через сеть вычислительной мощности, с целью предоставления эффективной вычислительной мощности.
Суть услуги вычислительной мощности заключается в реализации унифицированного вывода гетерогенной вычислительной мощности с помощью новых вычислительных технологий и их пересечении с облачными, большими данными, AI и другими технологиями. Услуга вычислительной мощности включает не только вычислительную мощность, но и единую упаковку ресурсов, таких как вычислительная мощность, хранение, сеть, в форме услуги (, например, API ) для выполнения доставки вычислительной мощности.
Поняв это, можно заметить, что значительная часть тех, кто борется за чипы NVIDIA, - это поставщики вычислительной мощности, то есть производители вычислительной мощности. На самом деле, пользователям отрасли, которые обращаются к API вычислительной мощности на фронте, нужно только представить соответствующий запрос на вычислительную мощность.
Согласно информации, с точки зрения программного обеспечения, все программные взаимодействия, создающие большие модели, делятся на три типа: первое - вызовы API больших моделей, у каждой компании есть свои расценки, расчет производится по цене; второе - собственные небольшие модели, покупка вычислительной мощности, даже собственное развертывание; третье - сотрудничество между производителями больших моделей и облачными провайдерами, то есть специализированные облачные решения, с ежемесячной оплатой. Один из руководителей офисного программного обеспечения заявил, что они в основном используют вызовы API, а внутренние небольшие модели создают платформу для распределения вычислительной мощности.
То есть, в структуре цепочки поставок вычислительной мощности, upstream-компании в основном обеспечивают поставку ресурсов поддержки вычислительных услуг, таких как общая вычислительная мощность, интеллектуальная вычислительная мощность, супервычислительная мощность, хранение и сеть. Например, в борьбе за вычислительную мощность больших моделей, Nvidia является upstream-поставщиком основных ресурсов вычислительной мощности, поставляя чипы в отрасль.
Средние компании в области вычислительных услуг в основном являются облачными провайдерами и новыми поставщиками вычислительной мощности. Они реализуют производство вычислительной мощности с помощью технологий оркестрации, диспетчеризации и торговли вычислительной мощностью, а также предоставляют вычислительную мощность через API и другие способы. Чем выше способность к сервису у средних компаний в области вычислительных услуг, тем ниже порог для приложений, что способствует более широкому и повсеместному развитию вычислительной мощности.
Нижестоящие предприятия зависят от вычислительной мощности, предоставляемой сервисами, для производства добавленной стоимости в цепочке поставок, например, пользователи отрасли и т.д. Эта часть пользователей должна просто заявить о своих потребностях, а производители вычислительной мощности соответственно настраивают необходимую вычислительную мощность для выполнения "вычислительных задач", поставленных пользователями.
Это имеет более низкие затраты и технические преимущества, чем самостоятельная покупка серверов для создания вычислительной мощности для больших моделей.
Вычислительная мощность бизнес-модели итерации
В качестве примера можно привести одну из ранних моделей общего назначения, согласно публичной информации, она использовала услуги нескольких основных поставщиков вычислительной мощности AI в стране. Осведомленные источники сообщают, что теоретически она могла использовать услуги всех основных поставщиков вычислительной мощности / облачных сервисов.
Оплата по мере использования и годовая или месячная подписка — это основные модели вычислительных услуг в настоящее время, и существует два основных типа потребностей: первое — выбрать соответствующий экземпляр вычислительных услуг, например, высокопроизводительные GPU-серверы с графическими картами Nvidia A800, A100 и V100, предоставляемые некоторыми облачными провайдерами; второе — выбрать соответствующую платформу MaaS, чтобы провести отраслевую настройку больших моделей на платформе.
Текущая отрасль также продвигает интеграцию вычислительных услуг «интеграция вычислений и сети», через комплексное оценивание информации о вычислительных задачах, состоянии ресурсов сети и т.д., формируя планы оркестрации вычислений и сети, которые могут поддерживать планирование между архитектурами, регионами и поставщиками услуг, а также завершать развертывание соответствующих ресурсов. Например, достаточно внести предоплату, чтобы в любой момент вызывать ресурсы в разделах вычислительной сети, выбирая наиболее подходящий, быстрый или эффективный с точки зрения затрат раздел в зависимости от особенностей приложения, с учетом оплаты по времени и вычитанием расходов из предоплаченной суммы.
Облачные провайдеры также действуют так, услуги вычислительной мощности как уникальный продукт облачных услуг позволяют им быстро участвовать в цепочке производства вычислительной мощности.
Согласно данным Министерства промышленности и информационных технологий, в 2022 году общая вычислительная мощность Китая достигла 180 EFLOPS, что ставит страну на второе место в мире. На конец 2022 года объем рынка вычислительной мощности в Китае составил 1,8 триллиона юаней. Вычислительная мощность крупных моделей в значительной степени ускорила развитие индустрии вычислительной мощности.
Существует мнение, что текущие услуги вычислительной мощности на самом деле представляют собой новую модель "продажа электроэнергии". Просто в зависимости от распределения обязанностей некоторые поставщики услуг вычислительной мощности могут быть обязаны предоставлять пользователям больше работ по техническому обслуживанию последней мили, таких как настройка системной производительности, установка программного обеспечения, мониторинг выполнения крупных задач и анализ эксплуатационных характеристик.
С увеличением потребности в высокопроизводительных вычислениях для больших моделей, услуги вычислительной мощности, возникшие на базе облачных сервисов, быстро стали известны широкой аудитории, сформировав уникальную индустриальную цепочку и бизнес-модель. Однако в начале взрыва вычислительной индустрии, вызванного большими моделями, нехватка высококлассных GPU, высокие затраты на вычислительную мощность и борьба за чипы создали уникальную картину этого времени.
Некоторые осведомленные лица комментируют: "В настоящее время конкуренция заключается в том, кто сможет получить GPU-карты в цепочке поставок, Nvidia является нынешним королем всей отрасли, контролируя весь рынок, такова реальность." В условиях нехватки, кто сможет получить GPU-карты, тот сможет предоставить услуги.
Но не все спешат скупать GPU-карты, потому что нехватка временная, проблема в конечном итоге будет решена. "Долгосрочные исследователи на самом деле не торопятся с покупками, они могут спокойно подождать, потому что они не обанкротятся. В настоящее время основными покупателями GPU-карт являются стартапы, которым необходимо обеспечить свое выживание до следующего года", - отметил указанный источник.
Среди множества неопределенностей вычислительная мощность становится определенной тенденцией как услуга, провайдеры вычислительной мощности должны заранее подготовиться к тому, чтобы быть готовыми к возвращению больших моделей к рациональности и быстрому изменению рыночного направления.