Токен став «пожирачем золота» — обчислювальні потужності великих компаній зросли безумовно

robot
Генерація анотацій у процесі

Чи помітили ви, що за ці пів року стиль у спільноті AI став трохи занадто швидким?

Цього ж часу минулого року всі влаштовували святкування через падіння цін на обчислювальні потужності. Aliyun першою кричала “максимальне зниження на 60%”, Tencent Cloud, Huawei Cloud і Baidu Cloud синхронно підтягнулися — той розмах був просто як розпродаж на “Двійці одинадцять”. У підприємницьких чатах щодня хтось викладав рахунки: “Дивіться, я витратив лише кілька центов за своїх 1M Token!” Тоді всі вважали, що весна для AI-стартапів настала: обчислювальні потужності такі ж дешеві, як капуста. Хто після цього не зможе зробити застосунок на великій моделі?

А що вийшло? Удар по обличчю прийшов надто швидко.

Минулого місяця вітер раптом повернувся на 180 градусів. Google, Amazon, Tencent, Alibaba, Baidu — за 10 днів усі опублікували повідомлення про підвищення цін. Наскільки? Переважно на 30%–50%. Найжорсткіше — Tencent Cloud: у них один ключовий продукт підняли прямо на 400%.

Від “стрибка з балкона зі шаленими розпродажами” до “підвищення цін у стилі ракети” — менше ніж за рік. Що саме сталося? Хто штовхає ціни вгору? І ще важливіше: у цій хвилі підвищення цін — кому найгірше, а хто, навпаки, потай усміхається?

Минулого року ще “скидали ціною”, а цього року чому всі разом підвищують?

Спершу коротко згадаємо цю історію “розвороту”.

У квітні 2025 року Aliyun першою кинула бомбу: у ключових продуктах максимальне зниження цін — 60%. Це не “дрібні поступки”, а цілком реальне “половина ціни — і ще знижка”. Далі JD Cloud сказала: “Можна знижувати скільки завгодно, я теж”. Tencent Cloud, Huawei Cloud, Baidu Cloud — усі пішли за ними. У той момент на ринку обчислювальних потужностей панувала димова завіса, а цінова війна була просто надто гучною.

Які були тоді гасла? “Щоб AI був доступний” “Обчислювальні потужності — для всіх”. Багато стартапів справді повірили й почали масштабно “палити” Token, запускати моделі.

Та безкоштовний обід ніколи не триває довго.

У січні 2026 Amazon AWS тихенько зробила крок — без жодної пресконференції, без жодних попереджень: напряму підняла ціну серверів EC2 приблизно на 15%. Навіть якщо різниця не виглядає великою, сенс колосальний: це вперше за близько двадцять років, коли індустрія хмарних сервісів підвищує ціни. Знайте, що за минулі двадцять років AWS знижувала ціни понад сто разів — і це завжди рухалося лише вниз, ніколи не було “вгору”.

Це, мов доміно, підштовхнуло ланцюжок.

11 березня Tencent Cloud теж підхопила тренд: ціна входу для моделі Tencent HY2.0 Instruct у них з 0.0008 юаня/1000 tokens піднялася до 0.004505 юаня/1000 tokens — зростання на 463%, тобто більше ніж у чотири рази. 18 березня Aliyun оголосила, що для продуктів із обчислювальними картами ціни підвищаться на 5% до 34%, і Baidu Intelligent Cloud теж піднялися на 5% до 30%. Усі ті великі моделі, які раніше давали безкоштовні публічні тести, наприклад GLM 5, MiniMax 2.5, Kimi 2.5, завершили “період безкоштовного користування” і перейшли до офіційного платного білінгу.

Від “змагалися, хто більше знижує” до “змагалися, хто більше підвищує” — чому зміни стали такими швидкими?

На поверхні це схоже на те, що хмарні вендори не тягнуть. GPU-чипи стають дедалі дорожчими, електроенергія в дата-центрах становить 40%–60% операційних витрат, а плюс ще в другій половині 2025 року почали рости ціни на чипи пам’яті — тиск на витратну частину стає відчутним. Але насправді, щоб підвищення цін стало “вимушеним”, є інша, більш базова причина — обчислювальних потужностей справді не вистачає.

Хто шалено “споживає” Token? Правда про 140 трильйонів

Раніше ж не говорили, що обчислювальних потужностей забагато? То чому раптом їх стало не вистачати?

Відповідь така: Token з’їдають надто швидко.

За даними, розкритими цього березня керівником Держуправління національного розвитку і реформ Китаю Лю Ліченом: до березня 2026 щоденний обсяг викликів Token у Китаї вже перевищив 140 трильйонів.

Наскільки це шокуюче? Ось два орієнтири:

· на початку 2024 року це число було лише 100 мільярдів. За два роки воно виросло більш ніж у тисячу разів.

· наприкінці 2025 року це число становило 100 трильйонів. Тобто лише за минулі три місяці зростання склало ще 40% — і всі додані за ці три місяці обсяги (40 трильйонів) дорівнюють 400 разів від обсягу всього за початок 2024 року.

Це не лінійний ріст — це цунамі.

Тож виникає питання: хто шалено витрачає Token?

Відповідь — одне слово: інтелектуальні агенти (Agent).

Від минулого року відкриті агенти на кшталт OpenClaw (у народі “рак”) стали неймовірно популярними. AI з робота, який лише “чатиться”, перетворився на помічника, який “робить справи” — допомагає забронювати авіаквиток, написати код, зробити PPT, проаналізувати дані… Звучить круто, правда? Але ціною цього є те, що коли агент робить навіть просту задачу, кількість Token, що споживаються, у 10–100 разів більша, ніж при звичайній розмові.

Візьмемо приклад: попросити AI написати скрипт-павука. Якщо це звичайна розмова, він дає вам фрагмент коду, ви копіюєте й уходите — споживання становить кілька сотень Token. Але якщо це агент, він сам запускає код, ловить помилку, проводить дебаг, запускає знову… туди-сюди, десятки ітерацій. Витрати Token одразу злітають до десятків тисяч.

А ще не кажучи вже про генерацію відео — справжній “пожирач бюджету”. Є оцінки, що на створення 1 хвилини відео потрібно приблизно 10 трильйонів Token. А нині відеомоделі: щоб згенерувати 5 секунд, з вас беруть від кількох центов до кількох юанів — це не заробіток, це радше “втрачаючи гроші, купують популярність”. Але кількість користувачів зростає, і відео, музика, код, аналіз даних… кожний напрям шалено “їсть” Token.

Попит випереджає пропозицію — отже обчислювальні потужності закономірно ростуть у ціні. Це не змова — це голий дисбаланс попиту й пропозиції.

Змагання за “ранги” на обчислювальних потужностях: великі їдять м’ясо, а малим дістається навіть не суп

Підвищення цін для різних людей означає зовсім різне.

Для хмарних вендорів підвищення — радше хороша новина. Брокери порахували: якщо Aliyun підвищує ціну на 1%, її маржа прибутку зростає на 1 відсотковий пункт. Тому ви бачите дані: частка Aliyun не падає — навпаки, зростає. Вона вже займає 36% ринку AI-хмар у Китаї. А в більш точному сегменті, де мова про обсяги викликів AI, Volcano Engine (під ByteDance) — взагалі майже 50%, тобто половина всіх викликів Token у всьому Китаї проходить через їхні “труби”.

Паралельно частки Huawei Cloud і Tencent Cloud злегка знижуються. Ефект лідера стає дедалі сильнішим: великі гравці лише зміцнюються, ресурси ще більше концентруються.

А кому найгірше?

Середнім і малим AI-стартапам, а також тим, хто тільки зайшов у гру, “новачкам”.

Причина проста: підвищення цін безпосередньо піднімає їхні операційні витрати. Коли Token був дешевий, можна було без проблем проводити експерименти, без зайвих хвилювань тюнити моделі — бо це не коштувало багато. А тепер ціна виросла у кілька разів або навіть у десятки разів: кожне тренування, кожний інференс потрібно зважувати й прораховувати.

Ще складніше те, що у малих гравців немає переговорної сили. Великі клієнти можуть підписати з хмарними провайдерами довгострокові угоди та зафіксувати відносно пільгову ціну. Ти — зовсім молодий стартап: за рік на обчислювальні потужності витрачаєш десятки тисяч, хто тобі дасть знижку? Залишається лише чесно платити за цінами після підвищення.

Багато проєктів, які спочатку планували робити AI-застосунки, після підрахунку собівартості просто тихо відклали вбік. А деякі, що вже стартували, або скоротили масштаби, або тягнуть збитки на собі, як можуть. Але водночас кінцевий ринок надзвичайно конкурентний: ти не наважишся легко піднімати ціну для користувача — у сусіда ще безкоштовно, тож якщо ти почнеш брати оплату, користувачі всі підуть.

У підсумку весь тягар витрат доводиться ковтати самим.

Один фахівець поскаржився мені: “Раніше я думав, що обчислювальні потужності дешеві — отже поріг для стартапів низький. Тепер бачу: поріг не став нижчим. Тебе просто спершу впускають, а потім зачиняють двері”.

Це, по суті, жорстокий перегони за рангами. У минулі двадцять років хмарні вендори жили доволі комфортно завдяки стратегії “низька ціна за обсяг, спершу захопити ринок, потім стати прибутковими”. Але той час завершився. Обчислювальні потужності офіційно попрощалися з епохою субсидій і ввійшли в етап комерційного ціноутворення. Майбутня конкуренція — це вже не питання “хто дешевший”, а питання “у кого сервіс стабільніший”, “чия екосистема повніша”, “хто реально допоможе підприємствам використати кожну одиницю обчислювальних потужностей”.

І в цій гонитві за рангами малим гравцям, найімовірніше, не по дорозі.

Якщо озирнутися на цей рік з гіркою і з долиною, ви побачите доволі болючу правду:

Обчислювальні потужності від “ціни як за капусту” до “ціни як за ракету” — це, по суті, віддзеркалення того, як AI-індустрія з дикого зростання переходить до зрілості. Епоха безкоштовного завершилася — почалася конкуренція за цінністю. Бізнес-моделі, які жили на субсидіях, помруть. А продукти, які реально мають технології, сценарії та користувачів, виживуть у середовищі, де ростуть витрати на обчислювальні потужності — і навіть можуть вижити краще.

Ключова конкурентна перевага AI-стартапу завжди була не в тому, наскільки дешево є обчислювальні потужності, а в тому, що саме ви робите з ними.

У епоху обчислювальних потужностей Token справді дорогий. Але ще дорожче за Token — це мізки, які знають, як правильно використовувати Token.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Популярні активності Gate Fun

    Дізнатися більше
  • Рин. кап.:$2.23KХолдери:1
    0.00%
  • Рин. кап.:$2.26KХолдери:2
    0.07%
  • Рин. кап.:$2.22KХолдери:1
    0.00%
  • Рин. кап.:$2.23KХолдери:1
    0.00%
  • Рин. кап.:$2.23KХолдери:0
    0.00%
  • Закріпити