In einem globalen Kontext, der zunehmend von dem technologischen Wettbewerb zwischen den Vereinigten Staaten und China geprägt ist, unternimmt die Ant Group, die von Alibaba kontrolliert wird, bedeutende Schritte, um ihre Abhängigkeit von amerikanischen Chips zu verringern und die Kosten bei der Entwicklung von künstlicher Intelligenz (AI)-Modellen zu kontrollieren.
Laut Quellen, die dem Unternehmen nahe stehen, verlässt sich Ant auf semiconduttori cinesi, um seine fortschrittlichen Sprachmodelle zu trainieren, und verwendet einen Ansatz, der verspricht, die Art und Weise, wie KI im asiatischen Land produziert wird, zu revolutionieren.
Strategischer Wendepunkt im Training von KI-Modellen für die Ant Group
In den letzten Monaten hat die Ant Group Chips von lokalen Unternehmen übernommen, darunter auch Unternehmen, die mit Alibaba und Huawei Technologies verbunden sind, um ihre KI-Modelle mit der Mixture of Experts (MoE) Technik zu trainieren.
Dieser Ansatz, der unter Forschern zunehmend verbreitet ist, ermöglicht eine effektive Aufteilung von Aufgaben zwischen verschiedenen “Experten” innerhalb des Modells, wodurch die rechnerische Effizienz verbessert wird.
Die Quellen versichern, dass die Ergebnisse dieser Modelle nicht nur mit denen verglichen werden können, die mit den Nvidia H800-Chips erzielt wurden. In einigen Tests hätten sie jedoch sogar die Leistung der von Meta entwickelten Modelle übertroffen.
Obwohl Bloomberg News diese Leistungen nicht unabhängig verifiziert hat, deuten die Daten auf einen erheblichen Fortschritt in Chinas Versuch hin, die Betriebskosten zu senken und die technologische Abhängigkeit zu verringern.
Die MoE-Technik ist inspiriert von dem Prinzip der spezialisierten Delegation: Jedes Teilmodul des Modells ist für einen bestimmten Teil der Verarbeitung verantwortlich, was eine größere Skalierbarkeit und Effizienz im Vergleich zu traditionellen Ansätzen ermöglicht.
Neben der Ant Group setzen auch Google und das chinesische Startup DeepSeek aus Hangzhou diese Methodik ein.
Ant hat sein Engagement für die wissenschaftliche Verbreitung hervorgehoben, indem es ein Papier veröffentlicht hat, das das Ziel betont, Modelle ohne den Einsatz von High-End-GPUs zu skalieren.
Dieser Ansatz wird für Unternehmen entscheidend, die sich aufgrund hoher Kosten leistungsstarke Hardware nicht dauerhaft leisten können.
China vs Vereinigte Staaten: lokale Chips gegen amerikanische GPUs
Die Initiative von Ant fügt sich in einen geopolitischen Kontext ein, in dem chinesische Technologieunternehmen versuchen, die US-Beschränkungen beim Export von fortschrittlichen Chips, wie dem Nvidia H800, zu umgehen.
Auch wenn es nicht der fortschrittlichste Chip auf dem Markt ist, ist die H800 immer noch eine der leistungsstärksten GPUs, die in China erhältlich sind.
Obwohl die Ant Group weiterhin einen Teil ihrer KI-Produktion auf Basis von Nvidia-Chips aufrechterhält, richtet sich das Unternehmen zunehmend auf wirtschaftlichere und leichter zugängliche Alternativen aus. Wie die von AMD und chinesischen Herstellern.
Diese strategische Entscheidung markiert einen Bruch mit der Vision von Nvidias CEO, Jensen Huang, gemäß der Unternehmen weiterhin immer mehr Rechenleistung nachfragen werden.
Laut Huang werden die Kundeninvestitionen nicht sinken, selbst mit dem Auftauchen effizienterer Modelle wie dem DeepSeek R1. Dies zeigt einen klaren Kontrast zur Philosophie, die von Ant angenommen wurde.
Eines der Highlights von Ants Analyse betrifft die erhebliche Reduzierung der Kosten für das Training von KI-Modellen.
Laut dem veröffentlichten Dokument kostet das Trainieren eines Modells mit einer Billion Token, den grundlegenden Einheiten, die für das Lernen verwendet werden, traditionell etwa 6,35 Millionen Yuan ( etwa 880.000 Dollar ).
Durch den Einsatz weniger leistungsfähiger Chips, die jedoch für die MoE-Methode optimiert sind, wurden die Kosten auf 5,1 Millionen Yuan gesenkt.
Eine nicht marginale Einsparung, die den Zugang zu künstlicher Intelligenz insbesondere für Startups und aufstrebende Industriezweige revolutionieren könnte.
Die entwickelten Modelle, Ling-Lite und Ling-Plus, wurden für Anwendungen in Bereichen wie Gesundheitswesen und Finanzen konzipiert, zwei Bereiche, in denen die Leistungsfähigkeit von KI konkrete und sofortige Lösungen bieten kann.
Genau im Gesundheitswesen hat Ant kürzlich Haodf.com übernommen, eine der führenden Online-Medizinplattformen in China. Damit wird das Interesse an der Erweiterung des Angebots an Lösungen auf der Grundlage künstlicher Intelligenz bestätigt.
Zu den bestehenden Dienstleistungen des Unternehmens gehören auch Zhixiaobao, ein virtueller Assistent, und die Finanzberatungsplattform Maxiaocai.
“html Öffnung und Zukunft der chinesischen künstlichen Intelligenz “
Ein weiterer bemerkenswerter Punkt von Ants Strategie ist die Entscheidung, ihre Modelle als Open Source anzubieten: Ling-Lite hat 16,8 Milliarden Parameter, während Ling-Plus 290 Milliarden erreicht.
Um einen Vergleich zu ziehen, wird geschätzt, dass GPT-4.5, das fortschrittliche Modell, das von OpenAI entwickelt wurde, etwa 1,8 Billionen Parameter hat. Obwohl es geschlossen und nicht für die Öffentlichkeit zugänglich ist. Die von Ant durchgeführten Forschungen sind nicht ohne Herausforderungen.
Die gleiche Studie zeigt, dass während des Trainings kleine Variationen in der Struktur der Modelle oder in der Art der Hardware die Leistung instabil machen können, wie zum Beispiel Spitzen in den Fehlerquoten.
Eine strukturelle Schwierigkeit, die aufzeigt, wie trotz des Fortschritts selbst die fortschrittlichsten Modelle ständige Aufmerksamkeit erfordern.
Wie von Robin Yu, CTO des Pekinger Technologieunternehmens Shengshang Tech, beobachtet, sind die greifbaren Ergebnisse, die in der realen Welt erzielt werden, das, was wirklich zählt:
„Wenn du einen Schwachpunkt findest, um den besten Kung-Fu-Meister der Welt zu besiegen, hast du trotzdem gewonnen.“
Eine effektive Metapher, die den Wert praktischer Anwendungen im Vergleich zu bloßen theoretischen Vergleichen betont.
Was deutlich zutage tritt, ist, dass die Ant Group eine Schlüsselrolle im Bestreben Chinas spielt, technologisch autonomer zu werden.
Folglich ein zugänglicheres KI-System anzustreben, das weniger von westlicher Hardware abhängig ist und potenziell effizienter für die strategischen Industriesektoren der Zukunft.
Die Herausforderung an die westlichen KI-Giganten ist gestartet: nicht, sie mit roher Gewalt zu übertreffen, sondern mit Intelligenz, Effizienz und strategischer Vision.