Zhipu, la cara oculta de la luna, y Xiaomi en la mesa redonda: los grandes modelos realmente comienzan a "trabajar", pero la capacidad de cálculo sigue siendo el mayor cuello de botella

DeepFlowTech · 2026-03-27T09:59:40+00:00

Autor: Chen JundaZhi Dongxi, 27 de marzo, reporta que hoy, en el Foro Zhongguancun, el CEO de Zhipu, Zhang Peng; el CEO de Moon's Dark Side, Yang Zhilin (moderador); la responsable del gran modelo MiMo de Xiaomi, Luo Fuli; Xia Lixue, CEO de Wuwen Xinqiong; y Huang Chao, profesor asistente de la Universidad de Hong Kong, compartieron una rara mesa redonda para discutir el futuro de los grandes modelos de código abierto y los agentes inteligentes.La conversación comenzó con el tema más popular actual, OpenClaw, y varios invitados coincidieron en que los agentes inteligentes realmente hacen que los grandes modelos "trabajen". OpenClaw amplía los límites de capacidad de los grandes modelos, pero también plantea requisitos más altos para los modelos. Zhipu está investigando capacidades como planificación a largo plazo y autoadaptación, mientras que el equipo de Luo Fuli se enfoca en reducir costos mediante innovación en la arquitectura, aumentar la velocidad e incluso lograr la autoevolución del modelo.La infraestructura también debe mantenerse al ritmo de los agentes inteligentes. Xia Lixue opina que ahora

DeepFlowTech

2026-03-27 09:59:40

作者：陈骏达

智东西 3月 27 日报道，今天，在中关村论坛上，智谱 CEO 张鹏、月之暗面 CEO 杨植麟（担任主持）、小米 MiMo 大模型负责人罗福莉、无问芯穹 CEO 夏立雪和香港大学助理教授黄超罕见同台，进行了一场围绕开源大模型与智能体未来走向的深度对话。

Esta es una conversación profunda sobre el futuro de los modelos de código abierto y los agentes, con la presencia de destacados líderes de la industria.

这场对话以当下最火的 OpenClaw 切入，几位嘉宾一致认为，智能体让大模型真正开始“干活”了。OpenClaw 可扩展大模型的能力边界，但也对模型提出了更高要求，智谱正研究长程规划、自我调试等能力，而罗福莉的团队更关注通过架构创新把成本降下来、速度提上去，甚至实现模型自进化。

Este diálogo se centró en OpenClaw, que ha llevado a los modelos a una fase de “trabajo”. OpenClaw expande las capacidades de los modelos, aunque también plantea mayores exigencias. Zhupu investiga capacidades como la planificación a largo plazo y la autoconfiguración, mientras que el equipo de Rofuli se enfoca en innovaciones arquitectónicas para reducir costos y aumentar la velocidad, incluso logrando la auto-evolución del modelo.

基础设施也得跟上智能体的节奏。夏立雪认为现在的算力系统和软件架构还是给人用的，不是给智能体用的，其实是用人的操作能力限制了 Agent 的发挥空间。因此，我们需要打造 Agentic Infra。

La infraestructura también debe seguir el ritmo de los agentes. Xia Lixue opina que los sistemas de cálculo y arquitecturas de software actuales están diseñados para humanos, no para agentes, limitando el potencial de estos últimos. Por lo tanto, necesitamos crear una infraestructura agentica.

在多位嘉宾眼中，开源是推动大模型与智能体发展的核心动力之一。香港大学助理教授黄超便认为，开源生态的繁荣是智能体从“玩一玩”走向真正“打工人”的关键，只有通过社区共建，才能让软件、数据和技术全面转向智能体原生形态，最终形成可持续的全球 AI 生态。

Para muchos de los invitados, el código abierto es uno de los motores fundamentales del desarrollo de los modelos y los agentes. El profesor asistente Huang Chao de la Universidad de Hong Kong considera que la prosperidad del ecosistema de código abierto es clave para que los agentes pasen de ser simplemente un juego a convertirse en verdaderos “trabajadores”. Solo a través de la construcción comunitaria podemos convertir software, datos y tecnología en formas nativas de agentes, formando así un ecosistema de IA global sostenible.

此外，几位嘉宾还就大模型涨价、token 用量爆发、AI 未来 12 个月的关键词等话题，展开讨论。以下是这场圆桌论坛的核心观点：

Además, varios invitados discutieron temas como el aumento de precios de los grandes modelos, la explosión del uso de tokens y las palabras clave para la IA en los próximos 12 meses. A continuación, se presentan los puntos clave de este foro de mesa redonda:

1、张鹏：模型变大后推理成本也会相应提高，近期智谱的涨价策略其实是回归到正常的商业价值上了，长期低价竞争不利于行业发展。

Zhang Peng: A medida que los modelos crecen, los costos de inferencia también aumentan. La reciente estrategia de aumento de precios de Zhupu es un retorno a un valor comercial normal, ya que la competencia a precios bajos a largo plazo no beneficia el desarrollo de la industria.

2、张鹏：智能体等新技术的爆发让 token 用量增长了 10 倍，但实际需求可能增长 100 倍，仍有大量需求未被满足，因此算力仍然是未来 12 个月内的关键问题。

Zhang Peng: La explosión de nuevas tecnologías como los agentes ha llevado a un aumento de 10 veces en el uso de tokens, pero la demanda real podría aumentar 100 veces, aún queda mucha demanda insatisfecha, por lo que la capacidad de cálculo seguirá siendo un problema clave en los próximos 12 meses.

3、罗福莉：从基座大模型厂商的视角来看，OpenClaw 保证了基础大模型的下限，拉高了上限。国产开源模型+OpenClaw 的任务完成度已经非常接近 Claude。

Rofuli: Desde la perspectiva de los fabricantes de grandes modelos, OpenClaw garantiza el límite inferior de los modelos base y eleva el límite superior. La tasa de finalización de las tareas del modelo nacional de código abierto + OpenClaw ya está muy cerca de Claude.

4、罗福莉：DeepSeek 给国内大模型厂商带来了勇气和信心。一些看似是“为了效率妥协”的模型结构创新引发了真正的变革，让业界在算力一定的情况下发挥出最高的智能水平。

Rofuli: DeepSeek ha dado valor y confianza a los fabricantes de grandes modelos en el país. Algunas innovaciones en la estructura de modelos que parecen ser “compromisos por eficiencia” han provocado verdaderas transformaciones, permitiendo al sector alcanzar el más alto nivel de inteligencia bajo ciertas condiciones de capacidad de cálculo.

5、罗福莉：接下来一年 AGI 历程中最重要的事情是“自进化”。自进化让大模型像顶尖科学家一样去探索，是唯一能“创造新东西”的地方。小米已经借助 Claude Code+顶尖模型，将研究效率提升 10 倍。

Rofuli: Lo más importante en el próximo año del viaje hacia la AGI es la “auto-evolución”. La auto-evolución permite que los grandes modelos exploren como los mejores científicos, siendo el único lugar que puede “crear cosas nuevas”. Xiaomi ya ha mejorado la eficiencia de la investigación en 10 veces con Claude Code + modelos de vanguardia.

6、夏立雪：当 AGI 时代到来时，基础设施本身都应该是智能体，自主管理整个基础设施，根据 AI 客户的需求去迭代基础设施，实现自我进化、自我迭代。

Xia Lixue: Cuando llegue la era de la AGI, la infraestructura misma debería ser un agente, gestionando de manera autónoma toda la infraestructura, iterando según las necesidades de los clientes de IA para lograr auto-evolución y auto-iteración.

7、夏立雪：OpenClaw 引爆了 token 用量。如今的 token 消耗速度，就像当年 3G 时代手机流量刚起步时，每个月只有 100M 额度的那种感觉。

Xia Lixue: OpenClaw ha provocado una explosión en el uso de tokens. La velocidad de consumo de tokens ahora se siente como en los primeros días del tráfico de teléfonos móviles en la era del 3G, cuando solo había un límite de 100M por mes.

8、黄超：未来很多软件都不是面向人类的，软件、数据和技术都会编程 Agent-Native 的形态，人类未来可能只需要使用那些“让自己快乐的 GUI”。

Huang Chao: En el futuro, muchos programas no estarán dirigidos a los humanos; el software, los datos y la tecnología serán programados en formas nativas de agentes. Los humanos pueden que solo necesiten usar aquellas interfaces gráficas de usuario que les hagan felices.

以下是这场圆桌论坛的完整实录：

A continuación, se presenta la transcripción completa de este foro de mesa redonda:

01.OpenClaw 就是“脚手架”，大模型 token 消耗仍处于 3G 时代

OpenClaw es el “andamiaje”, el consumo de tokens de los grandes modelos aún se encuentra en la era del 3G.

杨植麟：很荣幸今天能邀请到各位重磅嘉宾，几位嘉宾来自模型层、算力层再到 agent 层。今天最主要的关键词是开源，然后还有 agent。

Yang Zhiling: Es un honor invitar a todos los destacados invitados hoy, quienes provienen de las capas de modelos, capacidad de cálculo y agentes. La palabra clave principal de hoy es el código abierto, y también los agentes.

第一个问题来谈谈现在最流行的 OpenClaw。大家日常使用 OpenClaw 或者类似的产品有什么觉得最有想象力或者印象深刻的点？从技术的角度来看，如何看待今天 OpenClaw 和相关的 Agent 的演进。

La primera pregunta es sobre el OpenClaw, que es ahora el más popular. ¿Qué puntos imaginativos o impresionantes han encontrado en su uso diario de OpenClaw o productos similares? Desde el punto de vista técnico, ¿cómo ven la evolución de OpenClaw y los agentes relacionados hoy en día?

张鹏：很早我就开始自己玩 OpenClaw，当时还叫 Clawbot。我自己动手来折腾，毕竟也是程序员出身，玩这些东西还是有一些自己的体验。

Zhang Peng: Empecé a jugar con OpenClaw hace mucho tiempo, cuando todavía se llamaba Clawbot. Lo hice por mi cuenta, ya que también tengo una formación como programador, así que tengo algunas experiencias personales con estas cosas.

我觉得 OpenClaw 给大家带来的最大突破点，或者说新鲜感就在于，它不再是程序员或极客们的专利。普通人也可以比较方便地使用顶尖模型的能力，尤其是在编程和智能体方面的能力。

Creo que el mayor avance que OpenClaw ha traído a todos, o la novedad, es que ya no es exclusivo de programadores o geeks. La gente común puede usar las capacidades de los modelos de vanguardia de manera bastante conveniente, especialmente en términos de programación y capacidades de agentes.

所以我到现在为止，跟大家在交流的过程当中，我更愿意把 OpenClaw 称作“脚手架”。它提供的是一种可能性，在模型的基础之上搭起了一个很牢固、很方便，但是又很灵活的脚手架。大家可以按照自己的意愿，去使用很多底层模型提供的新奇功能。

Por lo tanto, hasta ahora, en mis interacciones con otros, prefiero llamar a OpenClaw “andamiaje”. Proporciona una posibilidad, construyendo un andamiaje sólido, conveniente y flexible sobre la base de los modelos. Todos pueden usar muchas funciones novedosas que ofrecen los modelos subyacentes según su voluntad.

原来自己的想法可能会受限于不会写代码，或者没有掌握其他的相关技能，今天有了 OpenClaw，终于可以通过很简单的交流就把它完成。

Antes, mis ideas podían estar limitadas por no saber escribir código o no tener otras habilidades relacionadas. Hoy, con OpenClaw, finalmente puedo completar esas ideas a través de una comunicación muy simple.

OpenClaw 给我带来非常大的冲击，或者说让我重新认识了这件事。

OpenClaw me ha impactado mucho, o me ha permitido ver esta cuestión de una nueva manera.

夏立雪：其实我最开始用 OpenClaw 的时候是不太适应的，因为我习惯于跟大模型聊天的交流方式，使用后我感觉 OpenClaw 反应好慢。

Xia Lixue: Al principio, no me adapté bien al usar OpenClaw, ya que estoy acostumbrado a interactuar con grandes modelos de chat, y sentí que OpenClaw era lento en respuesta.

但后来我意识到一个问题，就是它和之前的聊天机器人有一个很大的不同，本质是一个能帮我完成大型任务的“人”。我开始给它提交更复杂的任务，就发现其实它能够做的很好。

Pero luego me di cuenta de que hay una gran diferencia entre él y los chatbots anteriores; en esencia, es un “ser” que puede ayudarme a completar tareas grandes. Comencé a asignarle tareas más complejas y descubrí que realmente puede hacerlo muy bien.

这件事情给我带来很大的感触。模型一开始按照 token 去聊天，到现在能够变成一个 agent，变成一个龙虾，能够帮你去完成任务。这件事对 AI 的整体想象力空间带来很大的提升。

Esto me impactó mucho. Los modelos inicialmente interactuaban en función de tokens, y ahora pueden transformarse en un agente, convertirse en un “langosta” que puede ayudar a completar tareas. Esto ha ampliado enormemente la imaginación general sobre la IA.

同时，它对于整个系统的能力的要求也变得很高。这也是为什么我一开始用 OpenClaw，会觉得它有点卡。作为基础设施层的厂商，我看到的是 OpenClaw 对于 AI 背后的大型系统和生态都带来了更多的机遇和挑战。

Al mismo tiempo, las exigencias sobre las capacidades del sistema en su conjunto también se han vuelto muy altas. Por eso, al principio, sentí que OpenClaw era un poco lento. Como proveedor de infraestructura, veo que OpenClaw trae más oportunidades y desafíos para los grandes sistemas y ecosistemas que sustentan la IA.

我们现在所有能够用到的资源，想要支撑起这样一个快速增长的时代是不够的。比如说就拿我们公司来说，我们公司从一月底开始，基本上每两周 token 用量就翻一番，到现在基本上涨了 10 倍。

Todos los recursos que tenemos disponibles ahora no son suficientes para sostener esta era de rápido crecimiento. Por ejemplo, en nuestra empresa, desde finales de enero, el uso de tokens se ha duplicado aproximadamente cada dos semanas y ahora ha aumentado en un 10 veces.

上次见到这个速度，还是当年用 3G 手机消耗流量的时候。我有种感觉，现在的 token 用量，就像当年每个月只有 100M 手机流量的那个时代。

La última vez que vi una velocidad así fue cuando consumíamos datos con teléfonos 3G. Tengo la sensación de que el uso de tokens ahora se siente como en la época en que solo teníamos 100 MB de datos al mes.

这种情况下，我们所有的资源都需要进行更好的优化，进行更好的整合。让每一个人，不仅仅在 AI 领域，而是在整个社会中的每一个人都能够去把 OpenClaw的 AI 能力用起来。

En esta situación, todos nuestros recursos necesitan ser mejor optimizados y consolidados. Para que cada persona, no solo en el ámbito de la IA, sino en toda la sociedad, pueda utilizar las capacidades de IA de OpenClaw.

作为基础设施的玩家，我对这个时代是非常激动、深有感触的。我也认为这里边有很多的优化空间是我们仍然应该去探索，应该去尝试的。

Como proveedor de infraestructura, estoy muy emocionado y profundamente conmovido por esta era. También creo que hay mucho espacio para la optimización que aún debemos explorar y probar.

02.OpenClaw 拉高国产模型上限，交互模式突破意义重大

OpenClaw eleva el límite superior de los modelos nacionales, el avance en los modos de interacción es muy significativo.

罗福莉：我自己是把 OpenClaw 当做 agent 框架演进过程中，一个极具革命性和颠覆性的事件来看待的。

Rofuli: Yo considero a OpenClaw como un evento revolucionario y disruptivo en la evolución del marco de agentes.

其实我身边所有在进行非常深度 coding 的人，他们的第一选择还是 Claude Code。但是，我相信用 OpenClaw 的人会感受到，它在 Agent 框架上的很多设计是领先于 Claude Code 的。最近 Claude Code 有很多更新其实都是在向 OpenClaw 去靠近。

De hecho, todas las personas a mi alrededor que están haciendo codificación profunda, todavía eligen Claude Code como su primera opción. Sin embargo, creo que quienes usan OpenClaw sentirán que muchos de sus diseños en el marco de agentes están por delante de Claude Code. Recientemente, Claude Code ha tenido muchas actualizaciones que en realidad se están acercando a OpenClaw.

我自己使用 OpenClaw 时的感受是，这个框架给我自己带来更多是想象力的随时随地的扩展。Claude Code 最开始只能在我的桌面上去延展我的创意，但是 OpenClaw 可以随时随地去延展我的创意。

Mi experiencia personal con OpenClaw es que este marco me brinda una expansión de imaginación en cualquier momento y lugar. Claude Code inicialmente solo podía extender mis ideas en mi escritorio, pero OpenClaw puede hacerlo en cualquier lugar y en cualquier momento.

OpenClaw 带来的核心价值主要有两点。第一点是它开源。开源这件事，非常有利于整个社区深度参与进来，重视并推动这个框架的演进，这是一个很重要的前置条件。

El valor central que trae OpenClaw tiene principalmente dos puntos. El primero es que es de código abierto. Esta apertura es muy beneficiosa para que toda la comunidad participe profundamente, valore y promueva la evolución de este marco, lo cual es una condición previa muy importante.

像 OpenClaw 这样的 AI 框架，我觉得一个很大的价值在于，它把国内那些水平虽然接近闭源模型、但还没完全追上的模型的上限拉到了很高。

En un marco de IA como OpenClaw, creo que un gran valor radica en que eleva el límite de los modelos nacionales que, aunque se acercan a los modelos cerrados, aún no los han superado.

在绝大多数场景下，你会发现它（国产开源模型+OpenClaw）的任务完成度已经非常接近 Claude 的最新模型。同时，它又很好地把下限保证了——通过一套 Harness 系统，或者说借助它的 Skills 体系等多方面的设计，保障了任务的完整度和准确率。

En la mayoría de los escenarios, notarás que la tasa de finalización de las tareas de (modelos nacionales de código abierto + OpenClaw) ya está muy cerca del último modelo de Claude. Al mismo tiempo, también asegura muy bien el límite inferior: a través de un sistema de Harness, o utilizando su sistema de Skills, entre otros diseños, garantiza la integridad y precisión de las tareas.

总结一下，从基座大模型厂商的开发者角度来看，OpenClaw 保证了基础大模型的下限，拉高了上限。

En resumen, desde la perspectiva de los desarrolladores de los fabricantes de grandes modelos, OpenClaw garantiza el límite inferior de los modelos base y eleva el límite superior.

此外，我认为它给整个社区带来的另一个价值是，它点燃了大家的认知，让大家发现在大模型之外，Agent 这一层其实蕴藏着非常大的想象空间。

Además, creo que otro valor que aporta a toda la comunidad es que ha encendido la conciencia de todos, permitiendo darse cuenta de que más allá de los grandes modelos, la capa de agentes en realidad contiene un enorme espacio de imaginación.

我最近也观察到，社区里除了研究员之外，越来越多的人开始参与到 AGI 的变革中来，更多人开始接触像 Harness、Scaffold 这样更强大的 Agent 框架。这些人某种程度上是在用这些工具替代自己的一部分工作，同时也是在释放自己的时间，去投入到更有想象力的事情上。

Recientemente, también he observado que, además de los investigadores, cada vez más personas comienzan a participar en la transformación de la AGI, y más personas están comenzando a interactuar con marcos de agentes más poderosos como Harness y Scaffold. Estas personas, en cierta medida, están utilizando estas herramientas para reemplazar parte de su trabajo, al mismo tiempo que liberan su tiempo para dedicarse a tareas más imaginativas.

黄超：我觉得首先从交互模式来讲，OpenClaw 这次之所以能火，第一个原因可能是它给了一种更有“活人感”的体验。其实我们做 Agent 也有一两年了，但之前像 Cursor、Claude Code 这些 Agent，给人的感觉更多是一种“工具感”。而 OpenClaw 第一次以“即时通讯软件嵌入”的方式，让人更有一种接近心目中“个人贾维斯”的感觉。我觉得这可能是交互模式上的一个突破。

Huang Chao: Creo que, en primer lugar, desde el punto de vista de los modos de interacción, la razón por la cual OpenClaw ha tenido tanto éxito es que proporciona una experiencia más “humana”. Hemos estado trabajando en agentes durante uno o dos años, pero antes, agentes como Cursor y Claude Code daban una sensación más de “herramienta”. OpenClaw, por primera vez, lo presenta de manera “integrada en software de mensajería instantánea”, lo que da a la gente una sensación más cercana a su idea de un “Jarvis personal”. Creo que esto podría ser un avance en los modos de interacción.

另外一点，它给整个社区带来的启发是：像 Agent Loop 这种简单但高效的框架，再次被证明是可行的。同时，它也让我们重新思考一个问题：我们到底是需要一个全能型的、能做所有事情的超级智能体，还是需要一个更好的“小管家”，像一个轻量级的操作系统或脚手架？

Otro punto es que ha inspirado a toda la comunidad: marcos simples pero eficientes como Agent Loop han demostrado ser viables. Al mismo tiempo, también nos ha llevado a repensar una cuestión: ¿realmente necesitamos un súper agente versátil que pueda hacer todo, o necesitamos un “mejor mayordomo”, como un sistema operativo o andamiaje ligero?

OpenClaw 带来的思路是，通过这样一个“小系统”或者说“龙虾操作系统”和它的生态，让大家真正有“玩起来”的心态，进而撬动整个生态里的所有工具。

La idea que trae OpenClaw es que, a través de este “pequeño sistema” o “sistema operativo de langosta” y su ecosistema, todos realmente tengan una mentalidad de “jugar”, lo que a su vez activa todas las herramientas dentro del ecosistema.

随着 Skills、Harness 这类能力的出现，越来越多的人可以去设计面向 OpenClaw 这类系统的应用，去赋能各行各业。我觉得这一点天然就跟整个开源生态结合得非常紧密。在我看来，这两点是我们获得的最大启发。

Con la aparición de habilidades y capacidades como Skills y Harness, cada vez más personas pueden diseñar aplicaciones orientadas a sistemas como OpenClaw, empoderando diversas industrias. Creo que esto se entrelaza de manera natural con todo el ecosistema de código abierto. En mi opinión, estos dos puntos son nuestras mayores inspiraciones obtenidas.

03.GLM 新模型专为“干活”打造，涨价是对正常商业价值的回归

El nuevo modelo GLM está diseñado específicamente para “trabajar”; el aumento de precios es un regreso al valor comercial normal.

杨植麟：想问一下张鹏。最近看到智谱发布了新的 GLM-5 Turbo 模型，我理解在 Agent 能力上做了很大的增强。能不能给大家介绍一下这个新模型和其他模型的不同之处？另外我们也观察到有提价的策略，这反映了什么样的市场信号？

Yang Zhiling: Quiero preguntar a Zhang Peng. Recientemente, vimos que Zhupu lanzó el nuevo modelo GLM-5 Turbo, entiendo que ha mejorado significativamente las capacidades de los agentes. ¿Puedes presentar a todos las diferencias entre este nuevo modelo y otros modelos? Además, hemos observado una estrategia de aumento de precios, ¿qué señales de mercado refleja esto?

张鹏：这是个很好的问题。前两天我们确实紧急更新了一波，这其实是我们整个发展路标中的一个阶段，只是提前把它放了出来。

Zhang Peng: Es una gran pregunta. De hecho, hace unos días hicimos una actualización urgente; esto es una etapa en nuestro roadmap de desarrollo, simplemente lo lanzamos antes.

最主要的目的，是从原来的“简单对话”转向“真正干活”——这也是大家最近普遍感受到的：大模型不再只是能聊天，而是真的能帮人干活了。

El objetivo principal es pasar de “diálogos simples” a “realmente trabajar”. Esto es algo que todos están sintiendo recientemente: los grandes modelos ya no son solo para charlar, sino que realmente pueden ayudar a trabajar.

但“干活”背后隐含的能力要求非常高。模型需要自己去做长程的任务规划、不断试错、压缩上下文、调试，还可能要处理多模态信息。所以它对模型能力的要求，和传统面向对话的通用模型其实不太一样。GLM-5 Turbo 就是在这些方面做了专门加强，尤其是你提到的——让它干活、跑上七十二小时，怎么能够不停地 loop，这里边我们做了很多工作。

Sin embargo, las exigencias implícitas en el “trabajo” son muy altas. El modelo necesita hacer su propia planificación de tareas a largo plazo, probar y cometer errores continuamente, comprimir contextos, depurar, y también podría tener que manejar información multimodal. Por lo tanto, las exigencias sobre las capacidades del modelo son bastante diferentes de las de los modelos generales orientados a diálogos. GLM-5 Turbo ha sido específicamente reforzado en estas áreas, especialmente en lo que mencionaste: hacerlo trabajar, correr durante setenta y dos horas, y cómo puede hacerlo en un bucle continuo; hemos hecho mucho trabajo en esto.

另外大家也很关注 token 消耗的问题。让一个聪明的模型去干复杂任务，token 的消耗量是巨大的。普通人可能感知不深，但看账单的时候会发现钱掉得特别快。所以我们在这方面也做了优化，在面临复杂任务时，模型能用更高效的 token 效率去完成。总体上，模型的架构还是多任务协同的通用架构，只是在能力上做了偏向性的加强。

Además, todos están muy preocupados por el consumo de tokens. Hacer que un modelo inteligente trabaje en tareas complejas implica un gran consumo de tokens. La mayoría de las personas puede que no sientan esto, pero al revisar la factura, se dan cuenta de que el dinero se gasta muy rápido. Por eso también hemos hecho optimizaciones en este aspecto; al enfrentar tareas complejas, el modelo puede completar tareas de manera más eficiente en términos de tokens. En general, la arquitectura del modelo sigue siendo una arquitectura general de colaboración multitarea, solo que hemos hecho un refuerzo específico en sus capacidades.

提价这件事其实也很好解释。刚才说了，现在不再是简单地问一个问题就得到一个回答，背后的推理链路非常长。很多任务要通过写代码和底层基础设施打交道，还要不断 debug、修正错误，消耗量非常大。完成一个复杂任务需要的 token 量，可能是原来回答一个简单问题的十倍甚至百倍。

El aumento de precios también se puede explicar fácilmente. Como mencionamos antes, ya no es solo cuestión de hacer una pregunta y obtener una respuesta; la cadena de razonamiento detrás es muy larga. Muchas tareas deben interactuar con la codificación y la infraestructura subyacente, y también requieren depuración continua y corrección de errores, lo que genera un gran consumo. La cantidad de tokens necesarios para completar una tarea compleja puede ser diez o incluso cien veces la de responder una pregunta simple.

所以价格上需要有一定的提升，模型也变大了，推理成本相应提高了。我们把它回归到正常的商业价值上，因为长期靠低价竞争也不利于整个行业的发展。这也是我们让商业化能形成一个良性闭环，持续优化模型能力，给大家提供更好服务的。

Por lo tanto, es necesario un aumento de precios; el modelo también ha crecido y los costos de inferencia han aumentado en consecuencia. Lo llevamos de vuelta a un valor comercial normal, porque depender de una competencia a precios bajos a largo plazo no beneficia el desarrollo de toda la industria. Esta es también la razón por la que buscamos establecer un ciclo de retroalimentación saludable en la comercialización, optimizando continuamente las capacidades del modelo y brindando un mejor servicio a todos.

04.打造更高效 token 工厂，基础设施本身也应该是 Agent

Crear una fábrica de tokens más eficiente; la infraestructura misma también debería ser un agente.

杨植麟：现在开源模型越来越多，也开始形成生态，各种模型可以在不同的算力平台上给用户提供更多价值。随着 token 用量的爆发，大模型也正在从训练时代走向推理时代。想请教一下立雪，从基础设施的层面来看，推理时代对于无问来说意味着什么？

Yang Zhiling: Ahora hay cada vez más modelos de código abierto, que también están comenzando a formar un ecosistema, y varios modelos pueden ofrecer más valor a los usuarios en diferentes plataformas de cálculo. Con la explosión del uso de tokens, los grandes modelos están pasando de la era de entrenamiento a la era de inferencia. Quiero preguntarle a Lixue, desde la perspectiva de la infraestructura, ¿qué significa la era de la inferencia para Wuyuan?

夏立雪：我们是一家诞生在 AI 时代的基础设施厂商，现在也在为智谱、Kimi、Mimo 等提供支持，让大家能把 token 工厂更高效地用起来。同时我们也在跟很多高校、科研院所合作。

Xia Lixue: Somos una empresa de infraestructura que nació en la era de la IA, y ahora estamos apoyando a Zhupu, Kimi, Mimo, entre otros, para que todos puedan utilizar la fábrica de tokens de manera más eficiente. Al mismo tiempo, también estamos colaborando con muchas universidades e institutos de investigación.

所以我们一直在思考一件事：AGI 时代需要什么样的基础设施？以及我们怎么一步步去实现和推演它。我们现在对短期、中期、长期不同阶段需要解决的问题，已经做好了充分准备。

Por lo tanto, siempre hemos estado reflexionando sobre qué tipo de infraestructura se necesita en la era de la AGI y cómo podemos implementarla y desarrollarla paso a paso. Estamos completamente preparados para resolver los problemas que necesitamos abordar en las diferentes etapas a corto, medio y largo plazo.

当前最直接的问题，就是大家刚才聊到的——整个 Open 带起来的 token 量暴增，对系统效率提出了更高的优化需求。包括价格的调整，其实也是在这个需求下的一种应对方式。

El problema más inmediato es el que acaban de mencionar: el volumen de tokens generado por la apertura ha aumentado drásticamente, lo que plantea mayores exigencias de optimización para la eficiencia del sistema. Los ajustes de precios también son una respuesta a esta necesidad.

我们一直是通过软硬件打通的方式来布局和解决的。比如我们接入了几乎所有种类的计算芯片，把国内十几种不同的芯片和几十个不同的算力集群统一连接起来。这样能解决 AI 系统里算力资源紧缺的问题，资源不足时，最好的办法就是先把能用上的资源都用起来，然后让每一个算力都用在刀刃上，发挥出最大的转化效率。

Siempre hemos estado configurando y resolviendo esto mediante la integración de hardware y software. Por ejemplo, hemos integrado casi todos los tipos de chips de cálculo, uniendo más de una docena de diferentes chips nacionales y decenas de diferentes grupos de capacidad de cálculo. Esto puede resolver el problema de escasez de recursos de capacidad de cálculo en los sistemas de IA; cuando los recursos son insuficientes, la mejor manera es utilizar todos los recursos disponibles y asegurarse de que cada unidad de cálculo se use de la manera más eficiente.

所以在这个阶段，我们要解决的就是怎么打造一个更高效的 token 工厂。这里边我们做了很多优化，包括让模型和硬件上的显存等各种资源做最优适配，也在看最新的模型结构和硬件结构之间能不能产生更深的化学反应。但解决当前的效率问题，其实只是打造了一个标准化的 token 工厂。

Por lo tanto, en esta etapa, debemos resolver cómo crear una fábrica de tokens más eficiente. Hemos hecho muchas optimizaciones, incluyendo adaptar de manera óptima los modelos y los recursos de memoria de hardware, y estamos investigando si puede haber reacciones químicas más profundas entre las estructuras de modelos y hardware más recientes. Pero resolver el problema de eficiencia actual es solo construir una fábrica de tokens estandarizada.

面向 Agent 时代，我们认为这还不够。因为 Agent 更像一个人，可以交给它一个任务。我坚定地认为，当前很多云计算时代的基础设施，是为服务一个程序、服务人类工程师设计的，而不是为 AI 设计的。这相当于我们做了一个基础设施，上面是给人用的接口，再在上面包一层去接入 Agent，这种方式其实是用人的操作能力限制了 Agent 的发挥空间。

Con la llegada de la era de los agentes, creemos que esto no es suficiente. Porque un agente se asemeja más a una persona y se le puede asignar una tarea. Estoy firmemente convencido de que la infraestructura actual de la era de la computación en la nube está diseñada para servir a un programa, para servir a ingenieros humanos, no para la IA. Esto es como si hubiéramos construido una infraestructura con interfaces diseñadas para humanos, y luego simplemente agregamos una capa para integrar agentes; este enfoque limita en realidad el potencial de los agentes debido a las capacidades operativas humanas.

举个例子，Agent 能做到毫秒级别去思考和发起任务，但像 K8s（kubernetes）这类底层能力，其实并没有为此做好准备，因为人类发起任务大概是分钟级的。所以我们需要更进一步的能力，我们把它叫“Agentic Infra”，也就是“智慧化的 token 工厂”，这是无问芯穹在做的事情。

Por ejemplo, un agente puede pensar y comenzar tareas a milisegundos, pero capacidades fundamentales como K8s (kubernetes) en realidad no están preparadas para ello, porque los humanos suelen iniciar tareas en minutos. Por lo tanto, necesitamos capacidades más avanzadas; a esto lo llamamos “Infra Agentica”, es decir, una “fábrica de tokens inteligente”, que es lo que está haciendo Wuyuan.

更长远地看，真正 AGI 时代到来时，我们认为连基础设施本身都应该是智能体。我们打造的这套工厂，也应该是能自我进化、自我迭代的，能形成一个自主的组织。它相当于有一个 CEO，这个 CEO 本身就是一个 Agent，可能是 OpenClaw，去管理整个基础设施，然后根据 AI 客户的需求自己去提需求、迭代基础设施。这样 AI和 AI 之间才能更好地耦合。我们也在做一些探索，比如让 Agent 之间更好地通信、做 Cache to Cache 这样的能力。

En una perspectiva más a largo plazo, cuando realmente llegue la era de la AGI, creemos que incluso la infraestructura misma debería ser un agente. La fábrica que estamos construyendo también debería ser capaz de auto-evolucionarse y auto-iterarse, formando una organización autónoma. Sería como tener un CEO, que en sí mismo es un agente, quizás OpenClaw, para gestionar toda la infraestructura y luego, según las necesidades de los clientes de IA, presentar sus propias demandas y iterar sobre la infraestructura. De esta manera, los AI podrán acoplarse mejor entre sí. También estamos haciendo algunas exploraciones, como permitir una mejor comunicación entre agentes y capacidades como Cache to Cache.

所以我们一直在思考的是，基础设施和 AI 的发展不应该是一个隔离的状态——我接到需求就去实现，而是应该产生非常丰富的化学反应。这才是真正意义上的软硬协同、算法和基础设施的协同，也是无问芯穹一直想实现的使命。谢谢。

Entonces, siempre hemos estado pensando que el desarrollo de la infraestructura y la IA no debería ser un estado aislado: “recibo una solicitud y la implemento”, sino que debería generar reacciones químicas muy ricas. Esta es la verdadera colaboración entre hardware y software, la colaboración entre algoritmos e infraestructura, y esta es la misión que Wuyuan siempre ha querido lograr. Gracias.

05.“为效率妥协”的创新也有意义，DeepSeek 给国内团队带来勇气和信心

La innovación que “compromete la eficiencia” también tiene sentido; DeepSeek ha dado valor y confianza a los equipos nacionales.

杨植麟：接下来想问一下福莉。小米最近通过发布新模型、开源背后的技术，对社区做出了很大的贡献。想问你，小米在做大模型方面，你觉得有什么独特的优势？

Yang Zhiling: A continuación, quiero preguntarle a Rofuli. Xiaomi ha hecho una gran contribución a la comunidad al lanzar nuevos modelos y tecnologías detrás del código abierto. Quiero preguntarte, ¿qué ventajas únicas ves en Xiaomi en el desarrollo de grandes modelos?

罗福莉：我觉得可以先抛开小米有什么独特优势这个话题，我更想聊一聊中国做大模型的团队整体上的一个优势。我觉得这个话题有更广泛的价值。

Rofuli: Creo que podemos dejar de lado la cuestión

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

1 me gusta