11:25
Lanzamiento de la versión oficial DeepSeek V3.2: Mejora de la capacidad del agente, integración de pensamiento y razonamiento
Golden Finance reporta que hoy publicamos simultáneamente dos versiones oficiales de modelos: DeepSeek-V3.2 y DeepSeek-V3.2-Speciale. DeepSeek-V3.2 es nuestro primer modelo que integra el pensamiento en el uso de herramientas y, al mismo tiempo, soporta la llamada a herramientas en modo de pensamiento y modo no pensamiento. Hemos propuesto un método de síntesis de datos de entrenamiento a gran escala para agentes, construyendo una gran cantidad de tareas de aprendizaje por refuerzo "difíciles de resolver, fáciles de verificar" (más de 1800 entornos, más de 85,000 instrucciones complejas), mejorando en gran medida la capacidad de generalización del modelo. (DeepSeek)
- 1
- 2