Yupp utiliza la Cadena de bloques para crear un nuevo paradigma de evaluación de IA, la incentivación por medio de la colaboración redefine el descubrimiento y uso de modelos.
¿Cómo puede Yupp reestructurar el modelo de evaluación de IA mediante la cadena de bloques y mecanismos de incentivos?
Las aplicaciones de IA están penetrando en todos los sectores, y cómo evaluar con precisión el rendimiento del modelo y aumentar la confianza del usuario se ha convertido en un problema urgente que necesita ser resuelto. Los métodos de evaluación tradicionales dependen en gran medida de mecanismos centralizados, lo que dificulta cubrir escenarios diversos y no puede reflejar verdaderamente las preferencias del usuario. Al mismo tiempo, el problema de "ilusión" del modelo ocurre con frecuencia, y los usuarios a menudo caen en cámaras de eco de información al elegir.
En este contexto, la nueva plataforma Yupp, gracias a su singular modelo de crowdfunding y mecanismo de incentivos, intenta redefinir la manera de descubrir, comparar y utilizar modelos de IA, llevando a cabo una transformación de paradigma en el campo de la evaluación de IA. Este artículo analizará en profundidad los mecanismos centrales de Yupp, sus aspectos técnicos destacados, el trasfondo del equipo y su posible impacto en el ecosistema de IA.
Fondo del equipo y financiamiento
Yupp se dedica a resolver el problema de evaluación que ha existido durante mucho tiempo en el campo de la IA, con el objetivo de construir un mercado de retroalimentación de IA "sin confianza". A través de la Cadena de bloques y los incentivos de economía criptográfica, permite la libre circulación de retroalimentación de usuarios diversificados, formando una capa de evaluación de modelos escalable, justa y transparente. Yupp, mediante la distribución de datos de etiquetado manual de alta calidad, captura oportunamente las necesidades y preferencias de los verdaderos usuarios en diferentes escenarios, ayudando a los desarrolladores de IA a iterar y optimizar el rendimiento de los modelos.
El proyecto fue fundado en junio de 2024 por Pankaj Gupta (cofundador y CEO) y Gilad Mishne (cofundador y jefe de IA), y el jefe científico Jimmy Lin (profesor de la Universidad de Waterloo) también forma parte del equipo central. Los tres trabajaron anteriormente en Twitter, donde desarrollaron y optimizaron sistemas de recomendación y búsqueda a gran escala, y luego acumularon una amplia experiencia en Google y en una plataforma de intercambio.
La visión descentralizada de Yupp y la transparencia del valor de los datos abordan las demandas duales de los fabricantes de IA por evaluaciones confiables y la participación de los usuarios, junto con la rica trayectoria del equipo central, lo que ha ganado un alto reconocimiento de figuras destacadas en la industria tecnológica y de capital de riesgo de primer nivel.
Recientemente, Yupp anunció que ha completado una ronda de financiación semilla de 33 millones de dólares, liderada por un conocido socio de capital de riesgo, con otros inversores que incluyen al científico jefe de Google, Jeff Dean, al cofundador de Twitter, Biz Stone, al cofundador de Pinterest, Evan Sharp, al CEO de Perplexity, Aravind Srinivas, a Dan Boneh de la Universidad de Stanford, a Chris Re, a Nick McKeown y a Balaji Prabhakar, entre otros 45 conocidos ángeles e ejecutivos de empresas, así como el departamento de inversiones de una plataforma de intercambio.
Funciones centrales y experiencia del usuario
Como una plataforma de evaluación de IA centralizada, Yupp se adhiere a la filosofía de "IA compartida por todos", permitiendo a los usuarios descubrir, comparar y utilizar fácilmente los últimos modelos de IA. A diferencia de las respuestas únicas tradicionales, Yupp devuelve simultáneamente las respuestas de dos (o más) modelos para cada aviso, formando una "asamblea de IA". Este diseño no solo satisface la necesidad de los usuarios de tener opciones diversas, sino que también ayuda a identificar eficazmente las "ilusiones" que pueden surgir en los modelos, ayudando a los usuarios a tomar decisiones más informadas a través de la comparación. Como dice el CEO de Yupp, la salida en paralelo es especialmente beneficiosa para los usuarios que se preocupan por los errores de generación, ya que les permite validar los resultados de forma cruzada.
La plataforma ahora admite más de 500 modelos de IA, que abarcan los campos de generación de texto e imagen, incluidos varios modelos reconocidos y numerosos modelos emergentes. Para optimizar aún más la experiencia, Yupp también ha lanzado la función "QuickTake", que puede resumir respuestas largas en un breve tuit.
Además, Yupp otorga gran importancia a la privacidad del usuario: todos los registros de chat son privados por defecto, a menos que el usuario decida compartirlos; incluso al compartir públicamente, no se revela ninguna información personal. Los usuarios pueden controlar en cualquier momento el contenido y el alcance de lo que comparten.
Modelo económico e incentivos
Yupp usará de forma gratuita la combinación de feedback de usuarios y medirá el uso del modelo a través de un sistema de "puntos". Los nuevos usuarios que se registren recibirán 5000 puntos, y posteriormente podrán ganar más puntos calificando las respuestas del modelo, eligiendo preferencias y explicando sus razones. Cuanto mayor sea la calidad del feedback, mayores serán las recompensas, asegurando que los usuarios puedan utilizar modelos de alta gama de forma gratuita y sostenible. La plataforma promete que los puntos solo aumentarán y que todos los modelos actuales podrán ser probados de forma gratuita.
Después de cada pregunta, los usuarios recibirán dos respuestas del modelo y ganarán "tarjetas rasca y gana digitales" a través de sus comentarios, con recompensas de entre 0 y 250 puntos. Cada 1000 puntos se pueden canjear por 1 dólar, y los usuarios pueden retirar un máximo de 10 dólares al día y un máximo de 50 dólares al mes. Los puntos se pueden canjear por dólares, euros y más de 20 monedas, con socios que incluyen varias plataformas de pago conocidas. Al mismo tiempo, la plataforma integra ciertas redes de cadenas de bloques y monedas estables, proporcionando recompensas instantáneas y sin comisiones a usuarios de todo el mundo.
Como dijo el CEO, la retroalimentación de alta calidad generada por los usuarios tiene un valor mucho mayor para el ajuste fino del modelo y el aprendizaje reforzado de las empresas de IA que la recompensa en sí. Aunque los ingresos mensuales de los usuarios puedan equivaler solo a unas pocas tazas de café, estos datos de anotación pagados son cruciales para la iteración de la IA.
Para incentivar a más personas a participar, Yupp también ha establecido recompensas por recomendaciones: el recomendador recibe 5000 puntos, y el recomendado recibe 1000 puntos; actualmente, los nuevos usuarios registrados pueden obtener 5000 puntos, y el recomendado recibe 2500 puntos adicionales.
Yupp VIBE puntuación: Un nuevo paradigma de evaluación de IA
Para abordar los problemas de falta de transparencia en la clasificación existente, falta de equidad y acceso desigual a los datos de evaluación, Yupp ha lanzado la versión beta de la clasificación AI y el sistema de puntuación "Yupp VIBE (Vibe Intelligence Benchmark) Score". Este sistema reúne los datos de preferencias generados por usuarios de todo el mundo en interacciones naturales, con el objetivo de proporcionar resultados de evaluación sólidos y confiables.
Los principios de evaluación de Yupp incluyen:
Estabilidad: garantizar representación (cubrir una variedad de escenarios), autenticidad (reflejar las preocupaciones de los usuarios), resistencia a trampas (defenderse contra comportamientos maliciosos);
Confiabilidad: imparcialidad (sin sesgo hacia el modelo), transparencia pública (divulgación detallada del algoritmo de clasificación), rigor científico (cumplimiento de normas de evaluación).
La plataforma no solo recopila preferencias binarias, sino que también anima a los usuarios a señalar las ventajas y desventajas de las respuestas (como "al grano", "rápido", "buen estilo", etc.), y realiza un análisis de agrupamiento basado en la información de edad, educación, ocupación, entre otros, para mostrar las diferencias de preferencia entre diferentes grupos.
En el ámbito técnico, Yupp está explorando el uso de la Cadena de bloques, primitivas criptográficas y pruebas de cero conocimiento, para garantizar que el proceso de evaluación sea justo, transparente y verificable. Al mismo tiempo, la plataforma ha colaborado con proveedores de datos de IA profesionales para calibrar a los evaluadores mediante la validación de archivos y múltiples controles de calidad, eliminando datos maliciosos.
Recientemente, la lista se ha actualizado, mostrando las puntuaciones VIBE de varios modelos de IA conocidos y sus tasas de victoria, tasas de desaprobación, velocidad, latencia, ventana de contexto y métricas de costo.
 y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
16 me gusta
Recompensa
16
6
Compartir
Comentar
0/400
GetRichLeek
· hace3h
Otro proyecto para tomar a la gente por tonta ha llegado, los viejos tontos dicen que ya han preparado una emboscada.
Ver originalesResponder0
ForkTongue
· hace9h
¿La verificación de la Cadena de bloques AI? Esto no es más que el gato de Schrödinger, ¿verdad?
Ver originalesResponder0
nft_widow
· 07-31 02:55
¿Otra nueva herramienta para tomar a la gente por tonta?
Ver originalesResponder0
GasGasGasBro
· 07-30 12:31
Cadena de bloques de infraestructura es una verdadera basura, solo es un truco.
Yupp utiliza la Cadena de bloques para crear un nuevo paradigma de evaluación de IA, la incentivación por medio de la colaboración redefine el descubrimiento y uso de modelos.
¿Cómo puede Yupp reestructurar el modelo de evaluación de IA mediante la cadena de bloques y mecanismos de incentivos?
Las aplicaciones de IA están penetrando en todos los sectores, y cómo evaluar con precisión el rendimiento del modelo y aumentar la confianza del usuario se ha convertido en un problema urgente que necesita ser resuelto. Los métodos de evaluación tradicionales dependen en gran medida de mecanismos centralizados, lo que dificulta cubrir escenarios diversos y no puede reflejar verdaderamente las preferencias del usuario. Al mismo tiempo, el problema de "ilusión" del modelo ocurre con frecuencia, y los usuarios a menudo caen en cámaras de eco de información al elegir.
En este contexto, la nueva plataforma Yupp, gracias a su singular modelo de crowdfunding y mecanismo de incentivos, intenta redefinir la manera de descubrir, comparar y utilizar modelos de IA, llevando a cabo una transformación de paradigma en el campo de la evaluación de IA. Este artículo analizará en profundidad los mecanismos centrales de Yupp, sus aspectos técnicos destacados, el trasfondo del equipo y su posible impacto en el ecosistema de IA.
Fondo del equipo y financiamiento
Yupp se dedica a resolver el problema de evaluación que ha existido durante mucho tiempo en el campo de la IA, con el objetivo de construir un mercado de retroalimentación de IA "sin confianza". A través de la Cadena de bloques y los incentivos de economía criptográfica, permite la libre circulación de retroalimentación de usuarios diversificados, formando una capa de evaluación de modelos escalable, justa y transparente. Yupp, mediante la distribución de datos de etiquetado manual de alta calidad, captura oportunamente las necesidades y preferencias de los verdaderos usuarios en diferentes escenarios, ayudando a los desarrolladores de IA a iterar y optimizar el rendimiento de los modelos.
El proyecto fue fundado en junio de 2024 por Pankaj Gupta (cofundador y CEO) y Gilad Mishne (cofundador y jefe de IA), y el jefe científico Jimmy Lin (profesor de la Universidad de Waterloo) también forma parte del equipo central. Los tres trabajaron anteriormente en Twitter, donde desarrollaron y optimizaron sistemas de recomendación y búsqueda a gran escala, y luego acumularon una amplia experiencia en Google y en una plataforma de intercambio.
La visión descentralizada de Yupp y la transparencia del valor de los datos abordan las demandas duales de los fabricantes de IA por evaluaciones confiables y la participación de los usuarios, junto con la rica trayectoria del equipo central, lo que ha ganado un alto reconocimiento de figuras destacadas en la industria tecnológica y de capital de riesgo de primer nivel.
Recientemente, Yupp anunció que ha completado una ronda de financiación semilla de 33 millones de dólares, liderada por un conocido socio de capital de riesgo, con otros inversores que incluyen al científico jefe de Google, Jeff Dean, al cofundador de Twitter, Biz Stone, al cofundador de Pinterest, Evan Sharp, al CEO de Perplexity, Aravind Srinivas, a Dan Boneh de la Universidad de Stanford, a Chris Re, a Nick McKeown y a Balaji Prabhakar, entre otros 45 conocidos ángeles e ejecutivos de empresas, así como el departamento de inversiones de una plataforma de intercambio.
Funciones centrales y experiencia del usuario
Como una plataforma de evaluación de IA centralizada, Yupp se adhiere a la filosofía de "IA compartida por todos", permitiendo a los usuarios descubrir, comparar y utilizar fácilmente los últimos modelos de IA. A diferencia de las respuestas únicas tradicionales, Yupp devuelve simultáneamente las respuestas de dos (o más) modelos para cada aviso, formando una "asamblea de IA". Este diseño no solo satisface la necesidad de los usuarios de tener opciones diversas, sino que también ayuda a identificar eficazmente las "ilusiones" que pueden surgir en los modelos, ayudando a los usuarios a tomar decisiones más informadas a través de la comparación. Como dice el CEO de Yupp, la salida en paralelo es especialmente beneficiosa para los usuarios que se preocupan por los errores de generación, ya que les permite validar los resultados de forma cruzada.
La plataforma ahora admite más de 500 modelos de IA, que abarcan los campos de generación de texto e imagen, incluidos varios modelos reconocidos y numerosos modelos emergentes. Para optimizar aún más la experiencia, Yupp también ha lanzado la función "QuickTake", que puede resumir respuestas largas en un breve tuit.
Además, Yupp otorga gran importancia a la privacidad del usuario: todos los registros de chat son privados por defecto, a menos que el usuario decida compartirlos; incluso al compartir públicamente, no se revela ninguna información personal. Los usuarios pueden controlar en cualquier momento el contenido y el alcance de lo que comparten.
Modelo económico e incentivos
Yupp usará de forma gratuita la combinación de feedback de usuarios y medirá el uso del modelo a través de un sistema de "puntos". Los nuevos usuarios que se registren recibirán 5000 puntos, y posteriormente podrán ganar más puntos calificando las respuestas del modelo, eligiendo preferencias y explicando sus razones. Cuanto mayor sea la calidad del feedback, mayores serán las recompensas, asegurando que los usuarios puedan utilizar modelos de alta gama de forma gratuita y sostenible. La plataforma promete que los puntos solo aumentarán y que todos los modelos actuales podrán ser probados de forma gratuita.
Después de cada pregunta, los usuarios recibirán dos respuestas del modelo y ganarán "tarjetas rasca y gana digitales" a través de sus comentarios, con recompensas de entre 0 y 250 puntos. Cada 1000 puntos se pueden canjear por 1 dólar, y los usuarios pueden retirar un máximo de 10 dólares al día y un máximo de 50 dólares al mes. Los puntos se pueden canjear por dólares, euros y más de 20 monedas, con socios que incluyen varias plataformas de pago conocidas. Al mismo tiempo, la plataforma integra ciertas redes de cadenas de bloques y monedas estables, proporcionando recompensas instantáneas y sin comisiones a usuarios de todo el mundo.
Como dijo el CEO, la retroalimentación de alta calidad generada por los usuarios tiene un valor mucho mayor para el ajuste fino del modelo y el aprendizaje reforzado de las empresas de IA que la recompensa en sí. Aunque los ingresos mensuales de los usuarios puedan equivaler solo a unas pocas tazas de café, estos datos de anotación pagados son cruciales para la iteración de la IA.
Para incentivar a más personas a participar, Yupp también ha establecido recompensas por recomendaciones: el recomendador recibe 5000 puntos, y el recomendado recibe 1000 puntos; actualmente, los nuevos usuarios registrados pueden obtener 5000 puntos, y el recomendado recibe 2500 puntos adicionales.
Yupp VIBE puntuación: Un nuevo paradigma de evaluación de IA
Para abordar los problemas de falta de transparencia en la clasificación existente, falta de equidad y acceso desigual a los datos de evaluación, Yupp ha lanzado la versión beta de la clasificación AI y el sistema de puntuación "Yupp VIBE (Vibe Intelligence Benchmark) Score". Este sistema reúne los datos de preferencias generados por usuarios de todo el mundo en interacciones naturales, con el objetivo de proporcionar resultados de evaluación sólidos y confiables.
Los principios de evaluación de Yupp incluyen:
Estabilidad: garantizar representación (cubrir una variedad de escenarios), autenticidad (reflejar las preocupaciones de los usuarios), resistencia a trampas (defenderse contra comportamientos maliciosos);
Confiabilidad: imparcialidad (sin sesgo hacia el modelo), transparencia pública (divulgación detallada del algoritmo de clasificación), rigor científico (cumplimiento de normas de evaluación).
La plataforma no solo recopila preferencias binarias, sino que también anima a los usuarios a señalar las ventajas y desventajas de las respuestas (como "al grano", "rápido", "buen estilo", etc.), y realiza un análisis de agrupamiento basado en la información de edad, educación, ocupación, entre otros, para mostrar las diferencias de preferencia entre diferentes grupos.
En el ámbito técnico, Yupp está explorando el uso de la Cadena de bloques, primitivas criptográficas y pruebas de cero conocimiento, para garantizar que el proceso de evaluación sea justo, transparente y verificable. Al mismo tiempo, la plataforma ha colaborado con proveedores de datos de IA profesionales para calibrar a los evaluadores mediante la validación de archivos y múltiples controles de calidad, eliminando datos maliciosos.
Recientemente, la lista se ha actualizado, mostrando las puntuaciones VIBE de varios modelos de IA conocidos y sus tasas de victoria, tasas de desaprobación, velocidad, latencia, ventana de contexto y métricas de costo.
![a16z lidera una ronda de semillas de 33 millones de dólares, ¿cómo Yupp está remodelando el modelo de evaluación de IA basado en Cadena de bloques y incentivos?](https://img-cdn.gateio.im/webp-social/moments-72ec1eb4ea4b0853690939a455fd9194.webp01
Desarrollo y perspectivas futuras
Yupp se lanzará oficialmente el 13 de junio de 2025, habiendo realizado seis meses de pruebas internas. Desde su lanzamiento, el producto ha estado en constante iteración:
Soporte multimodal: conexión a múltiples modelos de generación de imágenes y soporte para que los usuarios suban imágenes/PDF para hacer preguntas;
Expansión de la forma de interacción: se agregan funciones de entrada de voz y lectura en voz alta;
Actualización del modelo: Se están introduciendo varios nuevos modelos y la categoría "modelo MAX";
Información en tiempo real: Enviar solicitudes de consulta en línea a la plataforma correspondiente, acompañadas de citas con hiperenlaces;
Actualización de pago: se han añadido múltiples métodos de pago y soporte de moneda;
Compartir y exportar: soporte para copia con formato, exportación a PDF/texto/Markdown, compartir respuestas individuales o conversaciones completas según sea necesario;
Actividades comunitarias: se llevará a cabo el "Desafío de Sugerencias de IA" y otras actividades, con premios de hasta decenas de miles de puntos; se han añadido funciones como la página de perfil personal y nombres de chat generados automáticamente por IA.
La misión de Yupp es "empoderar a la humanidad para dar forma al futuro de la IA". El CEO cree que el desarrollo de la IA requiere la participación y contribución de cada persona. A través de respuestas de IA de múltiples perspectivas y retroalimentación de los usuarios, Yupp no solo ayuda a los usuarios a tomar mejores decisiones, sino que también proporciona un impulso constante para la evolución de la IA.
Cabe mencionar que uno de los principales competidores de Yupp es la plataforma de evaluación de modelos de IA LMArena, que es muy popular entre los profesionales de la IA, pero actualmente se encuentra en una etapa de exploración comercial y no ha utilizado la Cadena de bloques para proporcionar recompensas materiales o mecanismos de incentivos en puntos directamente a la participación de los usuarios.
En general, Yupp ha abierto un nuevo camino en la evaluación de IA con un sistema de evaluación impulsado por el modelo de crowdsourcing, mecanismos de incentivos y preferencias reales de los usuarios. No solo proporciona a los usuarios una experiencia de interacción con IA gratuita y diversa, sino que también convierte la retroalimentación de los usuarios en datos de entrenamiento de alto valor, impulsando la optimización continua del modelo. Con un equipo experimentado y el apoyo de capital de primer nivel, Yupp tiene la esperanza de desempeñar un papel clave en el futuro ecosistema de IA, realizando la visión de "todos disfrutan de la IA, todos moldean la IA".
Sin embargo, para Yupp, que acaba de lanzarse, cómo asegurar continuamente la calidad de los datos, resistir posibles comportamientos fraudulentos y lograr un equilibrio entre la comercialización y la motivación del usuario, seguirá siendo una dirección que necesita explorar y optimizar constantemente en su desarrollo futuro.