Como a Yupp está a utilizar o Blockchain e mecanismos de incentivo para redefinir o modelo de avaliação de IA?
As aplicações de IA estão a penetrar em diversos setores, e como avaliar com precisão o desempenho dos modelos e aumentar a confiança dos utilizadores tornou-se um problema urgente a ser resolvido. Os métodos de avaliação tradicionais dependem em grande parte de mecanismos centralizados, que têm dificuldade em cobrir cenários diversificados e não conseguem refletir verdadeiramente as preferências dos utilizadores. Ao mesmo tempo, o problema da "ilusão" dos modelos ocorre frequentemente, levando os utilizadores a caírem em bolhas de informação ao escolher.
Neste contexto, a nova plataforma Yupp, com o seu modelo de crowdsourcing único e mecanismos de incentivo, tenta reestruturar a descoberta, comparação e utilização de modelos de IA, trazendo uma revolução paradigmática para o campo da avaliação de IA. Este artigo irá analisar em profundidade os mecanismos centrais da Yupp, os destaques técnicos, o histórico da equipe e o seu potencial impacto no ecossistema de IA.
Background da Equipa e Financiamento
Yupp está empenhada em resolver o problema de avaliação que existe há muito tempo na área da IA, com o objetivo de construir um mercado de feedback de IA "descentralizado". Através da Blockchain e incentivos económicos criptográficos, permite a circulação livre de feedback diversificado dos usuários, formando uma camada de avaliação de modelos escalável, justa e transparente. A Yupp, ao incentivar a distribuição de dados rotulados de alta qualidade, captura em tempo real as necessidades e preferências reais dos usuários em diferentes cenários, ajudando os desenvolvedores de IA a otimizar iterativamente o desempenho dos modelos.
O projeto foi fundado em junho de 2024 por Pankaj Gupta (co-fundador e CEO) e Gilad Mishne (co-fundador e responsável pela IA), com a participação do cientista chefe Jimmy Lin (professor da Universidade de Waterloo) na equipe principal. Os três trabalharam juntos no Twitter, onde desenvolveram e otimizaram sistemas de recomendação e busca em larga escala, e depois acumularam uma vasta experiência no Google e em uma plataforma de negociação.
A visão descentralizada e de transparência do valor dos dados da Yupp atende à dupla demanda dos fabricantes de IA por avaliações confiáveis e participação dos usuários, juntamente com o rico currículo da equipe central, conquistando o alto reconhecimento de personalidades conhecidas da indústria de tecnologia e dos principais investidores de risco.
Recentemente, a Yupp anunciou a conclusão de uma rodada de financiamento seed de 33 milhões de dólares, liderada por um conhecido parceiro de capital de risco, com outros investidores incluindo Jeff Dean, cientista-chefe da Google, Biz Stone, cofundador do Twitter, Evan Sharp, cofundador do Pinterest, Aravind Srinivas, CEO da Perplexity, Dan Boneh, Chris Re, Nick McKeown e Balaji Prabhakar da Universidade de Stanford, entre outros 45 renomados anjos e executivos de empresas, bem como o departamento de investimentos de uma plataforma de troca.
Funcionalidades principais e experiência do usuário
Como uma plataforma de avaliação de IA centralizada, a Yupp defende a ideia de "IA compartilhada por todos", permitindo que os usuários descubram, comparem e utilizem facilmente os modelos de IA mais recentes. Ao contrário das respostas únicas tradicionais, a Yupp retorna simultaneamente as respostas de dois (ou mais) modelos para cada prompt, formando uma "assembleia de IA". Este design não só atende à necessidade dos usuários por opções diversificadas, como também consegue identificar eficazmente as "ilusões" que os modelos podem apresentar, ajudando os usuários a tomar decisões mais informadas através da comparação. Como disse o CEO da Yupp, a saída paralela é especialmente benéfica para os usuários preocupados com erros de geração, pois permite que eles validem cruzadamente os resultados.
A plataforma agora suporta mais de 500 modelos de IA, abrangendo as áreas de geração de texto e imagem, incluindo vários modelos conhecidos e muitos modelos emergentes. Para otimizar ainda mais a experiência, o Yupp também lançou a funcionalidade "QuickTake", que pode resumir respostas longas em um tweet conciso.
Além disso, a Yupp valoriza muito a privacidade do usuário: todos os registros de chat são, por padrão, privados, a menos que o usuário opte por torná-los públicos; mesmo quando compartilhados publicamente, não são reveladas informações pessoais. Os usuários podem controlar a qualquer momento o conteúdo e o alcance do que compartilham.
Modelo econômico e mecanismos de incentivo
Yupp irá usar gratuitamente a combinação de feedback dos usuários com um sistema de "pontos" para medir a utilização do modelo. Os novos usuários recebem 5000 pontos ao se registarem, e podem ganhar mais pontos ao classificar as respostas do modelo, escolher preferências e explicar suas razões. Quanto maior a qualidade do feedback, maiores as recompensas, garantindo que os usuários possam usar modelos de alta qualidade gratuitamente de forma sustentável. A plataforma promete que os pontos só aumentam, e que todos os modelos atuais podem ser experimentados gratuitamente.
Após cada pergunta, os usuários recebem duas respostas do modelo e podem ganhar um "cartão raspadinha digital" através de feedback, recompensando-os com pontos que variam de 0 a 250. A cada 1000 pontos, é possível trocar por 1 dólar, e os usuários podem retirar até 10 dólares por dia, com um máximo de 50 dólares por mês. Os pontos podem ser trocados por dólares, euros e mais de 20 outras moedas, com parceiros incluindo várias plataformas de pagamento conhecidas. Ao mesmo tempo, a plataforma integrou certas redes de Blockchain e stablecoins, oferecendo recompensas instantâneas e sem taxas para usuários em todo o mundo.
Como o CEO disse, o feedback de alta qualidade gerado pelos usuários tem um valor muito maior para o ajuste fino de modelos e o aprendizado por reforço das empresas de IA do que a recompensa em si. Embora a receita mensal dos usuários possa ser equivalente a apenas algumas chávenas de café, esses dados de anotação pagos são cruciais para a iteração da IA.
Para incentivar mais pessoas a participarem, a Yupp também estabeleceu recompensas por recomendação: o recomendador recebe 5000 pontos, e a pessoa recomendada recebe 1000 pontos; atualmente, os novos usuários registrados podem ganhar 5000 pontos, e a pessoa recomendada recebe um adicional de 2500 pontos.
Yupp VIBE评分:Nova paradigma de avaliação por IA
Para abordar a falta de transparência, a insuficiência de equidade e a desigualdade na obtenção de dados de avaliação nos rankings existentes, a Yupp lançou a versão beta do ranking AI e o sistema de pontuação "Yupp VIBE (Vibe Intelligence Benchmark) Score". Este sistema agrega dados de preferência gerados por usuários em interações naturais ao redor do mundo, visando fornecer resultados de avaliação robustos e confiáveis.
Os princípios de avaliação da Yupp incluem:
Robustez: garantir representatividade (abranger cenários diversos), veracidade (refletir as preocupações dos usuários), resistência a fraudes (combater comportamentos maliciosos);
Confiabilidade: justo e neutro (sem viés para o modelo), transparente e público (divulgação detalhada do algoritmo de classificação), rigoroso e científico (seguindo normas de avaliação).
A plataforma não apenas coleta preferências binárias, mas também incentiva os usuários a apontar os prós e contras das respostas (como "corta na ferida", "velocidade rápida", "bom estilo", etc.), e realiza análises de agrupamento com base em informações sobre a idade, educação, profissão, entre outros, para mostrar as diferenças de preferência entre diferentes grupos.
Do ponto de vista técnico, a Yupp está a explorar o uso de Blockchain, primitivas criptográficas e provas de zero conhecimento, entre outras tecnologias, para garantir que o processo de avaliação seja justo, transparente e verificável. Ao mesmo tempo, a plataforma já estabeleceu parcerias com fornecedores de dados de IA profissionais, através da verificação de arquivos e calibração dos avaliadores com múltiplas camadas de controlo de qualidade, para eliminar dados maliciosos.
A lista foi recentemente atualizada, exibindo as pontuações VIBE de vários modelos de IA conhecidos, bem como suas taxas de vitória, taxas de rejeição, velocidade, latência, janela de contexto e indicadores de custo.
 e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
11 Curtidas
Recompensa
11
4
Compartilhar
Comentário
0/400
nft_widow
· 6h atrás
Outro novo ferramenta para fazer as pessoas de parvas?
Ver originalResponder0
GasGasGasBro
· 21h atrás
Blockchain é uma verdadeira porcaria, apenas uma chamada de atenção.
Yupp cria um novo paradigma de avaliação de IA com Blockchain, a incentivação através de crowdsourcing transforma a descoberta e uso de modelos.
Como a Yupp está a utilizar o Blockchain e mecanismos de incentivo para redefinir o modelo de avaliação de IA?
As aplicações de IA estão a penetrar em diversos setores, e como avaliar com precisão o desempenho dos modelos e aumentar a confiança dos utilizadores tornou-se um problema urgente a ser resolvido. Os métodos de avaliação tradicionais dependem em grande parte de mecanismos centralizados, que têm dificuldade em cobrir cenários diversificados e não conseguem refletir verdadeiramente as preferências dos utilizadores. Ao mesmo tempo, o problema da "ilusão" dos modelos ocorre frequentemente, levando os utilizadores a caírem em bolhas de informação ao escolher.
Neste contexto, a nova plataforma Yupp, com o seu modelo de crowdsourcing único e mecanismos de incentivo, tenta reestruturar a descoberta, comparação e utilização de modelos de IA, trazendo uma revolução paradigmática para o campo da avaliação de IA. Este artigo irá analisar em profundidade os mecanismos centrais da Yupp, os destaques técnicos, o histórico da equipe e o seu potencial impacto no ecossistema de IA.
Background da Equipa e Financiamento
Yupp está empenhada em resolver o problema de avaliação que existe há muito tempo na área da IA, com o objetivo de construir um mercado de feedback de IA "descentralizado". Através da Blockchain e incentivos económicos criptográficos, permite a circulação livre de feedback diversificado dos usuários, formando uma camada de avaliação de modelos escalável, justa e transparente. A Yupp, ao incentivar a distribuição de dados rotulados de alta qualidade, captura em tempo real as necessidades e preferências reais dos usuários em diferentes cenários, ajudando os desenvolvedores de IA a otimizar iterativamente o desempenho dos modelos.
O projeto foi fundado em junho de 2024 por Pankaj Gupta (co-fundador e CEO) e Gilad Mishne (co-fundador e responsável pela IA), com a participação do cientista chefe Jimmy Lin (professor da Universidade de Waterloo) na equipe principal. Os três trabalharam juntos no Twitter, onde desenvolveram e otimizaram sistemas de recomendação e busca em larga escala, e depois acumularam uma vasta experiência no Google e em uma plataforma de negociação.
A visão descentralizada e de transparência do valor dos dados da Yupp atende à dupla demanda dos fabricantes de IA por avaliações confiáveis e participação dos usuários, juntamente com o rico currículo da equipe central, conquistando o alto reconhecimento de personalidades conhecidas da indústria de tecnologia e dos principais investidores de risco.
Recentemente, a Yupp anunciou a conclusão de uma rodada de financiamento seed de 33 milhões de dólares, liderada por um conhecido parceiro de capital de risco, com outros investidores incluindo Jeff Dean, cientista-chefe da Google, Biz Stone, cofundador do Twitter, Evan Sharp, cofundador do Pinterest, Aravind Srinivas, CEO da Perplexity, Dan Boneh, Chris Re, Nick McKeown e Balaji Prabhakar da Universidade de Stanford, entre outros 45 renomados anjos e executivos de empresas, bem como o departamento de investimentos de uma plataforma de troca.
Funcionalidades principais e experiência do usuário
Como uma plataforma de avaliação de IA centralizada, a Yupp defende a ideia de "IA compartilhada por todos", permitindo que os usuários descubram, comparem e utilizem facilmente os modelos de IA mais recentes. Ao contrário das respostas únicas tradicionais, a Yupp retorna simultaneamente as respostas de dois (ou mais) modelos para cada prompt, formando uma "assembleia de IA". Este design não só atende à necessidade dos usuários por opções diversificadas, como também consegue identificar eficazmente as "ilusões" que os modelos podem apresentar, ajudando os usuários a tomar decisões mais informadas através da comparação. Como disse o CEO da Yupp, a saída paralela é especialmente benéfica para os usuários preocupados com erros de geração, pois permite que eles validem cruzadamente os resultados.
A plataforma agora suporta mais de 500 modelos de IA, abrangendo as áreas de geração de texto e imagem, incluindo vários modelos conhecidos e muitos modelos emergentes. Para otimizar ainda mais a experiência, o Yupp também lançou a funcionalidade "QuickTake", que pode resumir respostas longas em um tweet conciso.
Além disso, a Yupp valoriza muito a privacidade do usuário: todos os registros de chat são, por padrão, privados, a menos que o usuário opte por torná-los públicos; mesmo quando compartilhados publicamente, não são reveladas informações pessoais. Os usuários podem controlar a qualquer momento o conteúdo e o alcance do que compartilham.
Modelo econômico e mecanismos de incentivo
Yupp irá usar gratuitamente a combinação de feedback dos usuários com um sistema de "pontos" para medir a utilização do modelo. Os novos usuários recebem 5000 pontos ao se registarem, e podem ganhar mais pontos ao classificar as respostas do modelo, escolher preferências e explicar suas razões. Quanto maior a qualidade do feedback, maiores as recompensas, garantindo que os usuários possam usar modelos de alta qualidade gratuitamente de forma sustentável. A plataforma promete que os pontos só aumentam, e que todos os modelos atuais podem ser experimentados gratuitamente.
Após cada pergunta, os usuários recebem duas respostas do modelo e podem ganhar um "cartão raspadinha digital" através de feedback, recompensando-os com pontos que variam de 0 a 250. A cada 1000 pontos, é possível trocar por 1 dólar, e os usuários podem retirar até 10 dólares por dia, com um máximo de 50 dólares por mês. Os pontos podem ser trocados por dólares, euros e mais de 20 outras moedas, com parceiros incluindo várias plataformas de pagamento conhecidas. Ao mesmo tempo, a plataforma integrou certas redes de Blockchain e stablecoins, oferecendo recompensas instantâneas e sem taxas para usuários em todo o mundo.
Como o CEO disse, o feedback de alta qualidade gerado pelos usuários tem um valor muito maior para o ajuste fino de modelos e o aprendizado por reforço das empresas de IA do que a recompensa em si. Embora a receita mensal dos usuários possa ser equivalente a apenas algumas chávenas de café, esses dados de anotação pagos são cruciais para a iteração da IA.
Para incentivar mais pessoas a participarem, a Yupp também estabeleceu recompensas por recomendação: o recomendador recebe 5000 pontos, e a pessoa recomendada recebe 1000 pontos; atualmente, os novos usuários registrados podem ganhar 5000 pontos, e a pessoa recomendada recebe um adicional de 2500 pontos.
Yupp VIBE评分:Nova paradigma de avaliação por IA
Para abordar a falta de transparência, a insuficiência de equidade e a desigualdade na obtenção de dados de avaliação nos rankings existentes, a Yupp lançou a versão beta do ranking AI e o sistema de pontuação "Yupp VIBE (Vibe Intelligence Benchmark) Score". Este sistema agrega dados de preferência gerados por usuários em interações naturais ao redor do mundo, visando fornecer resultados de avaliação robustos e confiáveis.
Os princípios de avaliação da Yupp incluem:
Robustez: garantir representatividade (abranger cenários diversos), veracidade (refletir as preocupações dos usuários), resistência a fraudes (combater comportamentos maliciosos);
Confiabilidade: justo e neutro (sem viés para o modelo), transparente e público (divulgação detalhada do algoritmo de classificação), rigoroso e científico (seguindo normas de avaliação).
A plataforma não apenas coleta preferências binárias, mas também incentiva os usuários a apontar os prós e contras das respostas (como "corta na ferida", "velocidade rápida", "bom estilo", etc.), e realiza análises de agrupamento com base em informações sobre a idade, educação, profissão, entre outros, para mostrar as diferenças de preferência entre diferentes grupos.
Do ponto de vista técnico, a Yupp está a explorar o uso de Blockchain, primitivas criptográficas e provas de zero conhecimento, entre outras tecnologias, para garantir que o processo de avaliação seja justo, transparente e verificável. Ao mesmo tempo, a plataforma já estabeleceu parcerias com fornecedores de dados de IA profissionais, através da verificação de arquivos e calibração dos avaliadores com múltiplas camadas de controlo de qualidade, para eliminar dados maliciosos.
A lista foi recentemente atualizada, exibindo as pontuações VIBE de vários modelos de IA conhecidos, bem como suas taxas de vitória, taxas de rejeição, velocidade, latência, janela de contexto e indicadores de custo.
![a16z liderou uma rodada de sementes de 33 milhões de dólares, como a Yupp está redefinindo o modelo de avaliação de IA com base na Blockchain e incentivos?](https://img-cdn.gateio.im/webp-social/moments-72ec1eb4ea4b0853690939a455fd9194.webp01
Desenvolvimento e Perspectivas Futuras
Yupp será oficialmente lançado em 13 de junho de 2025, após seis meses de testes internos. Desde o lançamento, o produto tem passado por iterações contínuas:
Suporte multimodal: integração de vários modelos de geração de imagens e suporte a upload de imagens/PDF para perguntas;
Expansão das formas de interação: nova funcionalidade de entrada por voz e leitura em voz alta.
Atualização do modelo: introdução gradual de vários novos modelos e da categoria "MAX modelo";
Informação em tempo real: Roteia os pedidos de consulta online para a plataforma relevante, incluindo citações com hiperlink;
Atualização de pagamento: Adição de várias opções de pagamento e suporte a moedas;
Compartilhamento e exportação: suporte para cópia com formatação, exportação em PDF/texto/Markdown, compartilhamento de uma única resposta ou de toda a conversa conforme necessário;
Atividades da comunidade: realização de atividades como o "Desafio de Dicas de IA", com prêmios que podem chegar a dezenas de milhares de pontos; novas funcionalidades como página de perfil pessoal, nomes de chat gerados automaticamente por IA, entre outras.
A missão da Yupp é "capacitar a humanidade a moldar o futuro da IA". O CEO acredita que o desenvolvimento da IA precisa da participação e contribuição de todos. Através de respostas de IA de múltiplas perspectivas e feedback dos usuários, a Yupp não só ajuda os usuários a tomarem melhores decisões, mas também fornece um impulso constante para a evolução da IA.
Vale a pena mencionar que um dos principais concorrentes do Yupp é a plataforma de avaliação de modelos de IA LMArena, que é muito popular entre os profissionais de IA, mas que atualmente está em fase de exploração comercial e não utiliza tecnologia Blockchain para oferecer recompensas materiais diretas ou mecanismos de incentivo em pontos para a participação dos usuários.
Em geral, o Yupp, com um sistema de avaliação impulsionado por um modelo de crowdsourcing, mecanismos de incentivo e preferências reais dos usuários, abriu novos caminhos para a avaliação de IA. Ele não apenas oferece aos usuários uma experiência interativa de IA gratuita e diversificada, mas também transforma o feedback dos usuários em dados de treinamento de alto valor, promovendo a otimização contínua do modelo. Com uma equipe experiente e apoio de capital de topo, o Yupp tem potencial para desempenhar um papel-chave no futuro ecossistema de IA, realizando a visão de "todos desfrutam da IA, todos moldam a IA".
No entanto, para o Yupp que acabou de ser lançado, como garantir continuamente a qualidade dos dados, resistir a potenciais comportamentos fraudulentos e equilibrar a comercialização com os incentivos aos usuários em meio à participação em larga escala, ainda será uma direção que precisa ser constantemente explorada e otimizada no seu desenvolvimento futuro.