Yupp создает новую парадигму оценки AI с помощью Блокчейн, а краудсорсинговые стимулы переопределяют обнаружение и использование моделей.

Как Yupp использует Блокчейн и механизмы стимулов для переосмыслении модели оценки ИИ?

Применение ИИ углубляется в различных отраслях, и как точно оценить производительность модели и повысить доверие пользователей стало насущной проблемой. Традиционные методы оценки часто полагаются на централизованные механизмы, которые трудно охватить разнообразные сценарии и не могут в полной мере отразить предпочтения пользователей. В то же время проблема "иллюзий" моделей возникает часто, и пользователи при выборе часто попадают в информационный пузырь.

В этом контексте новая платформа Yupp, благодаря уникальной модели краудсорсинга и механизму стимулов, пытается изменить способы обнаружения, сравнения и использования AI моделей, привнося парадигмальную революцию в область оценки AI. Эта статья углубленно проанализирует основные механизмы Yupp, технологические особенности, фон команды и его потенциальное влияние на экосистему AI.

Фон команды и финансирование

Yupp стремится решить долгосрочную проблему оценки в области ИИ и нацелен на создание "доверительного" рынка обратной связи ИИ. С помощью Блокчейн и криптоэкономических стимулов, разнообразная обратная связь пользователей свободно циркулирует, формируя масштабируемый, справедливый и прозрачный уровень оценки моделей. Yupp способствует распределению высококачественных вручную размеченных данных, своевременно улавливая реальные потребности и предпочтения пользователей в различных сценариях, помогая разработчикам ИИ оптимизировать производительность моделей.

Проект был основан Панджаком Гуптой (соучредителем и генеральным директором) и Гиладом Мишне (соучредителем и руководителем ИИ) в июне 2024 года, также в核心团队 участвовал главный научный сотрудник Джимми Лин (профессор Университета Ватерлоо). Все трое ранее работали в Twitter, создавая и оптимизируя крупномасштабные системы рекомендаций и поиска, а затем приобрели богатый опыт в Google и на одной из торговых платформ.

Видение Yupp, направленное на децентрализацию и прозрачность ценности данных, отвечает двойным требованиям производителей ИИ к надежной оценке и участию пользователей. В сочетании с богатым опытом основной команды это принесло высокую признательность со стороны известных личностей в технологической отрасли и ведущих венчурных капиталистов.

Недавно Yupp объявила о завершении раунда посевного финансирования на сумму 33 миллиона долларов, который возглавил известный венчурный партнер. Среди других инвесторов — главный ученый Google Джефф Дин, соучредитель Twitter Биз Стоун, соучредитель Pinterest Эван Шарп, генеральный директор Perplexity Аравинд Сринивас, профессор Стэнфордского университета Дэн Боне, Крис Ре, Ник Макион и Баладжи Прабхакар, а также 45 известных ангелов и корпоративных руководителей, а также инвестиционный отдел одной торговой платформы.

a16z инвестировал 33 миллиона долларов в начальный раунд, как Yupp переосмысляет модель оценки AI на основе Блокчейн и стимулов?

Основные функции и пользовательский опыт

Как централизованная платформа оценки ИИ, Yupp придерживается идеи "ИИ для всех", позволяя пользователям легко находить, сравнивать и использовать новейшие модели ИИ. В отличие от традиционного единственного ответа, Yupp одновременно возвращает ответы от двух (и более) моделей на каждый запрос, формируя "парламент ИИ". Эта концепция не только удовлетворяет потребности пользователей в разнообразии выбора, но и эффективно выявляет возможные "галлюцинации" моделей, помогая пользователям принимать более обоснованные решения через сравнение. Как сказал генеральный директор Yupp, параллельный вывод особенно полезен для пользователей, обеспокоенных ошибками генерации, так как они могут использовать это для перекрестной проверки результатов.

Платформа теперь поддерживает более 500 моделей ИИ, охватывающих области генерации текста и изображений, включая несколько известных моделей и множество новых. Для дальнейшей оптимизации опыта Yupp также представила функцию "QuickTake", которая позволяет сокращать длинные ответы до компактного твита.

Кроме того, Yupp придает большое значение конфиденциальности пользователей: все записи чатов по умолчанию являются частными, если пользователь не решит их открыть; даже при открытом обмене не раскрывается никакая личная информация. Пользователи могут в любое время контролировать содержимое и объем обмена.

a16z инвестирует 33 миллиона долларов в начальный раунд, как Yupp использует Блокчейн и стимулы для переосмысления модели оценки ИИ?

Экономическая модель и механизмы стимулирования

Yupp будет бесплатно использовать сочетание обратной связи от пользователей и системы "баллов" для оценки использования модели. Новые пользователи получают 5000 баллов при регистрации, а затем могут зарабатывать дополнительные баллы, оценивая ответы модели, выбирая предпочтения и объясняя свои причины. Чем выше качество обратной связи, тем больше вознаграждение, что гарантирует пользователям возможность постоянного бесплатного использования высококачественных моделей. Платформа обещает, что баллы только будут увеличиваться, и что все текущие модели будут доступны для бесплатного тестирования.

После каждого вопроса пользователи получают два ответа от модели и могут заработать "цифровую скретч-карту" через обратную связь, получая от 0 до 250 баллов. Каждые 1000 баллов можно обменять на 1 доллар, пользователи могут вывести максимум 10 долларов в день и 50 долларов в месяц. Баллы можно обменять на доллары, евро и более 20 других валют, партнеры включают несколько известных платежных платформ. В то же время платформа интегрировала некоторые Блокчейн-сети и стейблкоины, чтобы предоставить всемирным пользователям мгновенные вознаграждения без комиссии.

Как сказал CEO, высококачественная обратная связь от пользователей имеет гораздо большую ценность для настройки моделей и обучения с подкреплением в AI-компании, чем само вознаграждение. Хотя месячная прибыль пользователей может составлять всего несколько чашек кофе, эти оплаченные данные для аннотации имеют решающее значение для итерации AI.

Чтобы стимулировать больше людей участвовать, Yupp также установил программу вознаграждений за рекомендации: рекомендатель получает 5000 баллов, а рекомендованный получает 1000 баллов; в настоящее время новые зарегистрированные пользователи могут получить 5000 баллов, а рекомендованный дополнительно получает 2500 баллов.

a16z инвестировала 33 миллиона долларов в начальный раунд, как Yupp на основе Блокчейн и стимулов переосмысляет модель оценки ИИ?

Yupp VIBE评分:Новая парадигма оценки ИИ

В ответ на проблемы недостаточной прозрачности существующих рейтингов, нехватки справедливости и неравномерного доступа к данным оценки, Yupp выпустил тестовую версию AI-рейтинга и систему оценки "Yupp VIBE (Vibe Intelligence Benchmark) Score". Эта система собирает предпочтительные данные от пользователей по всему миру, полученные в ходе естественного взаимодействия, с целью предоставления надежных и доверительных результатов оценки.

Принципы оценки Yupp включают:

  • Устойчивость: гарантировать репрезентативность (охватывать разнообразные сценарии), подлинность (отражать заботы пользователей), устойчивость к мошенничеству (сопротивляться злонамеренным действиям);

  • Надежность: справедливость и нейтральность (без предвзятости к модели), прозрачность и открытость (подробное раскрытие алгоритма ранжирования), строгость и научность (соблюдение стандартов оценки).

Платформа не только собирает двоичные предпочтения, но и поощряет пользователей указывать достоинства и недостатки ответов (например, "по существу", "быстрая скорость", "хороший стиль" и т.д.), а также проводит кластерный анализ на основе информации о возрасте, образовании, профессии пользователей, демонстрируя различия в предпочтениях разных групп.

На техническом уровне Yupp исследует использование Блокчейн, криптографических примитивов и доказательства с нулевым разглашением для обеспечения справедливости, прозрачности и проверяемости процесса оценки. В то же время платформа сотрудничает с профессиональными поставщиками AI данных, очищая недостоверные данные через верификацию архивов и многослойную проверку качества оценщиков.

Недавний рейтинг обновлен, он демонстрирует VIBE оценки и показатели побед, уровня неприязни, скорости, задержки, окна контекста и стоимости для нескольких известных AI моделей.

![a16z вложил 33 миллиона долларов в начальный раунд, как Yupp переосмысливает модель оценки ИИ на основе Блокчейна и стимулов?](https://img-cdn.gateio.im/webp-social/moments-72ec1eb4ea4b0853690939a455fd9194.webp01

История развития и перспективы на будущее

Yupp официально запустится 13 июня 2025 года, предварительно проведя шестимесячное внутреннее тестирование. С момента запуска продукт постоянно улучшался:

  • Мульти-модальная поддержка: подключение нескольких моделей генерации изображений и поддержка загрузки пользователем изображений/PDF для вопросов;

  • Способы взаимодействия расширены: добавлены функции голосового ввода и голосового чтения;

  • Обновление модели: Постепенно вводятся новые модели и категория "MAX модели";

  • Актуальная информация: маршрутизация онлайн-запросов на соответствующие платформы с добавлением гиперссылок на источники;

  • Обновление платежей: добавлены различные способы оплаты и поддержка валют;

  • Экспорт поделиться: поддержка копирования с сохранением формата, экспорт в PDF/текст/Markdown, возможность поделиться отдельным ответом или целым разговором по необходимости;

  • Сообщество: проведение мероприятий, таких как "Челлендж по подсказкам AI" и другие, призы до нескольких тысяч баллов; добавлены страницы профиля, автоматически сгенерированные имена для чата и другие функции.

Миссия Yupp заключается в том, чтобы "наделить людей силой формировать будущее ИИ". Генеральный директор считает, что развитие ИИ требует участия и вклада каждого. Благодаря многогранным ответам ИИ и отзывам пользователей, Yupp не только помогает пользователям принимать лучшие решения, но и предоставляет неистощимый источник энергии для эволюции ИИ.

Стоит отметить, что одним из основных конкурентов Yupp является платформы оценки открытых AI моделей LMArena, которая очень популярна среди специалистов в сфере AI, но в настоящее время находится на этапе коммерческого исследования и не использует технологии Блокчейн для предоставления пользователям прямых материальных вознаграждений или механизмов мотивации в виде баллов.

В целом, Yupp открывает новый путь в оценке ИИ с помощью системы оценки, управляемой краудсорсингом, механизмом стимулов и реальными предпочтениями пользователей. Он не только предлагает пользователям бесплатный и разнообразный опыт взаимодействия с ИИ, но и преобразует отзывы пользователей в высококачественные тренировочные данные, способствуя постоянной оптимизации модели. Благодаря опытной команде и поддержке ведущих капиталов, Yupp имеет все шансы сыграть ключевую роль в будущем ИИ-экосистеме, реализуя видение "каждый наслаждается ИИ, каждый формирует ИИ".

Тем не менее, для только что запущенного Yupp, как в условиях массового участия пользователей постоянно обеспечивать качество данных, противостоять потенциальным мошенническим действиям и находить баланс между коммерциализацией и пользовательскими стимулами, по-прежнему будет направлением, которое необходимо постоянно исследовать и оптимизировать в будущем.

MAX-1.88%
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 6
  • Поделиться
комментарий
0/400
GetRichLeekvip
· 3ч назад
Еще один проект по сбору неудачников пришел! Старые неудачники говорят, что уже сидят в засаде.
Посмотреть ОригиналОтветить0
ForkTonguevip
· 9ч назад
Блокчейн验AI? Это же кошка Шрёдингера.
Посмотреть ОригиналОтветить0
nft_widowvip
· 07-31 02:55
Ещё один новый инструмент для неудачников?
Посмотреть ОригиналОтветить0
GasGasGasBrovip
· 07-30 12:31
Блокчейн инфраструктура - это просто чепуха, всего лишь рекламный трюк.
Посмотреть ОригиналОтветить0
VibesOverChartsvip
· 07-30 12:30
Цыц, ещё один раунд финансирования?
Посмотреть ОригиналОтветить0
DoomCanistervip
· 07-30 12:02
Это всего лишь старая схема с новой раскруткой.
Посмотреть ОригиналОтветить0
  • Закрепить