a16z lidera la Ronda Semilla de $33M — Cómo Yupp aprovecha la Cadena de bloques y los incentivos para redefinir los modelos de evaluación de IA

Intermedio

6/19/2025, 2:54:41 AM

a16z lideró una ronda semilla de 33 millones de dólares. ¿Cómo reconfigura Yupp la evaluación de modelos de IA a través de la Cadena de bloques y mecanismos de incentivos? Este artículo detalla su modelo de evaluación basado en la multitud, el sistema de puntuación VIBE, la arquitectura técnica y la visión de desarrollo, explorando nuevas posibilidades en la intersección de la IA y Web3.

A medida que las aplicaciones de IA penetran en diversas industrias, evaluar con precisión el rendimiento del modelo y aumentar la confianza del usuario se ha convertido en un problema urgente. Las evaluaciones tradicionales a menudo dependen de mecanismos centralizados, lo que dificulta cubrir diversos escenarios y no refleja las verdaderas preferencias del usuario; al mismo tiempo, el problema de la "alucinación" del modelo surge con frecuencia, lo que provoca que los usuarios a menudo caigan en silos de información al tomar decisiones.

En este contexto, Yupp, como una nueva plataforma, está intentando remodelar el descubrimiento, comparación y utilización de modelos de IA con su único modelo de crowdsourcing y mecanismo de incentivos, trayendo un cambio de paradigma al campo de la evaluación de IA. Este artículo profundizará en los mecanismos centrales de Yupp, aspectos técnicos destacados, antecedentes del equipo y su impacto potencial en el ecosistema de IA.

Antecedentes del equipo y financiación: Respaldado por la experiencia de gigantes tecnológicos

Yupp se centra en resolver los desafíos de evaluación de larga data en el campo de la IA, dedicado a construir un mercado de retroalimentación de IA "sin confianza"—permitiendo que la retroalimentación diversa de los usuarios circule libremente bajo la protección de la cadena de bloques y los incentivos criptoeconómicos, formando así una capa de evaluación de modelos escalable, justa y transparente. Al incentivar la distribución de datos de alta calidad anotados manualmente, Yupp puede captar rápidamente las verdaderas necesidades y preferencias de los usuarios en diferentes escenarios, ayudando a los desarrolladores de IA a optimizar el rendimiento del modelo de manera iterativa.

El proyecto fue fundado en junio de 2024 por Pankaj Gupta (Co-fundador y CEO) y Gilad Mishne (Co-fundador y Jefe de IA), con el Científico Jefe Jimmy Lin (Profesor en la Universidad de Waterloo) también participando en el equipo central. Los tres habían trabajado juntos anteriormente en Twitter en 2010, donde construyeron y optimizaron sistemas de recomendación y búsqueda a gran escala, y luego adquirieron una amplia experiencia en Google y Coinbase.

Debido a su visión de descentralización y transparencia del valor de los datos, que puede satisfacer las demandas duales de los fabricantes de IA para una evaluación creíble y la participación de los usuarios, así como beneficiarse de la rica experiencia de su equipo central, Yupp ha obtenido un alto reconocimiento de figuras conocidas en la industria tecnológica y de los principales capitalistas de riesgo.

La semana pasada, Yupp anunció la finalización de una ronda semilla de $33 millones, liderada por el socio de A16z Chris Dixon. Otros inversores incluyen al Chief Scientist de Google Jeff Dean, al cofundador de Twitter Biz Stone, al cofundador de Pinterest Evan Sharp, al CEO de Perplexity Aravind Srinivas, a Dan Boneh de la Universidad de Stanford, a Chris Re, a Nick McKeown y a Balaji Prabhakar, entre 45 ángeles y ejecutivos corporativos bien conocidos, así como a Coinbase Ventures.

Características clave y experiencia del usuario: Construyendo un "Parlamento de IA"

Como una plataforma de evaluación de IA centralizada, Yupp se adhiere a la filosofía de “Cada IA para todos”, permitiendo a los usuarios descubrir, comparar y utilizar fácilmente los últimos modelos de IA. A diferencia de las respuestas únicas tradicionales, Yupp devuelve respuestas de dos (o incluso más) modelos simultáneamente para cada solicitud, formando un “parlamento de IA”. Este diseño no solo satisface las demandas de los usuarios por opciones diversas, sino que también identifica de manera efectiva las posibles “alucinaciones” que los modelos pueden producir, ayudando a los usuarios a tomar decisiones más informadas a través de la comparación. Como afirmó el CEO de Yupp, Pankaj Gupta, las salidas lado a lado son particularmente beneficiosas para los usuarios preocupados por errores de generación, ya que pueden verificar los resultados.

La plataforma ahora admite más de 500 modelos de IA, cubriendo los campos de generación de texto e imagen, incluyendo modelos bien conocidos como ChatGPT, Claude, Gemini, DeepSeek, Grok, Llama y muchos modelos emergentes. Para optimizar aún más la experiencia, Yupp también ha lanzado la función "QuickTake", que puede destilar respuestas largas en un tuit conciso.

Además, Yupp otorga una alta prioridad a la privacidad del usuario: todos los registros de chat son privados por defecto a menos que el usuario los haga públicos activamente; incluso cuando se comparten públicamente, no se divulga información personal. Los usuarios pueden controlar el contenido y el alcance de la compartición en cualquier momento.

Modelos Económicos y Mecanismos de Incentivo: Valoración del Trabajo de Datos

Yupp utilizará la retroalimentación de los usuarios de forma gratuita y medirá el uso del modelo a través del sistema de "Yupp Points". Los nuevos usuarios reciben 5000 puntos al registrarse y pueden ganar más puntos calificando las respuestas del modelo, seleccionando preferencias y explicando sus razones. Cuanto mayor sea la calidad de la retroalimentación, mayores serán las recompensas, asegurando que los usuarios puedan utilizar de manera sostenible modelos de alta gama como Claude Opus 4 u OpenAI o3 de forma gratuita. La plataforma promete que los puntos solo aumentarán y que todos los modelos actuales se pueden experimentar de forma gratuita.

Después de cada pregunta, los usuarios recibirán dos respuestas modelo y pueden ganar una "tarjeta rasguña digital" a través de comentarios, recompensando puntos Yupp que varían de 0 a 250. Cada 1000 puntos se pueden canjear por 1 dólar, con un retiro máximo diario de 10 dólares y un máximo mensual de 50 dólares. Los puntos se pueden canjear por más de 20 monedas, incluyendo dólares y euros, con socios como Stripe, PayPal y Coinbase. Al mismo tiempo, la plataforma integra Base Ethernet L2 y monedas estables de Solana para proporcionar a los usuarios globales recompensas instantáneas y sin tarifas.

Como dijo Pankaj Gupta, la retroalimentación de alta calidad generada por los usuarios es mucho más valiosa para el ajuste fino de modelos y el aprendizaje por refuerzo de las empresas de IA que las recompensas en sí. Aunque las ganancias mensuales de los usuarios pueden ser equivalentes a solo unas pocas tazas de café, estos datos de anotación pagados son cruciales para la iteración de la IA.

Para incentivar a más personas a participar, Yupp también estableció una recompensa por referencia: el referente recibe 5000 puntos, y la persona referida recibe 1000 puntos; actualmente, los nuevos usuarios registrados pueden recibir 5000 puntos, y la persona referida además recibe 2500 puntos.

Yupp Calificación VIBE: Un Nuevo Paradigma para la Evaluación de IA

Para abordar los problemas existentes de insuficiente transparencia en los rankings, falta de equidad y acceso desigual a los datos de evaluación, Yupp ha lanzado una versión beta del ranking de IA y el sistema de calificación "Yupp VIBE (Vibe Intelligence Benchmark) Score". Este sistema agrega datos de preferencia generados por usuarios globales en interacciones naturales, con el objetivo de proporcionar resultados de evaluación sólidos y fiables.

Los principios de evaluación de Yupp incluyen:

Robustez: Asegurar la representatividad (cubriendo diversos escenarios), autenticidad (reflejando las preocupaciones del usuario) y anti-trampa (resistiendo comportamientos maliciosos);
Confiabilidad: Justo y neutral (imparcial al modelo), transparente y público (divulgación detallada de algoritmos de clasificación), riguroso y científico (adherido a estándares de evaluación).

La plataforma no solo recopila preferencias binarias, sino que también anima a los usuarios a señalar las ventajas y desventajas de las respuestas (como "al grano", "velocidad rápida", "buen estilo", etc.), y realiza un análisis de conglomerados basado en la edad, educación, ocupación y otra información de los usuarios para mostrar las diferencias de preferencias entre diferentes grupos.

A nivel técnico, Yupp está explorando el uso de Cadena de bloques, primitivas criptográficas y pruebas de cero conocimiento para garantizar que el proceso de evaluación sea justo, transparente y verificable. Al mismo tiempo, la plataforma se ha asociado con proveedores de datos de IA profesionales para calibrar los evaluadores a través de la verificación archivística y la detección de calidad multilayer para eliminar datos maliciosos.

La reciente tabla de clasificación ha sido actualizada, mostrando las puntuaciones VIBE de modelos como GPT‑4.5 Preview, Claude Opus 4 y Claude Sonnet 4, junto con sus tasas de ganancia, tasas de desagrado, velocidad, latencia, ventana de contexto y métricas de costo.

Historia del desarrollo y perspectivas futuras

Yupp se lanzó oficialmente el 13 de junio de 2025, después de seis meses de pruebas internas. Desde su lanzamiento, el producto ha estado iterando continuamente:

Soporte multimodal: Acceda a modelos como Dall‑E, Flux, Stable Diffusion, Luma Photon, Google Imagen 4, etc., y soporte para que los usuarios suban imágenes/PDFs para preguntas.
Expansión del método de interacción: se añadieron funciones de entrada por voz y lectura por voz;
Actualización del modelo: Introduciendo gradualmente DeepSeek R1/V3, Mistral Small 3, OpenAI o3-pro, Hermes 3, Amazon Nova Pro v1, serie Phi de Microsoft y categoría "modelo MAX";
Información en tiempo real: Rutea las solicitudes de consulta en línea a Perplexity y Google Gemini Live, junto con citas hiperlinkadas;
Actualización de pago: Se agregó retiro de PayPal de EE. UU., Venmo y soporte para 24 monedas a través de PayPal;
Exportar Compartir: Soporta copia que preserva el formato, exportación a PDF/Text/Markdown y compartir respuestas individuales o conversaciones completas según sea necesario;
Actividades comunitarias: Organizando eventos como el "Desafío de Prompts de IA" con premios de hasta decenas de miles de puntos; nuevas funciones como páginas de perfil personal y nombres de chat generados por IA.

La misión de Yupp es “empoderar a la humanidad para dar forma al futuro de la IA.” Pankaj Gupta cree que el desarrollo de la IA requiere la participación y contribución de todos. A través de respuestas de IA desde múltiples perspectivas y la retroalimentación de los usuarios, Yupp no solo ayuda a los usuarios a tomar mejores decisiones, sino que también proporciona una fuerza impulsora continua para la evolución de la IA.

Vale la pena mencionar que uno de los principales competidores de Yupp es la plataforma de evaluación de modelos de IA abierta LMArena (sitio web:https://lmarena.ai/），El sitio web es muy popular entre los profesionales de la IA, pero la plataforma se encuentra actualmente en la etapa de exploración comercial y no ofrece recompensas materiales directas ni mecanismos de incentivos de puntos por la participación de los usuarios aprovechando la tecnología de Cadena de bloques.

En general, Yupp ha abierto un nuevo camino para la evaluación de IA con su modelo de crowdsourcing, mecanismo de incentivos y sistema de evaluación impulsado por las preferencias reales de los usuarios. No solo ofrece a los usuarios una experiencia interactiva de IA gratuita y diversa, sino que también convierte la retroalimentación de los usuarios en datos de entrenamiento de alto valor, promoviendo la optimización continua del modelo. Con un equipo experimentado y un respaldo de capital de primer nivel, se espera que Yupp desempeñe un papel clave en el futuro ecosistema de IA, realizando la visión de “IA para todos, moldeada por todos.”

Sin embargo, para Yupp, que acaba de lanzarse, cómo garantizar continuamente la calidad de los datos, resistir comportamientos de trampa potenciales bajo la participación de un gran número de usuarios y encontrar un equilibrio entre la comercialización y los incentivos para los usuarios seguirá siendo una dirección que necesita ser explorada y optimizada en su desarrollo futuro.

Declaración:

Este artículo es reimpreso de [PANews] El copyright pertenece al autor original [ShenZhen] Si hay alguna objeción a la reimpresión, por favor contacte Equipo de Gate LearnEl equipo lo procesará lo más rápido posible de acuerdo con los procedimientos relevantes.
Descargo de responsabilidad: Las opiniones y puntos de vista expresados en este artículo son únicamente del autor y no constituyen ningún consejo de inversión.
Otras versiones en diferentes idiomas del artículo son traducidas por el equipo de Gate Learn, a menos que se indique lo contrario.GateBajo tales circunstancias, está prohibido copiar, difundir o plagiar artículos traducidos.