随着人工智能技术的飞速发展,如何科学评估模型性能并建立用户信任已成为行业核心挑战。传统评估体系存在明显短板:集中化机制难以覆盖多元场景,无法真实反映用户偏好,而模型”幻觉”现象频发更让用户陷入选择困境。在这一关键节点,Yupp 平台应运而生,凭借创新的区块链技术与激励机制,正在重新定义 AI 模型的发现、比较和使用方式,为 AI 评估领域带来革命性变革。
Yupp 团队由资深技术专家领导,创始人 Pankaj Gupta 和 Gilad Mishne 拥有 Twitter、Google 和 Coinbase 的丰富经验,首席科学家 Jimmy Lin(滑铁卢大学教授)更参与核心研发。三人自 2010 年起共事,在推荐系统与搜索技术领域取得突破性成果。他们创立 Yupp 的初衷是构建一个”去信任”的 AI 反馈市场,通过区块链和加密经济机制实现用户反馈的透明流通,形成可扩展、公平的模型评估体系。这种创新理念迅速获得行业认可,在 A16z 领投的 3300 万美元种子轮融资中,吸引了 Google 首席科学家 Jeff Dean、Twitter 联合创始人 Biz Stone 等知名投资人参与。
Yupp 的核心功能设计极具创新性。平台秉持”人人共享 AI”理念,让用户能够轻松发现、比较和使用最新 AI 模型。其独创的”AI 议会”机制,针对每个提示同时呈现两个模型答案,既满足用户多样化需求,又能有效识别模型”幻觉”。正如 CEO Pankaj Gupta 所强调,并排输出结果对关注生成错误的用户尤为有益,便于交叉验证。平台已接入 500 多款 AI 模型,涵盖 ChatGPT、Claude、Gemini 等主流模型及众多新兴产品,并推出”QuickTake”功能将长回复提炼为推文级内容。
在用户体验方面,Yupp 采取彻底的隐私保护策略:所有聊天记录默认私密,用户可自主控制分享范围;即使公开分享也不泄露任何个人信息。经济模型设计巧妙,将免费使用与用户反馈深度结合。新用户注册即获 5000 积分,通过评分、选择偏好等互动可持续赚取积分,确保免费使用高端模型。平台推出”数字刮刮卡”机制,每次提问后用户可赢取 0-250 不等积分,1000 积分兑换 1 美元,每日最高提现 10 美元,支持 20 余种货币兑换。特别值得一提的是,平台集成 Base Ethernet L2 和 Solana 稳定币,为全球用户提供即时无手续费奖励。
Yupp VIBE 评分系统是 AI 评估领域的重要创新。针对现有排行榜透明度不足、公平性欠缺等问题,该系统通过收集全球用户自然交互中的偏好数据,提供稳健可信赖的评估结果。评估原则包括:保证代表性、真实性、抗作弊性;确保公平中立、透明公开、严谨科学。平台不仅收集二元偏好数据,还鼓励用户标注回复优缺点,并根据用户属性进行分群分析。技术层面,Yupp 正探索区块链、密码学原语及零知识证明等前沿技术,确保评估过程公正可验证。
自 2025 年 6 月 13 日正式上线以来,Yupp 持续迭代优化:接入 Dall-E、Stable Diffusion 等多模态模型,支持图像/PDF 提问;新增语音输入与朗读功能;引入 DeepSeek R1/V3、Mistral Small 3 等最新模型;实现实时信息查询并附带超链接引文;升级支付系统支持 PayPal 提现及 24 种货币;优化分享导出功能;举办 AI 提示挑战赛等活动。Yupp 的使命是”赋能人类塑造 AI 的未来”,通过多视角 AI 回应和用户反馈,既帮助用户更好决策,也为 AI 进化提供持续动力。
与 LMArena 等传统评测平台不同,Yupp 创新性地结合区块链技术对用户参与提供直接物质奖励。虽然目前月度收益仅相当于几杯咖啡,但这些高质量标注数据对 AI 公司至关重要。Yupp 的未来发展方向包括:持续提升数据质量、防范作弊行为、平衡商业化与用户激励。这一创新平台有望在 AI 生态中扮演关键角色,实现”人人皆享 AI,人人塑造 AI”的愿景,为人工智能发展注入更多民主化力量。
本文网址:http://www.idea2003.cn/news/15988.html