00后数学天才融资$420万,用ELO评分根治AI幻觉 | AI新闻

type
status
date
slug
summary
tags
category
icon
password
网址
你是否也曾对最顶尖的AI助手感到失望?当你提出一个看似简单的问题,却得到一个毫不相干甚至完全错误的答案。这个问题的根源,往往并非大语言模型(LLM)本身不够智能,而是它赖以思考的“大脑外存”——检索系统,从一开始就喂给了它错误的信息。这正是当前人工智能领域最棘手,也最普遍的瓶颈之一。
在这样的背景下,一家名为ZeroEntropy的初创公司横空出世,携420万美元种子轮融资,誓言要用一种源自数学天才的优雅方法,彻底解决AI最头疼的“找错信息”问题。更引人注目的是,其掌舵者是一位来自摩洛哥的00后女性创始人。这不仅仅是一则普通的AI资讯,它可能预示着AGI发展路径上的一次关键突破。

症结所在:为何顶尖AI也无法“找对”信息?

当前AI应用中普遍存在的“幻觉”问题,其罪魁祸首常常是检索增强生成(RAG)技术中的“检索”环节出了纰漏。传统的语义或关键词搜索在面对复杂、微妙的人类查询时,显得力不从心。ZeroEntropy的团队经过深入分析,总结出三大致命缺陷:
  • 否定查询的困境:当你尝试让AI寻找“不包含特定人物的电动车文章”时,系统反而会因为关键词匹配,优先返回大量讨论该人物的文章。这种南辕北辙的结果,在商业决策等严肃场景中可能是灾难性的。
  • 多步推理的断链:对于需要逻辑关联的问题,例如“某公司未召开股东大会的处罚是什么?”,AI系统需要先找到“未召开股东大会导致协议终止”的条款,再关联到“协议终止的处罚细则”。然而,现有系统只会孤立地返回两个不相关的片段,无法建立起这种逻辑链条,使得大模型的推理能力无从发挥。
  • 模糊过滤的失焦:当查询包含多个分散在文档不同位置的条件时,比如“在样本量超过2000的论文中,有哪些早期癌症的诊断方法?”,传统检索无法保证找到的文档同时满足“样本量”和“诊断方法”两个条件,导致推荐结果的精确度大打折扣。
这些问题的本质在于,我们给AI的工具太原始了。简单的向量匹配,无法真正理解人类语言的深层意图和复杂逻辑。

破局之道:借鉴国际象棋ELO评分的AI训练革命

ZeroEntropy的解决方案堪称一次范式革命。他们没有在现有框架上修修补补,而是借鉴了国际象棋界的ELO评分系统,从根本上重塑了AI模型的训练方式。
传统的模型训练依赖于标注好的“正负样本”,但这种方法存在一个致命缺陷——“假阴性”。系统在挖掘“困难负样本”时,常常会把一些虽然没有直接回答问题、但高度相关的有用信息错误地标记为负面,从而误导了模型的学习。
ZeroEntropy的创新之处在于:
  1. 从绝对评分到成对比较:他们放弃了“这个文档相关性是7分还是8分?”这种充满主观噪声的绝对评分,转而向标注者(无论是人类还是AI)提出一个更简单、更客观的问题:“在这两个文档中,哪一个与查询更相关?”。这种成对比较的方式,将标注的一致性从60-70%戏剧性地提升到了96%,从源头上保证了训练数据的超高质量。
  1. ELO评分系统的精妙应用:他们将每一篇候选文档视为一名“国际象棋选手”,成对比较的结果就是“比赛胜负”。通过ELO算法,系统为每个文档计算出一个动态的、相对的评分。这使得模型能够理解信息的层次结构和相对重要性,而不是简单地将其划分为“相关”或“不相关”。这种细腻的区分能力,是大模型实现精准回答的关键。
  1. 技术优化与超越:为了解决海量比较带来的计算难题,团队巧妙地运用图论,将计算复杂度从n²级别降低到O(n)级别。同时,他们还引入了“跨查询比较”机制,校准不同查询之间的评分标准,让模型学会判断“绝对相关性”的水平。
最终,他们训练出的ze-rank-1模型在多个公开和私有基准测试中,其性能显著超越了Cohere和Salesforce等行业巨头的同类模型,甚至比Gemini 2.5 Flash作为重排序器的表现还要出色。这一系列的技术突破,无疑是近期AI新闻中最具深远影响力的事件之一。

从摩洛哥到硅谷:多元化背景驱动的技术创新

ZeroEntropy的成功,也离不开其创始人Ghita Houir Alami的独特背景。这位在摩洛哥长大的女性,凭借卓越的才华进入法国顶尖的巴黎综合理工学院主修工程与数学,后又在加州大学伯克利分校深造。这种跨文化、跨学科的经历,让她能够从全新的视角审视AI领域的核心难题。
她的故事本身就是对科技行业多元化价值的最好证明。在一个长期由男性主导的领域,一位25岁的女性CEO正致力于攻克人工智能最底层的技术堡垒。她的团队也汇集了来自国际数学、信息学奥林匹克竞赛的顶尖人才,深厚的数理基础为他们的技术创新提供了坚实的保障。

不只是工具:构建AI基础设施的商业远见

ZeroEntropy的商业定位极其清晰:他们不做面向终端用户的搜索产品,而是成为“搜索领域的Supabase”——一个专为开发者服务的底层基础设施。开发者可以通过简单的API调用,将ZeroEntropy强大的重排序能力集成到自己的应用中,从而专注于核心产品逻辑,将AI的“繁重工作”交给专家。
为了推动技术普及和生态建设,他们采取了极具竞争力的定价策略,并开源了部分模型。这种开放的姿态,加上其技术的先进性,吸引了医疗、法律、客户支持等多个领域的早期客户。他们正在构建的,不仅仅是一个产品,更是一套全新的行业标准,包括他们即将开源的基准创建框架zbench。通过提供这些基础工具,他们正在帮助整个行业塑造AGI的未来,相关进展也成为各大AI门户网站(如专注于前沿动态的 AIGC导航)关注的焦点。

结论:通往AGI之路,始于精准检索

ZeroEntropy的崛起深刻地揭示了一个事实:通往通用人工智能(AGI)的道路,不仅需要更强大的LLM,更需要能够像人类记忆一样无缝、精准检索信息的“上下文模型”。当AI能够真正理解问题,并从海量数据中快速、准确地找到所需信息时,我们才能真正解锁其全部潜力。
这家由00后数学天才领导的初创公司,正是在为这个宏伟目标铺设最关键的一块基石。他们的工作提醒我们,真正的技术创新往往源于对基础问题的重新思考。对于每一个关注人工智能未来的人来说,与其等待下一个横空出世的大模型,不如关注像ZeroEntropy这样在底层默默耕耘的变革者。想要持续追踪这类决定行业走向的深度AI资讯和技术解读,可以关注 AIGC导航 这样的专业AI门户,获取最新、最全的行业动态。
Loading...

没有找到文章