xAI最佳AI模型2026年6月:<1%市场隐含概率,日交易量$16.8K,6月30日裁定日期。在Polymarket上通过Polymarket Trade进行实时交易。
连接钱包交易 · 无钱包?支持通行密钥登录 · /subscribe 免费提醒
xAI由埃隆·马斯克创立,已迅速进入与OpenAI、Anthropic和Google竞争的市场。其旗舰模型Grok虽然获得了关注,但在用于排名AI系统的标准化基准测试(MMLU、推理、编码、数学)上落后。预测市场给出几乎为零的市场隐含概率,认为xAI将在2026年6月30日(仅29天之后)获得'最佳AI模型'的称号。这反映了交易者的强烈共识,即近期不会有xAI版本的发布能够超越此时间窗口内OpenAI的GPT、Anthropic的Claude或Google的Gemini。AI领先地位跨越多个维度进行评估:基准测试得分、企业采用、安全评估和用户报告的能力。$132K的市场流动性加上接近0%的YES市场隐含概率表明,交易者认为xAI在6月取得突破性进展的可能性很小。如此极端的定价源于两个因素:(a)当前的竞争格局稳定和根深蒂固,(b)29天的时间不足以完成新模型发布、广泛评估和共识采纳。任何xAI的公告都需要不仅仅是竞争性能,而是明确的领先地位——这是一个罕见的结果。
xAI于2023年由埃隆·马斯克创立,其明确的使命是建立安全的AI系统并与OpenAI和Anthropic竞争。该公司获得了大量融资,并发布了Grok,这是一个在实时互联网数据上训练的对话型AI,并与X(前身为Twitter)集成。尽管有这种势头,Grok仍未在标准化评估中取代既有的领先者。哪个AI模型'最佳'的问题既是技术性的,也是主观的。从客观上讲,研究人员使用MMLU(多选知识)、GSM8K(小学数学)、ARC(科学推理)和编码任务(HumanEval、CodeForces)等基准测试来排名模型。从主观上讲,'最佳'可能意味着最有用、最安全、最符合人类意图或最创新的。截至2026年中期,在大多数已发布的基准测试中,OpenAI的最新GPT模型、Anthropic的Claude系列和Google的Gemini变体继续排名在顶部或接近顶部。xAI的Grok表现具有竞争力,但在这些指标上没有展示出明确的领先地位。 为了YES在6月30日之前获胜,xAI需要发布一个新模型,其在基准测试和现实性能上明显优越,使得AI社区迅速更新其排名。这是一个很高的标准:模型发布、评估周期和共识建立需要时间。即使OpenAI发布新版本的GPT,市场也不会立即宣布它'最佳'——通常会有一段独立评估、竞争反应和实证测试的时期。29天的时间窗口没有留下进行这种深思熟虑的余地。xAI不仅需要发布模型,还需要在6月30日之前获得几乎普遍的优越性认可。历史上,AI领导权的转变是渐进的。当GPT-4在2023年3月发布时,用了数周到数月的时间来巩固共识。市场定价表明不期望这样突然、决定性的xAI突破。 对于否定,现有的领导者(OpenAI、Anthropic、Google)在基准性能、研究成果、安全评估和真实部署方面拥有根深蒂固的领先地位。他们也有资本和人才来维持或扩大他们的优势。此外,'最佳'通常由社区或研究人员在发布后定义,而不是自我声明。新的xAI模型需要由独立研究人员进行评估,与竞争对手的最新版本竞争,并在多个维度上获胜——即使xAI发布了强大的产品,这个过程也根本无法压缩到29天内。接近0%的市场隐含概率反映了这一现实。交易者并不是说xAI永远不会领先;他们是说它不会在2026年6月30日之前领先。市场隐含概率如此之低,因为该情景需要既不太可能的技术突破,又需要压缩的评估窗口。高质量的AI模型开发通常需要几个月的时间;而该市场要求在几周内完成。
如果xAI在2026年6月30日00:00 UTC之前,在标准化基准测试或社区共识中拥有表现最佳的AI模型,市场则裁定为YES。此日期之后的任何成就不符合条件。
预测市场将交易者的预期聚合为实时概率估计。在 Polymarket Trade 上,每个市场问题根据特定事件结果裁定为 YES 或 NO;交易者购买他们认为会以正面结果裁定的一方的份额。价格范围从 0¢(确定 NO)到 100¢(确定 YES),自然反映人群隐含的 YES 概率。本页面为来自搜索引擎的读者总结市场状态;如需实时交易(下单、查看订单簿深度、执行交易),请打开上方链接的完整交互页面。