Taste 是下一个被 AI 攻克的能力

2026年6月12日 · #research · Read in English

TL;DR: Anthropic 用真实研究 session 量化了 research taste：到 Opus 4.7，AI 提出的下一步在 50% 的情况下被判定优于人类研究员，Claude mythos 更是到了 60%。我一直以为 taste 是 AI 学不会的能力，这个判断需要修正了。

当我最近在用 AI 进行研究的时候，我越来越关注于这个问题：AI 能完成大部分东西，那还要我干嘛？

我一直认为最难被 AI 取代的能力就是 taste，也就是在开放的问题上，make judgment call 的能力。

因为关于做什么样的研究，用什么样的工程设计，这样的问题，网上既缺乏大量的训练数据，也没有可靠的可以验证的信号来做强化学习。

做出有品味的判断，依赖于我们长时间沉浸在特定的圈子和环境里面，形成了那些很难写下来的直觉。比如做强化学习的，会知道 PRM 听起来好，但是实践上往往不容易 work；做 LLM as judge 的，会知道 LLM 的分数有很强的均值回归倾向。

我一直这样想的，直到最新的 Anthropic 文章改变了我的看法。

这篇文章叫《When AI builds itself》，是 Anthropic Institute 这两天刚发的，核心是在讲 AI 正在越来越多地接管 AI 自己的研发。文章把研发拆成 engineering 和 research 两部分：在执行层面，也就是写代码、跑实验上，Claude 已经能追平甚至超过人类；唯一还明显属于人类的，就是 research taste——判断哪个问题值得做、哪个结果可信、什么时候该果断砍掉一个方向。

而最让我意外的，是他们真的尝试去量化这件原本被认为最难量化的事。他们翻出研究员和 Claude 一起做开放性研究的真实 session，专门挑出那些研究员当时走了弯路的节点，然后只把走偏之前的那段上下文喂给模型，问它接下来会怎么走，再让另一个能看到最终结果的 Claude 来当裁判：究竟是人还是 AI 给出的下一步更好。换句话说，这其实就是在直接测量模型能不能 ask good research question。

When AI builds itself 中的 research taste 评测结果表

最后这一个表，是如此令人不安的熟悉。

随着模型不断迭代，在研究中提出正确的改进方向的能力也在不断提高。到了 Opus 4.7 的时候，这个分数已经来到了 50%。

注意，这里的 50% 不是只对了一半，而是说，在一半的情况下，AI 提出的研究方向被认为比人类更准确，也就是，50% 意味着人类研究员的 taste 已经不比 AI 好了。

而 Claude mythos 更是把这个值推高到了 60%，这使得我非常期待这个模型的发布。

所以我们会发现，research taste 这样一个将好的研究和差的研究区分开的重要能力，随着 AI 能力的进步，也会成为自动化的一部分。

那这对于我们意味着什么，尤其是对于未来的研究方向的影响是什么呢？

我觉得最关键的一个趋势就是，研究很有可能会以比我们想象更快的方法被自动化。这也能延伸到大多数开放性问题中，生成软件、撰写文章等等。

如果 Research 或者 Engineering task 不能被 AI 自动化，那么人类瓶颈始终存在，Scaling 的速度就有一个上限。但是如果 taste 也能被自动化，那人类的瓶颈就会越来越小，阻碍 Scaling 的就只剩下算力。这也就对应了 Anthropic 设想的未来愿景中的第三个。

因此未来的工作也许就不再是手工戳几个 Harness 长点这样了，明显地，研究和工程的自动化会使得我们的注意力转向，如何在这样一个我们并不能完全理解的过程中，确保可靠性来提高自动化程度。展开来说，可能下面的趋势会在未来更受到关注：

Long context orchestration：Long context memory 的进化版本，我们不只是关注当模型被给予了很多上下文的时候能否连贯地工作，我们关注当整个 multi agent harness 完成了非常多步以后，如何自我整理和保持性能。这也就是 Claude dynamic workflow 所关注的事情。
Measuring and improving agent ability to make good judgement calls：过去 Agent 的能力不足的时候，我们都关注在那些封闭的任务上评估，但是未来显然，Agent 会要执行更多的开放任务，那么我们就需要有一种方式来建模他在开放任务中进行决策的能力，比如说他做出的行动是否是不后悔的？今天凭感觉做了一个判断，未来是否能够有正收益？
Minimizing human supervision：当生产效率的一侧，也就是 Agent 任务的成功率不再是一个瓶颈的时候，生产过程的另一侧，人类监督的供给就成为了瓶颈。如何更高效地将人类的意志传达给 Agent，并同时避免过多的人类干预，成为了提升未来能力的重要维度。

但上面所说的，终归只是我的一家之言。不知道你们相信 Research taste 会被自动化吗？