湘西光面钢绞线腾讯汤说念生对话姚顺雨：你以为为啥外界以为咱在AI上慢了

发布日期：2026-06-08 点击次数：180

"你作念的好多产物湘西光面钢绞线，是我小学时候很可爱的。"

"你是说咱们是老登么。"

"你以为外界说腾讯慢了，如何回事？"

"嗅觉这应该是我问你的问题。"

粗略和腾讯不断群"总办"成员们谈古说今的年青东说念主，算计也就个姚顺雨。

在6月5日的腾讯云AI产业应用大会上，腾讯集团履行总裁汤说念生，和从OpenAI加入腾讯后便惹人注目的AI科学姚顺雨作念了个对话。

身为腾讯AI科学，姚顺雨在加入腾讯后，致密的业务路推广，从模子拓展到统共这个词基础治安，腾讯在模子上和AI产物上的动作也运转上姚顺雨的显然烙迹。

在对话里他提到腾讯追求模子和产物的共同杰出，这在里面其实多时候是个信任的问题。而从这场对话的规画来看，腾讯有种通过对外展示来对内喊话的意味：

姚顺雨赢得了的信任，接下来他便是腾讯AI模子，以及产物与模子配这事上的唯话事东说念主（诚然，与微信业务相干的切之外）。

而从对话里荒僻领略的些细节，也可以看出，姚顺雨不单是个科学的身份，他在如安在公司不同行务之间交说念也有我方的法，比如他提到，在接办模子磨砺，但预磨砺重建还没作念好的时候，他先作念了件事，派后磨砺好的团队去现场留心，苦哈哈匡助元宝作念好了DeepSeek的适配。"其时团队也有不睬解，但后头这种信任建立是看到了陈诉的。"

在这场对话里，两东说念主也谈了好多紧迫话题，以下为些中枢信息和不雅察，以及对话全文。

1. "下半场"被滥用了。姚顺雨加入腾讯原因：腾讯"有问题"，有真实的AI需要的好问题

姚顺雨默示，"AI下半场"这个见地有些被滥用。他认为，昔时几十年AI紧迫的是寻找好法，比如为了围棋作念AlphaGo，为了翻译作念特定模子；但在预磨砺和后磨砺熟识后，大模子变成了把"的锤子"，可以治理各式问题。于是，真实稀缺的运蜿蜒成"好问题"：模子才略具备通用之后，企业需要判断应该把它用在那处，治理什么问题，产生什么价值。这亦然姚顺雨加入腾讯个很紧迫的原因——"腾讯有好多好的问题，有好多好多产物"。

2. 环境很紧迫，context紧迫。竞争壁垒无意来自于有莫得原始的输入

姚顺雨强调了环境的紧迫，莫得好的环境，Agent就莫得办法去作念各式千般的事情。要是你莫得个点外的tool，那你就莫得办法去点外。但紧迫的是context。论企业照旧个东说念主，越来越紧迫的事情是context。因为模子越来越擅长把个十分复杂的输入变成个输出，好多时候你的竞争壁垒就来自于你有莫得阿谁原始的输入。

3. 在AI下半场紧迫的算计：在建立历久的、基于AGI的组织

姚顺雨个东说念主的算计是，在建立个历久的、基于AGI的组织。他提到，今天的AI主要有三个部分：先是foundation的部分，咱们如何样去把预磨砺和后磨砺这些基础的东西作念得十分solid；二部分是产物，咱们如何去把这样的时期真实为东说念主和社会产生价值；三便是frontier，咱们如何去探索新的筹谋范式，探索新的契机。紧迫的是，要构建个十分平衡的、像三角形样的组织。

4. 腾讯追求模子与产物Co-Design，但姚顺雨认为切的前提依然是模子

谈到腾讯里面频提到的Co-Design，姚顺雨认为，前提是模子自己要作念得塌实。预磨砺是相对product-agnostic的事情，它提供可泛化的foundation，粗略让各式下流任务抓续受益。后磨砺面，紧迫的是成立好正确的eval。姚吐槽，国内可能有个不太好的倾向，便是比较可爱刷榜。但应该关注的是，如何下马看花地基于产物、基于真实的应用去构造加真实的eval。实用的价值是大于刷榜价值的。

5. 真实产物反馈能发现benchmark看不到的问题

姚顺雨也不否定benchmark的价值，但比较之下，真实天下的数据至少有三类价值：，发现榜单法流露的底线问题；二，领路真实用户的prompt distribution，因为现实用户的问题时常微辞、良晌、多轮追问，而benchmark题目经常精准、单轮；三，产物自己还可能启发新的评测向，动尚未被很好界说的才略域。

6. 以模子之名，腾讯的不同产物终于有了点"相互流畅"

姚顺雨指出，LLM时期与昔时AI的根底互异是泛化。昔时作念翻译模子，只需要翻译数据；作念围棋技艺，只需要围棋数据。但今天即便只作念Coding Agent，也需要聊天、搜索、指示罢职、理等多种才略。因此，领有多个产物场景的公司会具备体系化势。举例，元宝中的聊天和搜索才略，可以挪动到ima或WorkBuddy等产物中，不同产物孝顺不同数据，又能相互扩散，酿成个像收罗样的体系。

此前，腾讯的法被外界描写为"跑马"。不同行务作念交流向的产物，相互竞争，很少有酿成力的嗅觉，当今似乎以AI之名运转有所篡改。

7. Hy3的中枢变化，是重建基础治安、重作念数据，并依赖大批taste-driven的决议

关于Hy3 Preview，姚顺雨说"大模子莫得什么玄妙"：要把infrastructure作念好，把数据作念好，算法部分反而相对简易。他提到，混元3主要作念了几面篡改：是重建了预磨砺和强化学习基础治安；二是对数据作念了很大篡改，包括界说真实的问题、丰富data taxonomy、提数据质料；三是许多关键决议莫得走漏公式，需要在招东说念主、模子节拍、资源弃取中陆续作念trade-off，骨子上是个很taste-driven的过程。

8. 元宝与混元的作，难的部分不是时期，而是信任

姚顺雨领略，元宝早期阶段，混元曾派出很强的算法主干，匡助元宝先把DeepSeek的后磨砺作念好。彼时混元我方的预磨砺模子还莫得ready，不少算法同学运转不睬解。但姚顺雨认为，珍贵元宝这样的产物和DAU，对后续作念模子和历久作都很紧迫。当今回头看，这个动作让产物团队意志到模子团队真实站在产物角度想考，也为后续Hy3 Preview在元宝上线下了信任基础。

9. Agent与Coding Agent已成为模子公司的基础才略

姚顺雨认为，今天Agent，尤其Coding Agent，有点像预磨砺样，是每模子公司都不得不作念的基础才略。Coding Agent之是以骨子，是因为当模子能适度file system、领有container时，它就接近个complete system。但他也强调，作念好Coding Agent需要远远过coding数据自己，还需要聊天、搜索、理等综才略。腾讯的作念法会强调体系化、线上回流，以及对新范式的探索。

10. 恢复"腾讯AI慢了"：下半场刚刚运转，AI会是历久且多元的游戏

关于外界"腾讯慢了"的计议，姚顺雨给出两个判断：，AI是历久游戏，而不是短期游戏；二，AI会变得多元，而不是沿着分工线前进。他认为，ChatGPT和Claude Code不会是唯的super app，不然天下会十分迷蒙。今天像PC刚出现的早期阶段，还有大批契机莫得伸开。Coding Agent、分娩力、多模态、具身智能等向都刚刚运转，昔时走过弯路并不奇怪，关键在于能不成淳厚濒临反馈、抓续篡改，并保抓耐烦。

以下为对话实录，经不违答允的剪辑处理。

——

汤说念生：迎接顺雨。

姚顺雨：大好，我平时都在海淀区，当今很少来向阳区。

汤说念生：咱们就直奔主题，平直交流吧。今天咱们两个的对话可能是个比较新的方法，要是有什么出人意象的，我想亦然给大个惊喜。顺雨你加入腾讯之前，我记恰其时我还问过你些问题，你为什么会给与来到腾讯？你认为 AI 的下半场紧迫的是什么？

姚顺雨：对，我想先解说下什么叫作念"下半场"，因为我近嗅觉这个词有点被滥用了。

这个见地其实是我旧年的个博客里面建议来的。在旧年之前，AI 照旧发展了几十年，可是加紧迫的是如何去治理问题，去寻找好的法。可是近我以为很明显的是法论照旧变得十分红熟，寻找问题变得十分贫乏。

我举个例子，比如说昔时咱们作念下围棋，咱们会发明像 AlphaGo 这样的法。但这种法它可能只适下围棋，或者像这种棋类。你会为了翻译作念个疏淡的模子，嗅觉它可能只可作念翻译，不成作念其他事情。可是有了预磨砺和后磨砺之后，咱们发现当今有了个的锤子，它可以去任何钉子。它是个通用的法论，可以治理各式千般的问题。那么反而贫乏的是如何去寻找好的问题去治理。

是以其实我以为加入腾讯很紧迫的点便是说，这里有好多好的问题，有好多好多产物。我以为这点会在接下来变得越来越紧迫。其实好的产物粗略治理个问题是咱们作念了这样的好的预磨砺和后磨砺之后，咱们到底要把它应用在什么样的场景，便是它的价值。

二，环境是比较紧迫的。要是莫得好的环境，那 Agent 就莫得办法去作念各式千般的事情。

比如说，要是你莫得个点外的平台，那你就没办法去点外，好多事情你作念不到。可是我以为可能紧迫的是 Context。其实论是企业照旧个东说念主，就像我前次说的那样，十分紧迫的是进度 Context。因为模子越来越擅长把个十分复杂的输入变成个输出。

那好多时候你的竞争壁垒就来自于你有莫得阿谁原始的输入，你知不知说念这个东说念主他在干什么，你知不知说念这个企业的各式千般的信息。那这点的话，我以为腾讯有十分强的势。

但我以为紧迫的原因是文化。我还难无私次跟你聊天的时候，包括和好多其他同伴的雇主聊天的时候，我嗅觉便是大都十分的淳厚。便是那处作念得好，那处作念得不好，都十分直白，不会去粉饰。我知说念我这里作念得好，我知说念我这里不知说念，我知说念这里应该如何作念，我不知说念那处应该如何作念。我以为这种坦诚是我的印象。

二点是，我以为腾讯总体是个基于 Trust 而不是基于 Metric 去运转的公司。我以为这点关于作念 AI 是十分紧迫的。包括咱们的文化其实有十分 Low Ego，十分相对的这面。这些文化都是可能关于历久来作念个内在的组织是十分紧迫的湘西光面钢绞线，包括咱们对历久主义的这种坚抓。

是以 AI 下半场紧迫的是什么？我个东说念主的算计是，咱们应该在建立个历久的基于 AGI 的组织。今天的 AI 其实主要有三个部分：

Foundation 的部分：咱们如何样去把预磨砺和后磨砺之中基础的东西作念得十分塌实。

产物：咱们如何去把这样的时期真的为东说念主和社会产业加抓。

Frontier：咱们如何去探索新的筹谋范式，探索新的契机。

紧迫的是咱们要构建个十分平衡的三角形样的基础。那我以为关于作念 Frontier Exploration 来说紧迫的其实便是：

需要有余的资源。

需要正确的作念事式，这其实跟咱们刚刚说的文化那点亦然吻的。那么关于产物来说，我以为便是有好的产物 Sense，有这种作念产物的教授是至关紧迫的。

我以为便是说在，咱们今天可能所作念的探索还不够多。是以我也但愿能把这种 Frontier Exploration 的精神能多的注入到咱们组织中。

汤说念生：你提到的跟总办聊的过程中感受到的诚笃或者求实，其实亦然经常我跟客户交流得到的反馈。毕竟 AI 赛说念照旧个长跑，无意候默契其实也很紧迫。那些咱们作念得好的，那些作念得不好的也得认。但关键这是个多维度的竞赛。咱们看到当今模子有好多的杰出，咱们作念产物其实亦然有越来越多的方法，不同的场景有不同的需求。

你刚才提到模子跟产物，产物可以说提供个环境，里面要给模子提供 Context 高下文。那我想问个问题，咱们平时开会提得比较多的个词是 Co-design，如何把产物跟模子粗略比较密致的结起来？尤其今天有这样多丰富的产物，从咱们作十分密致的像元宝这样的个聊天机器东说念主，包括 AI 搜索，企业里面也有部署些智能客服、智能营销。另外近十分火的这个类 Copilot 的像 Copilot 和 Web Copilot 这样的产物，其实对模子的才略依赖很。你如何去想考 Co-design 这个式？

姚顺雨：我以为有三点。先，Co-Design 的前提是模子自己要作念得很 solid，有好多 foundational work 要作念好。预磨砺是个相对 product-agnostic 的事情，它作念得十分 solid，就可以提供个十分强的 foundation。而且预磨砺大的特色是，它是个可泛化的学习过程，它的杰出可以给各式千般的下流任务抓续带来价值提高。

后磨砺的话，我以为紧迫的点是要成立好正确的 eval。我以为可能有个不太好的倾向，便是比较可爱刷榜。可是，如何下马看花地基于产物、基于真实的应用去构造加真实的 eval，我以为先你要有好的产物出口，二你要意志到，实用的价值是大于刷榜价值的。

这点上，咱们作念了大批使命，便是跟各式千般的产物进行了度的 Co-Design。我以为 Co-Design 很关键的点是要产生相互的信任，这点咱们也作念了大批使命去取得互信。如何把产物的数据用好，如何把这种回流用好，如何把 eval 作念好，这里有好多细节，我就不赘述了。

三点我想说的是，我以为 LLM 时期和昔时的 AI 骨子的别离便是泛化。在 LLM 之前，比如你作念个翻译产物，独一把翻译的数据作念得疏淡好就行；你作念个围棋技艺，独一把围棋的数据作念得疏淡好就行。可是今天，即使你只想作念个 Coding Agent，你会发现需要的也不单是是 coding 数据，你需要十分好的聊天才略，十分强的搜索才略，十分强的指示罢职才略，十分强的理才略。它其实是个十分复杂的 technology，我以为你需要对这件事情有 taste。

这个事情的个论是，有好多产物的体系化布局，其实会有个比较大的势。比如说，咱们和元宝的 Co-Design，可以使模子产生很强的聊天和搜索才略。但这样的才略又可以被挪动到 ima、WorkBuddy 等其他产物。是以这些产物粗略提供不同的数据，而这些数据之间又可以相互扩散、相互挪动，酿成个像收罗样的体系。我以为这点的价值会越来越紧迫。

汤说念生：外部刷榜其实亦然属于 eval 的种。咱们里面作念 eval，和外部这些榜有什么别离？

姚顺雨：我以为先这些 benchmark 照旧有它的价值，不是说它莫得价值，只是当今这些榜十分容易 saturate。基于真实天下的数据有几个匡助。先，你能发现模子好多底线问题。推行上，咱们想要发个 preview 模子，紧迫的主张之，便是但愿能赢得真实天下的反馈，拔擢各式榜单中没法发现的底线问题。我以为这点会在郑再版上有十分大的矫正。

二点是，你对真实的 prompt distribution 会有个的了解。比如 benchmark 上头的题目可能都是十分精准的，有十分长的 concrete description，而且般来说是个单轮问题。可是在现实场景中，大问的问题可能都是比较微辞的，可能就两句话，然后他会不停追问。这些 setup 上的 difference，就可以启发咱们如何去好地作念这样的磨砺。

三，我以为咱们以致可以在这些产物上赢得些灵感，去进当今还莫得的榜单，或者还莫得被很好界说的域。是以我以为产物和模子的相互配置，是越来越紧迫的个 AI 话题。

汤说念生：我难忘咱们早期作念元宝的时候，还际遇过多轮罢职的问题。用户在产物里迭代 prompt 的式，和 benchmark 也有些互异。真果真产物里面，大使用所需要的才略，照实跟 benchmark 有蛮大的互异。

姚顺雨：你问了我这样多问题，我也问点你的。其实我难忘次跟你聊的时候，你给我讲了好多昔时的履历，从 QQ 空间、QQ 秀的时期路到当今。跟你聊天很有敬爱，因为你作念过各式千般的产物，To C 的也有，To B 的也有，邃古时期的也有，近 AI 时期的产物也有。

是以我比较好奇，你以为你作念产物的旨趣是什么？哪些教授或者价值是不变的？哪些东西变了？

汤说念生：我以为终作念产物照旧奔着用户到底有什么需求，我如何去治理他的痛点，如何给用户或者客户创造价值。在不同的时期，以致不同的行业，作念个产物照旧需要粗略给用户带来价值，他才会买单，才会使用。

是以我倒以为，从 PC 互联网时期，咱们作念空间、作念各式千般的内容产物，到产业互联网作念云，其实咱们也要花好多时辰元气心灵去听客户的声息，尝试匡助他们治理问题。底层逻辑莫得那么大的变化。可是照实，在 PC 互联网、挪动互联网时期作念产物，跟今天在 AI 时期作念产物，照旧有蛮多不样的地。

先从范式的角度来看，在 AI 时期以前，咱们作念产物好多时候想的是通过来得志用户的需求。

你四肢个产物提供、干事提供，要想明晰我提供若何的才略，让用户可能通过界面、通过某些菜单去给与。这有点像预制菜，用户只可在里面点样。

可是在 AI 时期作念产物，它这种盛开式的干事方法会带来很不样的要乞降挑战。

用户通过简易的交互式，可能是当然说话，可能是语音。四肢产物，你也不知说念用户会问什么，是以要充分愚弄模子才略去领路用户的需求。然后，通过今天大模子的理才略、调用器用的才略，产物给模子提供各式千般可以使用的器用，来应酬这种盛开式的需求。这个是我以为跟昔时作念产物很不样的地。

以致也包括你刚才提到的 eval。以前作念产物，咱们有很走漏的 specification，有很走漏的产物细节和容貌。如何作念规画，如何作念研发，如何作念测试，瀑布式经由也比较走漏。但在作念 AI 产物时，锚索我发现大的变化是统共这个词经由可能都要从头规画。

尤其本年，大部分代码都由 AI 生成。咱们的工程师可能会花多时辰去作念规画、作念架构规画，把写代码的使命交给 AI，然后依期去指下、修正下。测试也要左移，前置地想明晰，针对各式案例、环境，以及咱们关于盛开式谜底的些条款，以致 alignment，如何对皆用户所需要的作风。

是以我嗅觉，今天 AI 时期作念产物，对才略的条款，也难了。那我问你下，Hy3preview，大都在说这是你在腾讯的秀。具体 Hy3preview 作念了什么篡改？你能给大先容下吗？

姚顺雨：其实我以为莫得什么玄妙。今天的大模子，从某种程度来说，是个比较 trivial 的事情，便是咱们应该把 infrastructure 作念好，应该把数据作念好，算法的部分反而是比较简易的。

主要有几个点。，咱们把 infrastructure 进行了重建，论是预磨砺照旧强化学习。

二，咱们把数据和以往比较作念了好多大的篡改，如何界说真实的问题，如何丰富 data taxonomy，如何提数据质料，这是个永非常的追求。

三，有好多很紧迫的决议，包括如何招东说念主，如何成立模子的节拍，每天有好多 decision，需要沟通好多 trade-off。我以为这可能莫得个很走漏的公式，它是个很 taste-driven 的事情。是以我其实也挺好奇，想问你个问题。因为你刚刚跟我计议 Co-Design 这个见地，我也很好奇，你对 Co-Design 这件事情是如何想的？你以为哪些事情应该是模子作念，哪些事情应该是产物作念？

汤说念生：我以为 Co-Design 在不同阶段，昔时这两年，其实直在变化。这个变化某种程度上是跟着模子才略的升而变化。诚然，统共这个词行业商场、用户需求在变化的过程中，也会带来模子和产物双方需要好地去得志。

给我个比较的感受是如何去对皆。因为咱们起作念产物、作念 alignment 对皆的时候，会有好多不同角。产物可能要针对某个向去治理些问题，模子到底如何作念才气得志这个需求？同期又要回到模子需要数据，数据应该如何标注，到什么颗粒度，什么是好的标注，什么是不好的标注。因为有些地要励，有些地要处分。

然后还有 eval，还有评测。因为要是产物认为好的产物体验，评测不认可，大作念出来的产物就会不致。是以 Co-Design 给我的嗅觉，多是在名堂组里面，不同角都参与到产物规画中，定下产物的算计向。如何让多个角粗略关于些盛开式问题有比较好的对皆？要是莫得作念到这样的对皆，你会发现产物行为会不可揣度，以致无意候会有些随即，因为模子在磨砺过程中可能也被羞辱了。这是我这两年和产物、模子团队作念 Co-Design 比较的感受。

姚顺雨：就像刚刚说的，我以为先难的点便是要建立 trust，何况我以为同理心很紧迫。

因为说到底，作念模子的算计和产物的算计有好多 align 的部分，也有好多不 align 的部分。模子的东说念主他会但愿我这些才略越强越好，但产物的东说念主他可能但愿用户的需求得志得越好。是以有好多不 align 的部分。

我以为很紧迫的点便是要换位想考的才略。其实你刚刚问我，咱们是如何步步 Code Design 元宝的。要是你还难忘的话，有个很紧迫的细节是，咱们其时其实派了后磨砺强的主干力量去匡助元宝，先把 DeepSeek 的后磨砺先作念好。因为在阿谁时候，咱们我方的预磨砺还莫得 ready。

可是咱们知说念，珍贵这样的产物以及它的 DAU 会关于咱们接下来作念模子也十分十分紧迫，而且会关于历久的作十分紧迫。是以其时其实好多同学也不睬解，然后我需要去很致力地解说。但我觉稳当今看起来，便是这些致力都是 pay off，对吧？我以为这样的个动作，便是让产物和模子的同学意志到，模子的同学是真的在为产物着想。这个关于咱们之后的作，包括混元在元宝上见效的上线，起到了十分紧迫的作用。

诚然有好多时期的部分可以探讨，但我以为可能难的部分其实反而是如何样去建立信任，如何样换位想考。

汤说念生：对，十分认可。那我换个话题，你是 React 架构的建议者，博士筹谋亦然围绕着说话智能体伸开的。那你几年前的些不雅点到今天竣事了吗？比如有哪些？

姚顺雨：对，那天我还挺叹惜的。因为我从头读了我方的博士论文，嗅觉又回到了个很邃古的时期。便是我的博士论文的 title 叫作念《Language Agent： from Next Token Prediction to Digital Automation》（说话智能体：从揣度下个Token到数字自动化）。那是2019 年，七年前，那是 GPT-2 的时候，它其时只可作念 Next Token Prediction，而且它产生的可能段话还不太勾通，或者还有好多毛刺。是以其时东说念主们是很难设想到，它会有天成为个篡改天下的力量。

其时我以为可能大作念的筹谋，略微有设想力的些，他会作念些筹谋。比如说的都市，这样的话，要是你作念 Next Token Prediction，它会回答北京。那 somehow 它是个有 knowledge 的事情。能作念到这点，大其实其时就十分开心了，以为这个时期很有敬爱。

其时我的设想力可能比较狂野吧。我以为 GPT 是个十分好意思的东西，吐下个 token 是个十分简且十分通用的事情。我以为它有天后劲不单是是在于吐下个 token，而是在于把这个天下上统共的事情一皆 automate。我其时想的可能还不够大，我想的是 digital automation，可是当今看起来也有可能是 digital and physical automation。

我博士期间主要作念两部分：如何建立个 Agent 的法论和如何去界说 Digital Automation 的任务

，如何建立个 Agent 的法论。如何把个 Next Token Prediction 的机器变成个 Agent，变成个自动化的机器。那其实就像你说的，紧迫的篇使命可能是 React。

我还难忘便是 22 年 7 月份的时候，某天晚上，我当我把次把我记恰其时是 Palm 2 的 API 和我其时我方手写的个 Wikipedia 的 API 连在起，然后它次可以基于这个网页回答问题，何况多轮的交互的时候，我其时嗅觉就像幽微的电灯丝转眼亮了的嗅觉样。据我所知，可能这是次东说念主类把 LLM 和真实的互联网连在起，何况去作念这种多轮的交互。

我其时的嗅觉这个可能在 5 年或者 10 年会篡改这个天下。可是可能比我设想中还要快。包括我记恰其时咱们次建议 Sweep 的 idea 在 brainstorm 的时候，要是这个事情能作念到，那很显然它会带来弘远的价值。诚然可能是几百亿上千亿，但当今可能是数万亿，数十万亿，可能我想的照旧太小了。

二，如何去界说 Digital Automation 的任务。比如说 WebShop 是个基于互联网的 Web Agent 的 task。然后包括 InterCode 和 Sweep Engine 是早的 Coding Agent 这样的任务。当今看起来 Agent 的基础紧迫的两个部分，照实是 Web 的 Agent 和 Coding 的 Agent。

那天我还在群里跟大聊天，我说我看我阿谁博士论文的收尾，便是我在 24 年的时候写我的 future work：

Train models for agent

Safety and robust deployment

Scientific discovery

如何样去 help human

我很叹惜，我说我当今很侥幸，我当今在作念我其时列的 future work。Prediction 太利弊了，都看到这个统共这个词行业针对这些向在动。想的照旧不够大。我觉恰其时我其时照旧以为我方想的够大了，但可能照旧不够大。我以为时期的发展时常乎咱们的预期。

汤说念生：那我再点，智能体今天大都说需要豪侈好多的 token。这关于混元作念下代的模子的研发，你以为你的侧重有哪些地是比较紧迫的？

姚顺雨：我以为 Code Agent 十分骨子，有好多原因，其中有个很紧迫的原因，是说它是个有点像图灵完备的这样个事情。便是当你有才略去适度我方的 File System，当你有个 Container 的时候，其实你是个 Complete 的这样的个 System。

今天我以为 Agent 毫疑问是每模子所发力的。我以为咱们作念的法可能会有几个别离：

即使可能今天 Code Agent 亦然紧迫的事情，可是咱们照旧会强调体系的化。我恒久认为，真的要把 Code Agent 作念好，其实需要的远远不啻 Code Agent 的数据。你也需要，像我刚刚说的，聊天、Instruct、Following、理，各式千般不同的东西。因为大模子紧迫的点是泛化。

产物的作用越来越紧迫。如何愚弄好线上的回流，我以为是个每个模子厂商都在应酬和想考的问题。这里我以为咱们刚刚积存了好多 Code Design 的这些教授会变得十分紧迫。

还需要多设想力。论是时期的演进，照旧产物的演进，照旧以致下个范式的演进，我以为咱们照旧需要作念些探索的，以致不细主张使命。

汤说念生：从产物侧来看，大越来越多有 token 罪状的声息，token 本钱抓续爆发式增长。我也听到好多客户，以致用户，包括身边共事，也在紧盯积分豪侈或者 token 豪侈。如何可以让咱们的模子在治理某个问题、完成某个任务时，token 率？

姚顺雨：当今大计议价比，可能多计议的是模子架构。但它其实是个很复杂的体系。紧迫的事情先是 performance。好多东说念主跟我说，用个强的模子，无意候比用个弱的模子后省钱，因为你快地把这个事情作念对了，也省了东说念主的元气心灵。是以紧迫的事情是 performance。要是你的 performance 好，其实它便是价比关键的事情。

尤其本年，好多简易任务的鲁棒会变得加紧迫。如何次把好多相对简易的任务作念对，这可能是价比关键的部分，而不单是是模子架构。二部分是本钱。本钱自己亦然价比的部分。我以为是""，要是能不好，价比就很难成立。二是"价"，也便是本钱。本钱上，其实是先于天下的，咱们作念了大批使命去化本钱。

本钱和体验里，可能紧迫的事情是，如何用个小的模子，把价值的任务作念好。在这个基础上，诚然架构翻新、长文不断、脚手架都有好多需要作念的事情。但我个东说念主看法是，要是咱们能作念个相对较小的模子，同期又粗略并排大模子的能，而且在大部分任务上作念到很强的 robustness，这可能比在好多十分长程的、fancy 的 task 上实现两个点的提高，在今天的有价值。

其实我也挺好奇，Dawson，你是什么时候意志到 Agent 是个新的产物契机的？你当今的默契是什么？你觉稳当今咱们离个好用的 Agent，bottleneck 在那处？

汤说念生：咱们作念的 Agent 针对不同场景，其实有不同的产物方法。在 Agent 的规画上，很大程度是在尽量发达好模子的才略。诚然，模子在迭代，它才略越强，可能 Agent 要作念的使命也越来越少。

我看咱们好几个产物，在昔时这段时辰，其实跟着模子才略加强，可以把产物、把 Agent 作念得简化，多是给模子提供不同器用，创造多 skills，让模子粗略地完成任务。也给模子提供多咱们叫"记念"的东西，比如用户昔时使用的些民俗，咱们所能索取出来的用户 preference 信息，四肢高下文 feed 昔时。

在 coding 环境里，有相干的 context 给到模子。在 WorkBuddy 里面，办公配合、作念 PPT 时，大关注的内容，或者该给到模子的 context，也会不样。是以咱们作念不同 Agent 时，我以为紧迫的照旧了解阿谁场景下，什么内容、什么信息是紧迫的，是比较 relevant 的，粗略跟模子配好，让模子有它需要的信息，同期也发达它的才略。

姚顺雨：近咱们照实出了些像 WorkBuddy 这样口碑很可以的产物，背后我不雅察到好多小团队在快速迭代产物。我其实挺好奇，相干于传统产物研发，你以为在这种新的 Agent 时期，研发和组织不断上，产物团队发生了什么变化？你的想考是什么？

汤说念生：我前阵子在帮 WorkBuddy 作念个组织发文，我看了下他们十分扁平化的组织，和咱们昔时其他产物的组织架构有很大的互异。多是小团队，三个东说念主、五个东说念主，可能围绕某个域去攻坚，而且里面有好多实验。

是以组织还要支抓好这种 AI 用法去作念实验，让不同的小分队可以去探索，然后再考据。因为实验大部分可能拿不到正向反馈，咱们也要包容团队去试错，通过大批实验提真金不怕火出对用户留存、对咱们想要的成果有正向匡助的东西。

这是我以为今天作念 Agent、作念 AI 产物，原生 AI 产物的组织方法要粗略比较好复旧的地。另外，蓝本好多工程师有大批时辰花在写代码上，但今天毫疑问，这些使命可以交给 AI 了。是以咱们会看到多角的融。可能大都是产物司理，都要透顶了解用户需求，何况规画出咱们想要的产物方法。

每个工程师可能像个有想法的 leader，驱动多个 Coding Agent，针对咱们想要的产物需求去作念研发诱惑。同期也像我刚才说的，要把评测、测试前置，也要用好 AI 的才略，把质料保证的使命、alignment 对皆的使命作念到前边来。

那我也想再问个大计议比较多的问题。好多自媒体都会提到，腾讯慢了，在 AI 上莫得实时收拢些契机。你以为咱们真的慢了吗？到下面半场是什么？你能再多说下吗？

姚顺雨：嗅觉这应该是我问你的问题。我以为今天有两个紧迫判断。个是，咱们认为 AI 是个短期游戏，照旧个历久游戏？因为在硅谷，大弥散着很厚情谊，说两年后统共东说念主都要休闲了，AI 就要取代统共东说念主的使命，咱们应该连忙赚两年钱，然后退休。那这是个判断。

很显然，咱们的判断是，这是个历久游戏。AI 才刚刚运转，从某种程度上说，下半场才刚刚运转。我不认为 ChatGPT 和 Claude Code 会是唯的 super app。我以为那会是个十分迷蒙的天下，战胜会有连绵赓续的新契机出身。今天可能就像七十年代 PC 刚刚产生的时候，还有好多好多事情需要作念。

二个判断是，它会是个线的游戏，照旧个多元的游戏？昔时几年，大看到的是 pre-training，然后 post-training、RL，然后 Agent、Codex、Coding Agent，似乎有条十分走漏的干线。直露说，统共东说念主都在 copy，统共东说念主都在作念样的事情，这亦然个十分迷蒙的事情。

那改日到底会变得单，照旧多元？我的个东说念主看法是，会变得多元。毫疑问，Coding Agent、分娩力会变得加紧迫，而且它才刚刚运转。这个天下还有 trillions of dollars 的 market 莫得被填满。可是多模态、具身智能，好多好多新的事情都在发生，或者刚刚发生。

是以从这个角度来说，要是咱们认为下半场才刚刚运转，那可能照实不晚。诚然，昔时模子和产物都作念了好多探索，也走了好多弯路，我以为这是正常的。你莫得作念过件事情，次作念战胜会有周折。可是紧迫的是，能不成淳厚濒临我方，能不成 be real，能不成看到 feedback 然后去篡改，能不成保抓耐烦。我以为这些事情可能是不才半场十分紧迫的事情。

汤说念生：大对腾讯经常可爱挑某个点来月旦，诚然咱们也迎接大给咱们提的条款。咱们照旧个十分多业态、好多产物在好多赛说念，同期也有好多团队在进不同的名堂和事情。

毫疑问，在这样个复杂的组织里面，有些地可能咱们作念得快了，有些地作念得慢了，有些地可能会作念失败，在探索。我以为这些提示都十分好，照实有些地咱们是可以作念得好。

但就像你说的，这是个长跑，这是个马拉松。腾讯照旧有十分丰富的场景，就像你运转提到给与腾讯，因为 AI 需要 context，模子需要好多的高下文。腾讯在昔时多年的不同产物在不同赛说念的这些积存，其实都是可以针对每个场景去为模子提供灵验的信息，提供这些 context 来发达价值。

在这样的个长跑中，我信赖模子会陆续迭代，用户的需求也在陆续变化，也会有新的产物方法出现。比如本年年头咱们对龙虾这波鼓吹反映比较快，同期也有像 Work Buddy 这样的智能体产物，其实亦然几年前照旧运转作念的产物。蓝本作念 Coding 的 Code Buddy，渐渐看到非技艺员也有很强的需求。今天也听到好多客户关于咱们的不同产物如何去组起来有十分的期待，是以咱们正在长跑中。也请诸位多给咱们提示，给咱们建议，也多用咱们的产物来给咱们正向的 constructive 的反馈。

感谢顺雨今天的共享。天津市瑞通预应力钢绞线有限公司相关词条:铝皮保温隔热条设备钢绞线厂家玻璃棉泡沫板橡塑板专用胶

1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定，并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方，并积极配合修改。
3.凡用户访问本网页，均表示默认详情页的描述湘西光面钢绞线，不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》，以此来变相勒索商家索要赔偿的违法恶意行为。

湘西光面钢绞线 腾讯汤说念生对话姚顺雨：你以为为啥外界以为咱在AI上慢了

湘西光面钢绞线腾讯汤说念生对话姚顺雨：你以为为啥外界以为咱在AI上慢了