Excited to introduce Navigator n1.5 — our new hybrid vision + DOM + JavaScript computer use model. Three SOTA benchmarks. Lowest price in class.
Yutori Scouts 竞品情报简报 · 第 15 期
本期核心事件为 Navigator n1.5 正式发布,架构从纯视觉操控升级为 vision + DOM + JS 三模态,Yutori 自评三项 SOTA 基准,定价打到竞品输入端三分之一。公司动态方面,Vibrant Labs 合作关系首次公开(基准测试共建方),LinkedIn 出现 Delegate 场景化 B2B 帖子。社区方面,独立开发者主动咨询 Delegate dev program;ProductHunt Review 仍为空,Delegate 独立 Launch 页已 404,观测窗口关闭。三项持续追踪(最大合同客户、招聘 JD、Review)本期仍未命中。
覆盖时间范围:2026-05-06 00:13 UTC → 2026-05-07 00:00 CST
Navigator n1.5 正式落地——这是 Yutori 自 2026 年 1 月以来最重要的一次产品跃迁,视觉模型加了 DOM 操作与 JS 执行能力,基准分数三项领先,定价打到同类最低。上期全线静默之后,本期信号浓度骤然拉满。
产品功能更新与版本迭代
Navigator n1.5:从「点击模拟」到「DOM + JS 直接操控」
此前 n1 是纯视觉路线——只能「看见」屏幕再用鼠标键盘操作。n1.5 新增三项能力:
- Hybrid Vision-DOM Interaction:在传统输入操作之上,叠加直接检查和操作 DOM 结构的能力,绕过部分视觉歧义。
- JavaScript Coding & Execution:模型可自主生成并在网页上执行 JS 代码。Yutori 给出的演示案例是从 Nike 商品页批量提取所有 SKU 的尺码+颜色可用性,操作步骤从 22 步压缩到 5 步——这类密集爬取任务过去需要人工写脚本,现在 n1.5 自己写、自己跑1。
- Structured JSON Outputs:通过新增的
json_schema参数,让模型直接返回符合调用方 schema 的结构化数据,省去下游解析。
콘텐츠 카드를 불러오는 중…
三项基准均为 Yutori 自评,尚未提交至第三方 leaderboard(Online-Mind2Web 暂停接受新提交)3:
| 基准 | n1.5 | 最近竞品 | 差距 |
|---|---|---|---|
| Online-Mind2Web | 94.5% | GPT-5.4: 92.8% | +1.7pp |
| Navi-Bench v2 | 88.0% | Opus 4.7: 80.5% | +7.5pp |
| Westworld | 93.0% | n1: 92.0% | +1.0pp |
Westworld 仅提升 1pp,是三项里最弱的一组数字,也是社区第一个被质疑的点——用户 @_Suresh2 在推文下追问网站布局变化时的基准稳定性,Dhruv 回应「误差范围不大」3。
定价上,n1.5 定为输入 $1.50 / 输出 $5.00(每百万 token),比 GPT-5.5($5/$30)输入端便宜 3.3 倍,比 Claude Opus 4.7($5/$25)同样便宜 3.3 倍2。这是一个明确的价格锚定动作。核心开发者 Rui Wang 同日补充声明:
콘텐츠 카드를 불러오는 중…
API 层面,n1.5 与 n1 存在不兼容变更2:
hover 改名为 mouse_move,key_comb 改名为 key,新增 hold_key、middle_click、mouse_down、mouse_up、go_forward 五个工具。已在生产中调用 n1 的开发者需要主动适配。两处「信号滞后」值得标记
- Changelog 空缺:yutori.com/changelog 截至本期截止时仍未新增 n1.5 条目4,最新条目停在 2026-04-01。n1 发布当天同步更新 changelog 的历史模式在此次未重演,或为上线节奏快于内容团队所致。
- 桌面端无新版本:GitHub Releases 最新仍为 v0.4.14(2026-05-02)5,n1.5 发布未触发 Local 端的版本更新。Local 能否快速整合 n1.5 的 DOM/JS 执行能力,是下一个观察点。
公司动态
Vibrant Labs 合作关系首次公开
Devi Parikh 在 n1.5 发布推文串中发帖披露了与 Vibrant Labs 的合作6:
콘텐츠 카드를 불러오는 중…
具体合作范围未公开说明,但 n1.5 博客将 Vibrant Labs 列为 Navi-Bench v2 的扩展方,负责提供 Shopify 购物车状态验证场景——即这是一个基准测试共建合作,而非此前猜测的「最大合同客户」。两件事要分开看。
LinkedIn 场景化内容:招聘和销售方向各一帖
Yutori LinkedIn 页面(linkedin.com/company/yutori-ai,4,613 followers)近两周相继发布了面向招聘团队和销售/GTM 团队的 Delegate 场景化功能帖7。这不是招聘启事,是产品营销在 LinkedIn 上的定向落地——Delegate 的 B2B 拓客路径正在变得更加清晰。
社区与用户反馈
X/Twitter:开发者询问 Delegate dev program
社区互动里有一条值得标记的信号:独立开发者 Matt Shams(@daoboymatt)主动询问是否有 Delegate 开发者计划,Devi Parikh 直接回复提供了 devi@yutori.ai 的邮箱,Matt 确认已发邮件,后续转入私信8。这是一次小但典型的开发者漏斗事件——说明有第三方开发者在主动靠拢 Delegate 生态,也说明目前还没有公开的 dev program 入口。
ProductHunt:评论区仍空,但 Delegate 独立页面已 404
Scouts by Yutori 主页面9 仍显示「Be the first to leave a review」,Delegate 上线满两周,零 Review。更值得关注的变化:Delegate 的独立 Launch 页面(
/products/scouts-by-yutori/delegate)已返回 404——这个链接从第 13 期起就在追踪,现在消失了,意味着 ProductHunt 上的 Delegate 产品页入口已失效,首批 Review 的观测窗口基本关闭。Reddit:本期仍为零存在感
r/artificial、r/singularity、r/AI_Agents 等核心 AI 社区均无 Yutori 相关讨论。n1.5 这么大的发布,Reddit 的沉默对比 71K+ 的 X 浏览量,进一步确认了 Yutori 的分发渠道策略:品牌推特 + 直接 B2B 接触为主,不做公域社区运营。
待解悬挂项
| # | 追踪项 | 状态 | 持续期数 | 备注 |
|---|---|---|---|---|
| 1 | Delegate 最大合同客户身份 | 🔴 未命中 | 第 6 期(第 10 期起) | 全平台零线索,Vibrant Labs 已排除,05-01 蛋糕帖后无任何跟进 |
| 2 | 招聘正式 JD(「Recruiters 👀」05-04 信号) | 🔴 未命中 | 第 3 天 | 官网无 careers 页,LinkedIn 无职位列表 |
| 3 | 桌面端下一版本(v0.4.14 之后) | 🟡 新进展待确认 | — | n1.5 模型发布;桌面端 v0.4.14 仍未更新,Local 能否整合 DOM/JS 执行是新观察点 |
| 4 | 新品牌视觉在官网/产品内落地进度 | 🟢 已确认官网落地 | — | yutori.com 已部署新 logo(logo-full-dark.svg),Delegate favicon 已上线 |
| 5 | Delegate ProductHunt 首批 Review | 🔴 观测窗口关闭 | 第 2 周 | Delegate 独立 Launch 页 404,主产品页仍为「Be the first to leave a review」 |
编辑小结
本期的核心信息只有一个:n1.5 是一次真实的架构升级,不是版本号游戏。 从纯视觉操控到 vision + DOM + JS 三模态,任务执行复杂度的边界向上移了一档,22 步→5 步的演示是可以反复引用的具体锚点。定价打在竞品输入端的三分之一,说明 Yutori 现阶段选择了用价格换规模。
有两处需要保持审慎:基准分数均为自评,Westworld 上的 1pp 提升尤其薄;Changelog 和桌面端同步滞后,说明这次发布的节奏是研发和博客先走,配套体系在追。接下来 24-72 小时,看 TechCrunch/VentureBeat 是否跟进报道,是本期信号外溢效果的最快验证指标。
이 콘텐츠를 둘러싼 관점이나 맥락을 계속 보강해 보세요.