Now vibe coding, so learning hammer FE ?
《大规模AI代码审查编排实践》

标签:#DevOps #AI辅助编程 #CodeReview #CI_CD #LLM #多智能体系统 #Cloudflare #OpenCode #插件架构

总结:
Cloudflare为解决代码审查瓶颈,放弃单一LLM直接审diff的噪音方案,转而基于开源代理OpenCode构建CI原生编排系统。该系统采用可组合插件架构,通过风险分级(Trivial/Lite/Full)动态调度最多7个专业审查智能体(安全、性能、质量等),由协调者代理去重、过滤并做出审批决策。系统已在数万MR上运行,能精准拦截真实漏洞,同时保留"break glass"人工逃生通道。

文章要点:
- **从噪音到精准**:早期直接把git diff塞给LLM的方案产生了大量幻觉和模糊建议,团队很快意识到需要专业化分工而非单一通用提示词
- **插件化架构**:系统基于OpenCode构建,采用完全解耦的插件体系(GitLab、AI网关、合规检查、遥测等各自独立),通过`ConfigureContext` API贡献配置,最终组装成`opencode.json`
- **多智能体协作**:最多同时启动7个专业审查者各司其职,协调者代理负责去重、重新分类、合理性验证,并按严格规则做出approve/approve_with_comments/unapprove/request_changes四级决策
- **风险分级省成本**:按代码行数和文件数将MR分为Trivial/Lite/Full三级,小改动只派2个轻量代理且降级模型,安全相关文件永远触发Full审查,避免用大模型审typo
- **工程细节满满**:使用JSONL流式处理避免内存爆炸;通过磁盘patch文件共享上下文节省7倍token;清理XML边界标签防止提示注入;30秒心跳日志消除"模型思考中"的误取消

文章URL:https://blog.cloudflare.com/ai-code-review Orchestrating AI Code Review at scale
《MCP已死,CLI万岁》

标签:#AI工具 #开发工具 #MCP #CLI #LLM工具链 #Anthropic #AI代理

总结:
作者认为Anthropic推出的MCP协议正走向消亡,主张LLM应直接使用CLI工具而非专用协议。CLI具备可组合性、调试友好、认证成熟、无额外进程等优势,而MCP存在初始化不稳定、重复认证、权限粒度粗等实际痛点。最好的工具应同时服务人类与机器,开发者应优先打磨API和CLI。

文章要点:
- LLM天生就会用命令行:它们在海量man page、Stack Overflow和shell脚本中训练过,给Claude一个CLI和文档,它就能直接上手,根本不需要新协议
- 调试体验天差地别:CLI出问题你可以亲自跑一遍同样的命令,看到和AI完全一致的输入输出;MCP出错却要钻JSON传输日志,排查像考古
- 管道和组合才是生产力:CLI能通过`jq`、`grep`、重定向灵活处理数据;MCP面对大型Terraform计划只能全塞进上下文窗口,或额外写过滤逻辑,费力不讨好
- 认证体系早已成熟:`aws`、`gh`、`kubectl`都有经过实战检验的SSO和凭证管理,AI和人类共用同一套流程,坏了就按老办法修,不用学MCP专属排错
- 没有后台进程更省心:MCP服务器是常驻进程,会挂起、会掉线、需要状态管理;CLI只是磁盘上的二进制文件,随用随走,干净利落
- 日常使用的真实摩擦:MCP初始化经常抽风要重启,多工具反复认证让人崩溃,权限控制只有白名单名字做不到只读或参数级限制;CLI完全没有这些烦恼
- MCP并非毫无价值:只有当某个工具确实没有CLI时,MCP才是合理选择,标准化接口在极少数场景也有意义
- 给工具开发者的建议:如果你公司在砸钱做MCP服务器却没有官方CLI,赶紧停下来——先把API和CLI做好,AI代理自己会搞定剩下的

文章URL:https://ejholmes.github.io/2026/02/28/mcp-is-dead-long-live-the-cli.html
《为AI智能体设计产品:从界面思维到智能体思维》

标签:#AI产品 #MCP #智能体交互设计 #产品架构 #API设计 #Salesforce #Ramp #Notion

总结:
本文由Ramp产品负责人Teddy Riker撰写,探讨了AI智能体时代产品设计的范式转变。作者指出,未来80%的软件交互将通过AI智能体完成,产品团队需要从"为用户设计界面"转向"为智能体设计能力"。文章以Ramp、Salesforce、Notion等案例,提出了三大核心设计原则:主动提供成功所需的上下文规范、建立基于工具调用的反馈循环、识别并填补智能体间的上下文缺口。

文章要点:

- **交互范式正在翻转**:传统模式是"用户→界面→数据库",而AI时代正在变成"用户→用户智能体→软件智能体→数据库"。界面不会消失,但80%的交互将发生在智能体之间,产品团队需要为"看不见的用户"重新设计。

- **Salesforce的激进转型**:这家27年的传统软件巨头推出"Headless 360"计划,将平台所有能力暴露为API、MCP工具或CLI命令,承认图形界面CRM的护城河正在被侵蚀,主动拥抱"无界面"未来。

- **教会智能体如何成功**:Notion的MCP设计是个正面教材——它在工具描述中明确要求智能体先读取Markdown规范再操作,确保格式准确。相比之下,Slack MCP让智能体"自己摸索"格式规则,结果用户反而要花更多时间修正。产品团队应该主动告诉调用方"你需要知道什么才能成功"。

- **用反馈循环驱动产品迭代**:Ramp通过三个机制解决智能体交互的可观测性难题:要求每次工具调用附带`rationale`参数解释意图、提供独立的反馈提交工具、在特定工具中预埋上下文种子。这些反馈比人类用户更具体、更一致,能直接转化为新功能需求。

- **填补上下文缺口是核心设计挑战**:在"用户智能体↔️软件智能体"的协作中,双方各自掌握对方没有的信息。优秀的设计不是让智能体去猜技术细节(如GL code),而是让它们交换语义上下文(如"这是客户晚餐还是团队建设"),由各自擅长的那一方完成最终决策。

- **敷衍智能体支持的产品会被淘汰**:仅仅发布一个MCP服务器、勾上"支持AI"的 checkbox 是不够的。客户最终会流向那些认真打磨智能体体验、真正理解"最后签支票的可能是AI"的产品。

文章URL:https://baoyu.io/blog/2026-04-24/teddy-riker-2047312986696454584 为 Agent 设计产品
《AI编码代理生产级工程技能集》

标签:#AI辅助编程 #开发工具 #AI_Agent #工程规范 #ClaudeCode #Cursor #代码审查 #测试驱动开发 #CI_CD

总结:
这是一个为AI编码代理(如Claude Code、Cursor、GitHub Copilot等)设计的生产级工程技能仓库,由Addy Osmani维护。它将资深工程师在真实项目中的工作流、质量门禁和最佳实践编码为20个结构化技能,覆盖从需求定义到上线发布的完整开发生命周期,让AI代理在每次编码时都能保持一致的专业水准,避免走"最短路径"而跳过测试、审查等关键环节。

文章要点:
- 六阶段开发流水线:从Define(定义需求)→ Plan(拆解任务)→ Build(增量编码)→ Verify(验证测试)→ Review(质量门禁)→ Ship(安全发布),像工厂流水线一样规范AI的每一步动作
- 7个斜杠命令即开即用:/spec写需求文档、/build增量开发、/test跑测试、/review代码审查……输入命令就能自动激活对应的技能组合,非常顺手
- 20个实战技能全覆盖:从API设计、前端工程、TDD测试驱动,到性能优化、安全加固、Git工作流、CI/CD自动化,每个技能都自带步骤清单、验证标准和"反找借口"表格(比如AI想跳过测试时,会被技能里的反驳论据怼回去😄
- 多工具无缝兼容:Claude Code一键插件安装,Cursor复制到rules目录,Gemini CLI、Windsurf、GitHub Copilot、Kiro等主流AI编程工具都能直接用,技能就是纯Markdown,通吃所有支持系统提示词的代理
- Google工程文化落地:融入了Hyrum定律、Beyonce规则、测试金字塔、Chesterton围栏等Google实战智慧,不是泛泛而谈的理论,而是嵌入到每一步工作流中的可执行标准

文章URL:https://github.com/addyosmani/agent-skills GitHub - addyosmani/agent-skills: Production-grade engineering skills for AI coding agents.
《从基础学科到通用人工智能:25学科知识地图》

标签:#AI教育 #知识图谱 #AGI #跨学科学习 #深度学习 #机器学习 #强化学习 #认知科学 #DataWhale

总结:
这是一份由DataWhale社区维护的AI跨学科知识导航页,将支撑通用人工智能的25门基础学科按数学、计算、认知、决策、物理哲学五大簇组织,并提供多条能力形成路径(表示训练、结构关系、智能体控制、自然智能与AGI),帮助学习者从"学科目录"走向"能力路径",降低跨学科学习成本,避免在庞杂专题中迷路。

文章要点:
- AI本质是跨学科汇流系统,从1943年McCulloch-Pitts神经元到2022年后大模型与Agent,历史脉络清晰展示了数学、工程、认知、哲学等学科的交汇
- 25门学科被系统分为五大簇:数学与形式基础(概率/线代/优化/信息论等)、计算与系统工程(数值分析/控制论/硬件并行等)、认知生物与语言(神经科学/心理学/语言学等)、决策交互与社会机制(运筹学/博弈论/经济学)、物理与哲学基础(统计物理/哲学)
- 提供了五条能力形成路径:表示与训练、结构与关系、不确定性与因果、控制与智能体、自然智能与AGI,让学习围绕"能力如何长出来"而非"学科如何分类"来组织
- 针对不同目标读者定制了四条入门路线:机器学习/深度学习、结构化AI/图学习、强化学习/智能体、推理/AGI,并精选10个优先专题作为"最短抓手"
- 核心定位是"导航页"而非"正文替代者",强调通过横向跳转、反向链接和跨学科汇流点来提升学习效率,避免线性单学科推进

文章URL:https://github.com/datawhalechina/Path2AGI GitHub - datawhalechina/Path2AGI: 从基础学科到通用人工智能 - 跨学科知识图谱
《Karpathy把私藏的知识管理方法开源了:让LLM帮你维护Wiki,自己只管提问》

标签:#AI #知识管理 #LLM_Knowledge_Base #Personal_Wiki #Obsidian #RAG #Agent

总结:

Andrej Karpathy 分享了他用 LLM 管理个人知识库的方法:将原始资料放入只读目录,由 LLM 自动生成和维护结构化的 Wiki,再通过 Obsidian 查看。这套"摄入-查询-检查"工作流让他在小规模数据下无需 RAG 也能高效检索,更重要的是体现了 AI 时代的新范式——分享想法而非代码,让每个人的 Agent 按需实现。这对知识工作者如何从"操纵代码"转向"操纵知识"具有启发意义。

文章要点:

- **三层架构设计超清晰**:原始资料放在 raw/ 目录保持只读,LLM 自动读取并编译成结构化的 Wiki 文档,最后用 Obsidian 当查看器来展示。整套系统就像"原料→加工厂→展示厅"一样分工明确!

- **四个核心操作好懂又实用**:Ingest(新资料进来时 LLM 自动更新相关页面)、Query(日常提问让 LLM 去 Wiki 里搜索综合回答)、Lint(定期检查知识库有没有矛盾或遗漏)、Extra Tools(比如 vibe coding 的小搜索引擎)。整个知识库会越用越丰富~

- **为什么不用 RAG?Karpathy 的回答很实在**:他的知识库大约 100 篇文章、40 万字,在这个量级下 LLM 自己维护的索引和摘要已经够用了,不需要复杂的向量检索。Wiki 本身就是一种"压缩过的知识表示"

- **从"分享代码"到"分享想法"**:他把这套方法写成"idea file"公开,认为在 Agent 时代,清晰的思路比具体代码更有价值。每个人把自己的 Agent 叫来,照着这个想法文件就能搭出适合自己的版本

- **工作重心正在悄悄转移**:Karpathy 说他最近的 token 消耗从"写代码"大幅转向"操纵知识"。这对咱们知识工作者也是个信号——让 LLM 当长期的知识管家,而不只是临时问答工具,效率会更高呢!

文章URL:https://mp.weixin.qq.com/s/EoGLi067d_3huZf-X0Q6Fg
《OpenHarness:开源智能体基础设施框架》

标签:#AI #Agent #智能体 #开源 #Python #工具调用

总结:
OpenHarness是港大数据智能实验室(HKUDS)推出的轻量级开源智能体基础设施框架,仅用Python实现,代码量比Claude Code轻44倍(1.1万行vs 51万行),提供完整的工具调用、技能加载、记忆管理和多智能体协调功能,让开发者快速构建安全可靠的AI Agent应用。

文章要点:
- 极简架构设计:相比Claude Code的51万行TypeScript代码,OpenHarness仅用1.1万行Python实现,去除了企业级复杂依赖如遥测和OAuth,专注于核心Harness架构
- 五大核心模块:包含Agent循环(支持流式工具调用、并行执行、成本追踪)、工具套件(43种工具覆盖文件/Shell/搜索/Web/MCP)、上下文记忆(CLAUDE.md自动注入、MEMORY.md持久化)、权限治理(多级权限模式、交互式审批)、Swarm多智能体协调(子智能体委派、任务管理)
- 生态兼容性:完全兼容anthropics/skills技能格式和claude-code/plugins插件生态,支持OpenClaw、nanobot、Cursor等CLI工具集成
- 开箱即用:一条命令oh即可启动,内置114个单元测试和6个E2E测试套件,提供稳定可靠的基础能力

文章URL:
https://github.com/HKUDS/OpenHarness GitHub - HKUDS/OpenHarness:
《Vibe_Coding已死:Agent工程取而代之》

标签:#AI #Agent #软件工程 #VibeCoding #多Agent协作

总结:

本文作者Collin Wilkins指出,"Vibe Coding"(凭感觉编程)这一由Karpathy提出的概念已被其本人"杀死"——现在的开发者99%时间不是在写代码,而是在编排Agent。作者分享了自己工作方式的转变:从一年前80%代码手写,到现在主要分解问题、分配Agent并审核输出。文章强调,2026年2月的四大模型发布都将多Agent编排作为核心能力,真正的差距在于工作流而非工具。

文章要点:

- Vibe Coding的致命缺陷:它只优化了代码生成速度,却忽视了后续环节——SonarSource调查显示AI代码占提交量的42%,但96%的开发者不完全信任它,仅48%会在提交前验证,审查负担真实存在且大多数团队根本没做
- Agent工程的新范式:先规划和设计系统,定义边界和契约,再让Agent在约束内执行,像分布式系统工程一样处理Agent编排——同样的分解、组件间契约、可观测性
- 多Agent成为主流:Claude的Agent团队用2000次协调会话构建了10万行C编译器,Kimi K2.5单个任务可运行100个子Agent进行1500次工具调用
- 工作方式的彻底转变:作者现在每天的工作是分解问题、分配Agent、审核输出,"写代码"已不能描述他的日常工作
- AI是动力工具而非替代品:会用AI的工程师交付更快,但只会用AI的工程师交付垃圾,关键是知道何时该提示、何时该思考
- 瓶颈已转移:写代码不再是慢的部分,思考要构建什么、如何组合、什么会在规模下崩溃——这些才是耗时的地方
- 文档化决策:LLM不存储上下文,如果想让AI助手在现有代码库上快速移动,它需要加载已记录的决策

文章URL:

https://buttondown.com/collinwilkins/archive/vibe-coding-is-dead-heres-what-replaced-it/ Vibe coding is dead. Here's what replaced it
《AI指数级增长时代的产品管理》

标签:#产品管理 #AI #ClaudeCode #敏捷开发 #原型优先

总结:

本文由Anthropic的Claude Code产品负责人撰写,探讨了AI模型指数级进步如何颠覆传统产品管理范式。作者指出,过去PM依赖"项目开始时确定技术边界"的假设已失效,因为模型能力在项目周期内可能跃升数十倍。新的工作流强调快速实验、原型优先、角色融合和持续迭代,PM的核心价值转向在不确定性中创造清晰度、推动团队大胆设想可能性,并加速产品交付。

文章要点:

- 传统假设被打破**:过去PM基于"技术能力在项目周期内相对稳定"制定长期路线图,但AI模型能力呈指数级增长(如Claude在16个月内任务处理能力提升41倍),项目初期的技术约束可能在开发中途消失
- **角色边界模糊化**:AI工具让设计师能写代码、工程师做产品决策、PM直接构建原型和评估,产品/设计/工程从线性流程变为高度重叠的协作模式
- **原型优先于文档**:用Claude Code等工具几小时就能做出可演示的原型,团队用Demo代替PRD进行内部验证,错误决策的成本大幅降低
-
"支线任务"文化**:鼓励成员在正式路线图外进行短期自主实验,Claude Code桌面版、AskUserQuestion等热门功能都源自这种探索
- **模型迭代即产品迭代**:每个新模型发布都应触发对已有功能的重新审视,作者建议每天主动测试"可能太难"的任务,当模型能完成时就是产品该升级的信号
- **简单至上原则**:避免为绕过模型限制而设计复杂方案,这些"巧妙"的workaround会在新模型发布后变成技术债务,Claude Code的系统提示词已随模型升级精简了20%

文章URL:

https://claude.com/blog/product-management-on-the-ai-exponential Product management on the AI exponential  | Claude
《编程 Agent 如何重塑工程、产品和设计》

标签:#AI #编程Agent #软件开发 #产品经理 #系统设计 #VibeCoding

总结:

编程 Agent 正在颠覆传统的 EPD(工程、产品、设计)协作模式。当代码生成变得轻而易举,团队的核心价值从"写代码"转向"评审代码"。PRD 不再是流程起点,而是与原型并行的意图说明文档。这场变革让通才价值飙升,也让角色边界变得模糊——你要么是能用 Agent 独立完成功能的建设者,要么是具备顶级系统思维的专业评审者。无论出身产品、设计还是工程,拥有跨领域认知和清晰心智模型的人,将在这个新时代占据绝对优势。

文章要点:

- **PRD 的角色正在蜕变**:传统的"PRD → 设计稿 → 代码"线性流程已终结,但描述产品意图的文档依然重要。未来的 PRD 可能是结构化的、带版本管理的 Prompt,与可运行的代码原型共同构成评审基础。

- **瓶颈从实现转向评审**:当任何人都能快速生成代码原型时,工程、产品和设计的核心价值转变为把关质量——评估架构合理性、用户价值与体验流畅度。评审能力成为新的稀缺资源。

- **通才迎来黄金时代**:能同时驾驭产品思维、设计直觉和工程实现的"多面手"比以往更有影响力,因为他们省去了跨部门沟通的成本,可以直接与 Agent 协作完成端到端的交付。

- **角色分化为建设者与评审者**:团队将呈现两极分化。建设者擅长用 Agent 快速落地想法;评审者则是各领域的系统思维专家,负责把关复杂项目的质量。中间地带的从业者面临最大挑战。

- **产品意识成为全员必修课**:无论是工程师还是设计师,都需要具备判断"该做什么"的能力,否则会产生大量需要他人评审的"垃圾原型",拖累团队效率。

- **AI 放大 PM 的能力差距**:优秀的产品经理能借助 Agent 快速验证洞见,而思考不清晰的 PM 会产生更多低质量原型,造成资源浪费并增加"半成品上线"的风险。

文章URL:

https://baoyu.io/translations/2026-03-11/coding-agents-reshaping-epd 编程 Agent 如何重塑工程、产品和设计
《从写代码到管 Agent:斯坦福首门 AI 软件开发课的启示》

标签:#AI #Agent #软件工程 #斯坦福 #职业发展 #人机协作 #代码质量

总结

本文是对斯坦福讲师 Mihail Eric 访谈的解读,他是全美首门 AI 原生软件开发课程 CS146S 的负责人。文章分析了初级开发者面临的"三重风暴"(裁员潮、毕业生激增、AI 替代压力),提出 AI 时代工程师的核心竞争力已从写代码转向"管理 Agent"——即编排多个 AI Agent 完成复杂任务的能力。同时强调 Agent 友好的代码库需要充分的测试覆盖、一致的文档和清晰的设计模式,这些本质上也是对人友好的工程实践。文章还指出资深开发者往往因路径依赖抗拒 AI 工具,而初级工程师的"无知无畏"反而成为快速适应新范式的优势。

文章要点:

- **初级开发者的三重困境**:COVID 后企业裁员 20-30%、CS 毕业生十年翻倍、雇主倾向"少招人+AI"策略,叠加导致新人求职难度激增
- **Agent 编排是顶级技能**:能同时管理多个 Agent 的工程师属于顶尖 0.1%,但应从单个 Agent 开始逐步增加,避免盲目追求数量
- **上下文切换是核心挑战**:管理多 Agent 需要频繁切换注意力并记住各任务进度,这与管理人类团队的能力高度相似
- **Agent 友好代码库三要素**:充分的测试覆盖(作为显式合约)、README 与代码一致性、统一的设计模式,Agent 会在错误基础上快速复合错误
- **品味决定软件质量**:功能性软件与卓越软件的分界在于"最后一公里"的打磨,顶尖工程师在发现可能性时加速而非完成任务即停止
- **初级工程师的独特优势**:没有历史包袱,学习 AI 工具更快;"无知无畏"的特质使其敢于挑战行业难题,这是创业所需的完美品质
- **避免过度工程化陷阱**:AI 让构建变得太容易,可能导致造出精美但无人需要的产品,需先验证需求再动手开发

文章URL:https://baoyu.io/blog/2026-02-27/from-writing-code-to-managing-agents 从写代码到管 Agent:斯坦福首门 AI 软件开发课的讲师说,大多数工程师还没准备好
《Claude技能构建完整指南》

标签:#AI #Claude #MCP #Agent_Skills #Workflow_Automation #开发工具 #Anthropic

总结:Anthropic官方发布的Claude技能构建指南,系统介绍了如何通过SKILL.md文件创建可复用的AI工作流。技能采用渐进式披露架构(YAML前置元数据+Markdown指令+引用资源),可与MCP工具集成实现多步骤自动化。文档涵盖规划、测试、分发全流程,提供5种设计模式(顺序工作流、多MCP协调、迭代优化等),并给出量化评估指标(90%触发准确率、零API失败率),目标帮助开发者在15-30分钟内构建生产级AI技能。

文章要点:
- 技能定义:包含SKILL.md(必需)、scripts/、references/、assets/的文件夹结构,采用kebab-case命名规范,支持Claude.ai、Claude Code和API三端通用
- 渐进式披露设计:三级加载机制(YAML元数据→SKILL.md正文→链接资源),最小化token消耗同时保持专业性
- 三大应用场景:文档/资源创建(如前端设计)、工作流自动化(如项目管理)、MCP增强(如Sentry代码审查),后者将工具访问转化为可靠工作流
- 成功指标:技能应在90%相关查询中自动触发,单次工作流工具调用次数明确,零失败API调用,用户无需提示下一步操作
- 核心设计模式:顺序工作流编排、多MCP协调(跨Figma/Linear/Slack等)、迭代优化循环、上下文感知工具选择、领域特定智能(如合规检查)
- 测试策略:触发测试( obvious/paraphrased/negative cases)、功能测试、性能对比(有无技能时的token消耗和交互轮次差异)
- 分发方式:GitHub托管+Claude.ai设置上传,支持组织级部署和API程序化调用,定位为MCP的"知识层"(厨房类比:MCP是厨房设备,技能是食谱)
- 常见陷阱:描述字段过于模糊导致触发失败、包含XML标签的安全限制、README.md与SKILL.md混淆、指令过于冗长导致模型"懒惰"

https://resources.anthropic.com/hubfs/The-Complete-Guide-to-Building-Skill-for-Claude.pdf
#AI 2025 年是 LLM 从“玩具”走向“工具”的转折年:推理模型+代码 Agent+异步任务+手机编程,构成了新的开发范式。中国模型崛起、Google 发力、OpenAI 失领先,格局已变。

https://simonwillison.net/2025/Dec/31/the-year-in-llms/
#AI 作者利用人工智能工具开发macOS无感自动更新功能的全过程,包括规划、原型设计、代码清理、解决难题、后端开发、模拟测试和最终集成,强调了AI作为助手在提高开发效率方面的作用,以及人工介入在解决关键问题上的重要性。

https://mitchellh.com/writing/non-trivial-vibing
#AI #文章 AI不是来替代工程师的,而是来“被管理”的。
只有把AI当作“极快但无知的初级开发者”,用工程化手段管理它,才能真正放大人类团队的交付能力,而不是陷入“AI写代码,人类擦屁股”的陷阱。

https://chrisloy.dev/post/2025/09/28/the-ai-coding-trap
#AI #文章 直到现在,代理们都是“蒙着眼睛写代码”。他们虽然能快速生成代码,却看不到那个按钮是否真的可以点击,也无法了解你的 Lighthouse 评分到底是什么样的,更搞不清楚为什么你的 API 调用会失败。
这个新工具通过将 Chrome 开发者工具与基于 Puppeteer 的 MCP 服务器连接起来,解决了这一问题,任何人工智能都可以调用该服务器。这样一来,你的代理就有了“眼睛”,能够深入到沙盒化的 Chrome 配置文件中进行探索,并完成一些有趣的事情,例如:

1. 像开发者一样进行调试—通过 MCP 直接检查 DOM、查看控制台日志并审查网络请求,让您的代理能够真正排查运行时错误,而无需盲目猜测。

2. 自动化用户流程—通过模拟真实用户行为,点击按钮、填写表单、上传文件,并重现漏洞。

3. 运行性能审计—触发 Chrome 性能跟踪,并提取可操作的指标,例如 LCP 和 TBT。现在,你可以再次把糟糕的 Lighthouse 分数归咎于 React,而不是 AI 了。

https://developer.chrome.com/blog/chrome-devtools-mcp?hl=zh-cn 适用于 AI 代理的 Chrome 开发者工具 (MCP)  |  Blog  |  Chrome for Developers
#AI #文章 直到现在,代理们都是“蒙着眼睛写代码”。他们虽然能快速生成代码,却看不到那个按钮是否真的可以点击,也无法了解你的 Lighthouse 评分到底是什么样的,更搞不清楚为什么你的 API 调用会失败。
这个新工具通过将 Chrome 开发者工具与基于 Puppeteer 的 MCP 服务器连接起来,解决了这一问题,任何人工智能都可以调用该服务器。这样一来,你的代理就有了“眼睛”,能够深入到沙盒化的 Chrome 配置文件中进行探索,并完成一些有趣的事情,例如:
1. 像开发者一样进行调试—通过 MCP 直接检查 DOM、查看控制台日志并审查网络请求,让您的代理能够真正排查运行时错误,而无需盲目猜测。
2. 自动化用户流程—通过模拟真实用户行为,点击按钮、填写表单、上传文件,并重现漏洞。
3. 运行性能审计—触发 Chrome 性能跟踪,并提取可操作的指标,例如 LCP 和 TBT。现在,你可以再次把糟糕的 Lighthouse 分数归咎于 React,而不是 AI 了。

https://developer.chrome.com/blog/chrome-devtools-mcp?hl=zh-cn 适用于 AI 代理的 Chrome 开发者工具 (MCP)  |  Blog  |  Chrome for Developers
 
 
Back to Top