锤子前端 - Now vibe coding, so learning hammer FE ?

Now vibe coding, so learning hammer FE ?

《大规模AI代码审查编排实践》

标签：#DevOps #AI辅助编程 #CodeReview #CI_CD #LLM #多智能体系统 #Cloudflare #OpenCode #插件架构

总结：
Cloudflare为解决代码审查瓶颈，放弃单一LLM直接审diff的噪音方案，转而基于开源代理OpenCode构建CI原生编排系统。该系统采用可组合插件架构，通过风险分级（Trivial/Lite/Full）动态调度最多7个专业审查智能体（安全、性能、质量等），由协调者代理去重、过滤并做出审批决策。系统已在数万MR上运行，能精准拦截真实漏洞，同时保留"break glass"人工逃生通道。

文章要点：
- **从噪音到精准**：早期直接把git diff塞给LLM的方案产生了大量幻觉和模糊建议，团队很快意识到需要专业化分工而非单一通用提示词
- **插件化架构**：系统基于OpenCode构建，采用完全解耦的插件体系（GitLab、AI网关、合规检查、遥测等各自独立），通过`ConfigureContext` API贡献配置，最终组装成`opencode.json`
- **多智能体协作**：最多同时启动7个专业审查者各司其职，协调者代理负责去重、重新分类、合理性验证，并按严格规则做出approve/approve_with_comments/unapprove/request_changes四级决策
- **风险分级省成本**：按代码行数和文件数将MR分为Trivial/Lite/Full三级，小改动只派2个轻量代理且降级模型，安全相关文件永远触发Full审查，避免用大模型审typo
- **工程细节满满**：使用JSONL流式处理避免内存爆炸；通过磁盘patch文件共享上下文节省7倍token；清理XML边界标签防止提示注入；30秒心跳日志消除"模型思考中"的误取消

文章URL：https://blog.cloudflare.com/ai-code-review

The Cloudflare Blog

Orchestrating AI Code Review at scale

Learn about how we built a CI-native AI code reviewer using OpenCode that helps our engineers ship better, safer code.

5 小时前

《MCP已死，CLI万岁》

标签：#AI工具 #开发工具 #MCP #CLI #LLM工具链 #Anthropic #AI代理

总结：
作者认为Anthropic推出的MCP协议正走向消亡，主张LLM应直接使用CLI工具而非专用协议。CLI具备可组合性、调试友好、认证成熟、无额外进程等优势，而MCP存在初始化不稳定、重复认证、权限粒度粗等实际痛点。最好的工具应同时服务人类与机器，开发者应优先打磨API和CLI。

文章要点：
- LLM天生就会用命令行：它们在海量man page、Stack Overflow和shell脚本中训练过，给Claude一个CLI和文档，它就能直接上手，根本不需要新协议
- 调试体验天差地别：CLI出问题你可以亲自跑一遍同样的命令，看到和AI完全一致的输入输出；MCP出错却要钻JSON传输日志，排查像考古
- 管道和组合才是生产力：CLI能通过`jq`、`grep`、重定向灵活处理数据；MCP面对大型Terraform计划只能全塞进上下文窗口，或额外写过滤逻辑，费力不讨好
- 认证体系早已成熟：`aws`、`gh`、`kubectl`都有经过实战检验的SSO和凭证管理，AI和人类共用同一套流程，坏了就按老办法修，不用学MCP专属排错
- 没有后台进程更省心：MCP服务器是常驻进程，会挂起、会掉线、需要状态管理；CLI只是磁盘上的二进制文件，随用随走，干净利落
- 日常使用的真实摩擦：MCP初始化经常抽风要重启，多工具反复认证让人崩溃，权限控制只有白名单名字做不到只读或参数级限制；CLI完全没有这些烦恼
- MCP并非毫无价值：只有当某个工具确实没有CLI时，MCP才是合理选择，标准化接口在极少数场景也有意义
- 给工具开发者的建议：如果你公司在砸钱做MCP服务器却没有官方CLI，赶紧停下来——先把API和CLI做好，AI代理自己会搞定剩下的

文章URL：https://ejholmes.github.io/2026/02/28/mcp-is-dead-long-live-the-cli.html

AI工具开发工具 MCP CLI LLM工具链 Anthropic AI代理

2 天前

《为AI智能体设计产品：从界面思维到智能体思维》

标签：#AI产品 #MCP #智能体交互设计 #产品架构 #API设计 #Salesforce #Ramp #Notion

总结：
本文由Ramp产品负责人Teddy Riker撰写，探讨了AI智能体时代产品设计的范式转变。作者指出，未来80%的软件交互将通过AI智能体完成，产品团队需要从"为用户设计界面"转向"为智能体设计能力"。文章以Ramp、Salesforce、Notion等案例，提出了三大核心设计原则：主动提供成功所需的上下文规范、建立基于工具调用的反馈循环、识别并填补智能体间的上下文缺口。

文章要点：

- **交互范式正在翻转**：传统模式是"用户→界面→数据库"，而AI时代正在变成"用户→用户智能体→软件智能体→数据库"。界面不会消失，但80%的交互将发生在智能体之间，产品团队需要为"看不见的用户"重新设计。

- **Salesforce的激进转型**：这家27年的传统软件巨头推出"Headless 360"计划，将平台所有能力暴露为API、MCP工具或CLI命令，承认图形界面CRM的护城河正在被侵蚀，主动拥抱"无界面"未来。

- **教会智能体如何成功**：Notion的MCP设计是个正面教材——它在工具描述中明确要求智能体先读取Markdown规范再操作，确保格式准确。相比之下，Slack MCP让智能体"自己摸索"格式规则，结果用户反而要花更多时间修正。产品团队应该主动告诉调用方"你需要知道什么才能成功"。

- **用反馈循环驱动产品迭代**：Ramp通过三个机制解决智能体交互的可观测性难题：要求每次工具调用附带`rationale`参数解释意图、提供独立的反馈提交工具、在特定工具中预埋上下文种子。这些反馈比人类用户更具体、更一致，能直接转化为新功能需求。

- **填补上下文缺口是核心设计挑战**：在"用户智能体↔️软件智能体"的协作中，双方各自掌握对方没有的信息。优秀的设计不是让智能体去猜技术细节（如GL code），而是让它们交换语义上下文（如"这是客户晚餐还是团队建设"），由各自擅长的那一方完成最终决策。

- **敷衍智能体支持的产品会被淘汰**：仅仅发布一个MCP服务器、勾上"支持AI"的 checkbox 是不够的。客户最终会流向那些认真打磨智能体体验、真正理解"最后签支票的可能是AI"的产品。

文章URL：https://baoyu.io/blog/2026-04-24/teddy-riker-2047312986696454584

baoyu.io

为 Agent 设计产品

UI 并没有死，但软件交互的 80% 正在转向 Agent。产品团队需要像过去为人设计界面一样，认真为 Agent 设计工具、上下文和反馈闭环。

AI产品 MCP 智能体交互设计产品架构 API设计 Salesforce Ramp Notion

3 天前

《AI编码代理生产级工程技能集》

标签：#AI辅助编程 #开发工具 #AI_Agent #工程规范 #ClaudeCode #Cursor #代码审查 #测试驱动开发 #CI_CD

总结：
这是一个为AI编码代理（如Claude Code、Cursor、GitHub Copilot等）设计的生产级工程技能仓库，由Addy Osmani维护。它将资深工程师在真实项目中的工作流、质量门禁和最佳实践编码为20个结构化技能，覆盖从需求定义到上线发布的完整开发生命周期，让AI代理在每次编码时都能保持一致的专业水准，避免走"最短路径"而跳过测试、审查等关键环节。

文章要点：
- 六阶段开发流水线：从Define（定义需求）→ Plan（拆解任务）→ Build（增量编码）→ Verify（验证测试）→ Review（质量门禁）→ Ship（安全发布），像工厂流水线一样规范AI的每一步动作
- 7个斜杠命令即开即用：/spec写需求文档、/build增量开发、/test跑测试、/review代码审查……输入命令就能自动激活对应的技能组合，非常顺手
- 20个实战技能全覆盖：从API设计、前端工程、TDD测试驱动，到性能优化、安全加固、Git工作流、CI/CD自动化，每个技能都自带步骤清单、验证标准和"反找借口"表格（比如AI想跳过测试时，会被技能里的反驳论据怼回去😄）
- 多工具无缝兼容：Claude Code一键插件安装，Cursor复制到rules目录，Gemini CLI、Windsurf、GitHub Copilot、Kiro等主流AI编程工具都能直接用，技能就是纯Markdown，通吃所有支持系统提示词的代理
- Google工程文化落地：融入了Hyrum定律、Beyonce规则、测试金字塔、Chesterton围栏等Google实战智慧，不是泛泛而谈的理论，而是嵌入到每一步工作流中的可执行标准

文章URL：https://github.com/addyosmani/agent-skills

GitHub

GitHub - addyosmani/agent-skills: Production-grade engineering skills for AI coding agents.

Production-grade engineering skills for AI coding agents. - addyosmani/agent-skills

AI辅助编程开发工具 AI_Agent 工程规范 ClaudeCode Cursor 代码审查测试驱动开发 CI_CD

3 天前

《从基础学科到通用人工智能：25学科知识地图》

标签：#AI教育 #知识图谱 #AGI #跨学科学习 #深度学习 #机器学习 #强化学习 #认知科学 #DataWhale

总结：
这是一份由DataWhale社区维护的AI跨学科知识导航页，将支撑通用人工智能的25门基础学科按数学、计算、认知、决策、物理哲学五大簇组织，并提供多条能力形成路径（表示训练、结构关系、智能体控制、自然智能与AGI），帮助学习者从"学科目录"走向"能力路径"，降低跨学科学习成本，避免在庞杂专题中迷路。

文章要点：
- AI本质是跨学科汇流系统，从1943年McCulloch-Pitts神经元到2022年后大模型与Agent，历史脉络清晰展示了数学、工程、认知、哲学等学科的交汇
- 25门学科被系统分为五大簇：数学与形式基础（概率/线代/优化/信息论等）、计算与系统工程（数值分析/控制论/硬件并行等）、认知生物与语言（神经科学/心理学/语言学等）、决策交互与社会机制（运筹学/博弈论/经济学）、物理与哲学基础（统计物理/哲学）
- 提供了五条能力形成路径：表示与训练、结构与关系、不确定性与因果、控制与智能体、自然智能与AGI，让学习围绕"能力如何长出来"而非"学科如何分类"来组织
- 针对不同目标读者定制了四条入门路线：机器学习/深度学习、结构化AI/图学习、强化学习/智能体、推理/AGI，并精选10个优先专题作为"最短抓手"
- 核心定位是"导航页"而非"正文替代者"，强调通过横向跳转、反向链接和跨学科汇流点来提升学习效率，避免线性单学科推进

文章URL：https://github.com/datawhalechina/Path2AGI

GitHub

GitHub - datawhalechina/Path2AGI: 从基础学科到通用人工智能 - 跨学科知识图谱

从基础学科到通用人工智能 - 跨学科知识图谱. Contribute to datawhalechina/Path2AGI development by creating an account on GitHub.

AI教育知识图谱 AGI 跨学科学习深度学习机器学习强化学习认知科学 DataWhale

14:02 · 2026年4月10日 · 周五

《Karpathy把私藏的知识管理方法开源了：让LLM帮你维护Wiki，自己只管提问》

标签：#AI #知识管理 #LLM_Knowledge_Base #Personal_Wiki #Obsidian #RAG #Agent

总结：

Andrej Karpathy 分享了他用 LLM 管理个人知识库的方法：将原始资料放入只读目录，由 LLM 自动生成和维护结构化的 Wiki，再通过 Obsidian 查看。这套"摄入-查询-检查"工作流让他在小规模数据下无需 RAG 也能高效检索，更重要的是体现了 AI 时代的新范式——分享想法而非代码，让每个人的 Agent 按需实现。这对知识工作者如何从"操纵代码"转向"操纵知识"具有启发意义。

文章要点：

- **三层架构设计超清晰**：原始资料放在 raw/ 目录保持只读，LLM 自动读取并编译成结构化的 Wiki 文档，最后用 Obsidian 当查看器来展示。整套系统就像"原料→加工厂→展示厅"一样分工明确！

- **四个核心操作好懂又实用**：Ingest（新资料进来时 LLM 自动更新相关页面）、Query（日常提问让 LLM 去 Wiki 里搜索综合回答）、Lint（定期检查知识库有没有矛盾或遗漏）、Extra Tools（比如 vibe coding 的小搜索引擎）。整个知识库会越用越丰富~

- **为什么不用 RAG？Karpathy 的回答很实在**：他的知识库大约 100 篇文章、40 万字，在这个量级下 LLM 自己维护的索引和摘要已经够用了，不需要复杂的向量检索。Wiki 本身就是一种"压缩过的知识表示"

- **从"分享代码"到"分享想法"**：他把这套方法写成"idea file"公开，认为在 Agent 时代，清晰的思路比具体代码更有价值。每个人把自己的 Agent 叫来，照着这个想法文件就能搭出适合自己的版本

- **工作重心正在悄悄转移**：Karpathy 说他最近的 token 消耗从"写代码"大幅转向"操纵知识"。这对咱们知识工作者也是个信号——让 LLM 当长期的知识管家，而不只是临时问答工具，效率会更高呢！

文章URL：https://mp.weixin.qq.com/s/EoGLi067d_3huZf-X0Q6Fg

AI 知识管理 LLM_Knowledge_Base Personal_Wiki Obsidian RAG Agent

08:52 · 2026年4月4日 · 周六

《OpenHarness：开源智能体基础设施框架》

标签：#AI #Agent #智能体 #开源 #Python #工具调用

总结：
OpenHarness是港大数据智能实验室（HKUDS）推出的轻量级开源智能体基础设施框架，仅用Python实现，代码量比Claude Code轻44倍（1.1万行vs 51万行），提供完整的工具调用、技能加载、记忆管理和多智能体协调功能，让开发者快速构建安全可靠的AI Agent应用。

文章要点：
- 极简架构设计：相比Claude Code的51万行TypeScript代码，OpenHarness仅用1.1万行Python实现，去除了企业级复杂依赖如遥测和OAuth，专注于核心Harness架构
- 五大核心模块：包含Agent循环（支持流式工具调用、并行执行、成本追踪）、工具套件（43种工具覆盖文件/Shell/搜索/Web/MCP）、上下文记忆（CLAUDE.md自动注入、MEMORY.md持久化）、权限治理（多级权限模式、交互式审批）、Swarm多智能体协调（子智能体委派、任务管理）
- 生态兼容性：完全兼容anthropics/skills技能格式和claude-code/plugins插件生态，支持OpenClaw、nanobot、Cursor等CLI工具集成
- 开箱即用：一条命令oh即可启动，内置114个单元测试和6个E2E测试套件，提供稳定可靠的基础能力

文章URL：
https://github.com/HKUDS/OpenHarness

GitHub

GitHub - HKUDS/OpenHarness: "OpenHarness: Open Agent Harness with a Built-in Personal Agent--Ohmo!"

"OpenHarness: Open Agent Harness with a Built-in Personal Agent--Ohmo!" - HKUDS/OpenHarness

AI Agent 智能体开源 Python 工具调用

15:00 · 2026年3月30日 · 周一

《Vibe_Coding已死：Agent工程取而代之》

标签：#AI #Agent #软件工程 #VibeCoding #多Agent协作

总结：

本文作者Collin Wilkins指出，"Vibe Coding"（凭感觉编程）这一由Karpathy提出的概念已被其本人"杀死"——现在的开发者99%时间不是在写代码，而是在编排Agent。作者分享了自己工作方式的转变：从一年前80%代码手写，到现在主要分解问题、分配Agent并审核输出。文章强调，2026年2月的四大模型发布都将多Agent编排作为核心能力，真正的差距在于工作流而非工具。

文章要点：

- Vibe Coding的致命缺陷：它只优化了代码生成速度，却忽视了后续环节——SonarSource调查显示AI代码占提交量的42%，但96%的开发者不完全信任它，仅48%会在提交前验证，审查负担真实存在且大多数团队根本没做
- Agent工程的新范式：先规划和设计系统，定义边界和契约，再让Agent在约束内执行，像分布式系统工程一样处理Agent编排——同样的分解、组件间契约、可观测性
- 多Agent成为主流：Claude的Agent团队用2000次协调会话构建了10万行C编译器，Kimi K2.5单个任务可运行100个子Agent进行1500次工具调用
- 工作方式的彻底转变：作者现在每天的工作是分解问题、分配Agent、审核输出，"写代码"已不能描述他的日常工作
- AI是动力工具而非替代品：会用AI的工程师交付更快，但只会用AI的工程师交付垃圾，关键是知道何时该提示、何时该思考
- 瓶颈已转移：写代码不再是慢的部分，思考要构建什么、如何组合、什么会在规模下崩溃——这些才是耗时的地方
- 文档化决策：LLM不存储上下文，如果想让AI助手在现有代码库上快速移动，它需要加载已记录的决策

文章URL：

https://buttondown.com/collinwilkins/archive/vibe-coding-is-dead-heres-what-replaced-it/

Buttondown

Vibe coding is dead. Here's what replaced it

What I actually do now instead of writing code.

AI Agent 软件工程 VibeCoding 多Agent协作

13:38 · 2026年3月30日 · 周一

《AI指数级增长时代的产品管理》

标签：#产品管理 #AI #ClaudeCode #敏捷开发 #原型优先

总结：

本文由Anthropic的Claude Code产品负责人撰写，探讨了AI模型指数级进步如何颠覆传统产品管理范式。作者指出，过去PM依赖"项目开始时确定技术边界"的假设已失效，因为模型能力在项目周期内可能跃升数十倍。新的工作流强调快速实验、原型优先、角色融合和持续迭代，PM的核心价值转向在不确定性中创造清晰度、推动团队大胆设想可能性，并加速产品交付。

文章要点：

- 传统假设被打破**：过去PM基于"技术能力在项目周期内相对稳定"制定长期路线图，但AI模型能力呈指数级增长（如Claude在16个月内任务处理能力提升41倍），项目初期的技术约束可能在开发中途消失
- **角色边界模糊化**：AI工具让设计师能写代码、工程师做产品决策、PM直接构建原型和评估，产品/设计/工程从线性流程变为高度重叠的协作模式
- **原型优先于文档**：用Claude Code等工具几小时就能做出可演示的原型，团队用Demo代替PRD进行内部验证，错误决策的成本大幅降低
- "支线任务"文化**：鼓励成员在正式路线图外进行短期自主实验，Claude Code桌面版、AskUserQuestion等热门功能都源自这种探索
- **模型迭代即产品迭代**：每个新模型发布都应触发对已有功能的重新审视，作者建议每天主动测试"可能太难"的任务，当模型能完成时就是产品该升级的信号
- **简单至上原则**：避免为绕过模型限制而设计复杂方案，这些"巧妙"的workaround会在新模型发布后变成技术债务，Claude Code的系统提示词已随模型升级精简了20%

文章URL：

https://claude.com/blog/product-management-on-the-ai-exponential

Claude

Product management on the AI exponential | Claude

Claude Code’s Head of Product Cat Wu shares how teams should rethink their workflows and roadmaps in the face of rapidly evolving model intelligence.

产品管理 AI ClaudeCode 敏捷开发原型优先

19:23 · 2026年3月18日 · 周三

《编程 Agent 如何重塑工程、产品和设计》

标签：#AI #编程Agent #软件开发 #产品经理 #系统设计 #VibeCoding

总结：

编程 Agent 正在颠覆传统的 EPD（工程、产品、设计）协作模式。当代码生成变得轻而易举，团队的核心价值从"写代码"转向"评审代码"。PRD 不再是流程起点，而是与原型并行的意图说明文档。这场变革让通才价值飙升，也让角色边界变得模糊——你要么是能用 Agent 独立完成功能的建设者，要么是具备顶级系统思维的专业评审者。无论出身产品、设计还是工程，拥有跨领域认知和清晰心智模型的人，将在这个新时代占据绝对优势。

文章要点：

- **PRD 的角色正在蜕变**：传统的"PRD → 设计稿 → 代码"线性流程已终结，但描述产品意图的文档依然重要。未来的 PRD 可能是结构化的、带版本管理的 Prompt，与可运行的代码原型共同构成评审基础。

- **瓶颈从实现转向评审**：当任何人都能快速生成代码原型时，工程、产品和设计的核心价值转变为把关质量——评估架构合理性、用户价值与体验流畅度。评审能力成为新的稀缺资源。

- **通才迎来黄金时代**：能同时驾驭产品思维、设计直觉和工程实现的"多面手"比以往更有影响力，因为他们省去了跨部门沟通的成本，可以直接与 Agent 协作完成端到端的交付。

- **角色分化为建设者与评审者**：团队将呈现两极分化。建设者擅长用 Agent 快速落地想法；评审者则是各领域的系统思维专家，负责把关复杂项目的质量。中间地带的从业者面临最大挑战。

- **产品意识成为全员必修课**：无论是工程师还是设计师，都需要具备判断"该做什么"的能力，否则会产生大量需要他人评审的"垃圾原型"，拖累团队效率。

- **AI 放大 PM 的能力差距**：优秀的产品经理能借助 Agent 快速验证洞见，而思考不清晰的 PM 会产生更多低质量原型，造成资源浪费并增加"半成品上线"的风险。

文章URL：

https://baoyu.io/translations/2026-03-11/coding-agents-reshaping-epd

baoyu.io

编程 Agent 如何重塑工程、产品和设计

编程 Agent 让写代码变得异常简单，EPD 的角色定位会怎么变？PRD 已死、瓶颈从实现转向评审、通才比以往更有价值。

AI 编程Agent 软件开发产品经理系统设计 VibeCoding

16:48 · 2026年3月2日 · 周一

《从写代码到管 Agent：斯坦福首门 AI 软件开发课的启示》

标签：#AI #Agent #软件工程 #斯坦福 #职业发展 #人机协作 #代码质量

总结

本文是对斯坦福讲师 Mihail Eric 访谈的解读，他是全美首门 AI 原生软件开发课程 CS146S 的负责人。文章分析了初级开发者面临的"三重风暴"（裁员潮、毕业生激增、AI 替代压力），提出 AI 时代工程师的核心竞争力已从写代码转向"管理 Agent"——即编排多个 AI Agent 完成复杂任务的能力。同时强调 Agent 友好的代码库需要充分的测试覆盖、一致的文档和清晰的设计模式，这些本质上也是对人友好的工程实践。文章还指出资深开发者往往因路径依赖抗拒 AI 工具，而初级工程师的"无知无畏"反而成为快速适应新范式的优势。

文章要点：

- **初级开发者的三重困境**：COVID 后企业裁员 20-30%、CS 毕业生十年翻倍、雇主倾向"少招人+AI"策略，叠加导致新人求职难度激增
- **Agent 编排是顶级技能**：能同时管理多个 Agent 的工程师属于顶尖 0.1%，但应从单个 Agent 开始逐步增加，避免盲目追求数量
- **上下文切换是核心挑战**：管理多 Agent 需要频繁切换注意力并记住各任务进度，这与管理人类团队的能力高度相似
- **Agent 友好代码库三要素**：充分的测试覆盖（作为显式合约）、README 与代码一致性、统一的设计模式，Agent 会在错误基础上快速复合错误
- **品味决定软件质量**：功能性软件与卓越软件的分界在于"最后一公里"的打磨，顶尖工程师在发现可能性时加速而非完成任务即停止
- **初级工程师的独特优势**：没有历史包袱，学习 AI 工具更快；"无知无畏"的特质使其敢于挑战行业难题，这是创业所需的完美品质
- **避免过度工程化陷阱**：AI 让构建变得太容易，可能导致造出精美但无人需要的产品，需先验证需求再动手开发

文章URL：https://baoyu.io/blog/2026-02-27/from-writing-code-to-managing-agents

baoyu.io

从写代码到管 Agent：斯坦福首门 AI 软件开发课的讲师说，大多数工程师还没准备好

斯坦福首门 AI 软件开发课讲师 Mihail Eric 谈初级开发者的三重困境、多 Agent 编排的真正难点、Agent 友好代码库的标准，以及为什么初级工程师的'无知无畏'在 AI 时代反而是超能力。

AI Agent 软件工程斯坦福职业发展人机协作代码质量

08:51 · 2026年2月23日 · 周一

《Claude技能构建完整指南》

标签：#AI #Claude #MCP #Agent_Skills #Workflow_Automation #开发工具 #Anthropic

总结：Anthropic官方发布的Claude技能构建指南，系统介绍了如何通过SKILL.md文件创建可复用的AI工作流。技能采用渐进式披露架构（YAML前置元数据+Markdown指令+引用资源），可与MCP工具集成实现多步骤自动化。文档涵盖规划、测试、分发全流程，提供5种设计模式（顺序工作流、多MCP协调、迭代优化等），并给出量化评估指标（90%触发准确率、零API失败率），目标帮助开发者在15-30分钟内构建生产级AI技能。

文章要点：
- 技能定义：包含SKILL.md（必需）、scripts/、references/、assets/的文件夹结构，采用kebab-case命名规范，支持Claude.ai、Claude Code和API三端通用
- 渐进式披露设计：三级加载机制（YAML元数据→SKILL.md正文→链接资源），最小化token消耗同时保持专业性
- 三大应用场景：文档/资源创建（如前端设计）、工作流自动化（如项目管理）、MCP增强（如Sentry代码审查），后者将工具访问转化为可靠工作流
- 成功指标：技能应在90%相关查询中自动触发，单次工作流工具调用次数明确，零失败API调用，用户无需提示下一步操作
- 核心设计模式：顺序工作流编排、多MCP协调（跨Figma/Linear/Slack等）、迭代优化循环、上下文感知工具选择、领域特定智能（如合规检查）
- 测试策略：触发测试（ obvious/paraphrased/negative cases）、功能测试、性能对比（有无技能时的token消耗和交互轮次差异）
- 分发方式：GitHub托管+Claude.ai设置上传，支持组织级部署和API程序化调用，定位为MCP的"知识层"（厨房类比：MCP是厨房设备，技能是食谱）
- 常见陷阱：描述字段过于模糊导致触发失败、包含XML标签的安全限制、README.md与SKILL.md混淆、指令过于冗长导致模型"懒惰"

https://resources.anthropic.com/hubfs/The-Complete-Guide-to-Building-Skill-for-Claude.pdf

AI Claude MCP Agent_Skills Workflow_Automation 开发工具 Anthropic

22:10 · 2026年1月4日 · 周日

#AI 2025 年是 LLM 从“玩具”走向“工具”的转折年：推理模型+代码 Agent+异步任务+手机编程，构成了新的开发范式。中国模型崛起、Google 发力、OpenAI 失领先，格局已变。

https://simonwillison.net/2025/Dec/31/the-year-in-llms/

Simon Willison’s Weblog

2025: The year in LLMs

This is the third in my annual series reviewing everything that happened in the LLM space over the past 12 months. For previous years see Stuff we figured out about …

19:53 · 2025年10月16日 · 周四

#AI 作者利用人工智能工具开发macOS无感自动更新功能的全过程，包括规划、原型设计、代码清理、解决难题、后端开发、模拟测试和最终集成，强调了AI作为助手在提高开发效率方面的作用，以及人工介入在解决关键问题上的重要性。

https://mitchellh.com/writing/non-trivial-vibing

23:40 · 2025年9月30日 · 周二

#AI #文章 AI不是来替代工程师的，而是来“被管理”的。
只有把AI当作“极快但无知的初级开发者”，用工程化手段管理它，才能真正放大人类团队的交付能力，而不是陷入“AI写代码，人类擦屁股”的陷阱。

https://chrisloy.dev/post/2025/09/28/the-ai-coding-trap

chrisloy.dev

The AI coding trap | Chris Loy

If you ever watch someone “coding”, you might see them spending far more time staring
into space than typing on their keyboard.

AI 文章

23:02 · 2025年9月30日 · 周二

#AI #文章直到现在，代理们都是“蒙着眼睛写代码”。他们虽然能快速生成代码，却看不到那个按钮是否真的可以点击，也无法了解你的 Lighthouse 评分到底是什么样的，更搞不清楚为什么你的 API 调用会失败。
这个新工具通过将 Chrome 开发者工具与基于 Puppeteer 的 MCP 服务器连接起来，解决了这一问题，任何人工智能都可以调用该服务器。这样一来，你的代理就有了“眼睛”，能够深入到沙盒化的 Chrome 配置文件中进行探索，并完成一些有趣的事情，例如：

1. 像开发者一样进行调试—通过 MCP 直接检查 DOM、查看控制台日志并审查网络请求，让您的代理能够真正排查运行时错误，而无需盲目猜测。

2. 自动化用户流程—通过模拟真实用户行为，点击按钮、填写表单、上传文件，并重现漏洞。

3. 运行性能审计—触发 Chrome 性能跟踪，并提取可操作的指标，例如 LCP 和 TBT。现在，你可以再次把糟糕的 Lighthouse 分数归咎于 React，而不是 AI 了。

https://developer.chrome.com/blog/chrome-devtools-mcp?hl=zh-cn

Chrome for Developers

适用于 AI 代理的 Chrome 开发者工具 (MCP) | Blog | Chrome for Developers

新 Chrome 开发者工具 MCP 服务器的公开预览版，可将 Chrome 开发者工具的强大功能引入 AI 编码助理。

AI 文章

23:02 · 2025年9月30日 · 周二

#AI #文章直到现在，代理们都是“蒙着眼睛写代码”。他们虽然能快速生成代码，却看不到那个按钮是否真的可以点击，也无法了解你的 Lighthouse 评分到底是什么样的，更搞不清楚为什么你的 API 调用会失败。
这个新工具通过将 Chrome 开发者工具与基于 Puppeteer 的 MCP 服务器连接起来，解决了这一问题，任何人工智能都可以调用该服务器。这样一来，你的代理就有了“眼睛”，能够深入到沙盒化的 Chrome 配置文件中进行探索，并完成一些有趣的事情，例如：
1. 像开发者一样进行调试—通过 MCP 直接检查 DOM、查看控制台日志并审查网络请求，让您的代理能够真正排查运行时错误，而无需盲目猜测。
2. 自动化用户流程—通过模拟真实用户行为，点击按钮、填写表单、上传文件，并重现漏洞。
3. 运行性能审计—触发 Chrome 性能跟踪，并提取可操作的指标，例如 LCP 和 TBT。现在，你可以再次把糟糕的 Lighthouse 分数归咎于 React，而不是 AI 了。

https://developer.chrome.com/blog/chrome-devtools-mcp?hl=zh-cn

Chrome for Developers