Now vibe coding, so learning hammer FE ?
《CC-Connect:AI编程助手桥接工具》
标签:#AI编程工具 #即时通讯集成 #ClaudeCode #Cursor #GeminiCLI #Codex #飞书 #钉钉 #Slack #Telegram #Discord #LINE #企业微信 #远程开发
总结:
CC-Connect是一款开源桥接工具,它把本地AI编程助手(如Claude Code、Cursor、Gemini CLI、Codex)和主流即时通讯平台连接起来。开发者无需公网IP,就能在手机或任何设备上随时与AI助手对话,实现远程协作编程。
文章要点:
- **打破终端限制**:把Claude Code、Cursor等本地AI编程工具"搬"到飞书、钉钉、Slack、Telegram、Discord、LINE和企业微信里,随时随地都能聊代码
- **零公网IP方案**:不需要折腾内网穿透或买服务器,本地跑起来就能让远程设备连上你的AI开发助手
- **多平台全覆盖**:支持7大主流通讯平台,从国内办公的飞书钉钉到海外常用的Slack、Telegram都照顾到了
- **多模型兼容**:不只是 Claude,Cursor、Gemini CLI、Codex 这些热门AI编程工具统统能接入
- **开发场景友好**:特别适合需要移动办公、团队协作或者不想一直盯着终端窗口的开发者
文章URL:
https://github.com/chenhg5/cc-connect
标签:#AI编程工具 #即时通讯集成 #ClaudeCode #Cursor #GeminiCLI #Codex #飞书 #钉钉 #Slack #Telegram #Discord #LINE #企业微信 #远程开发
总结:
CC-Connect是一款开源桥接工具,它把本地AI编程助手(如Claude Code、Cursor、Gemini CLI、Codex)和主流即时通讯平台连接起来。开发者无需公网IP,就能在手机或任何设备上随时与AI助手对话,实现远程协作编程。
文章要点:
- **打破终端限制**:把Claude Code、Cursor等本地AI编程工具"搬"到飞书、钉钉、Slack、Telegram、Discord、LINE和企业微信里,随时随地都能聊代码
- **零公网IP方案**:不需要折腾内网穿透或买服务器,本地跑起来就能让远程设备连上你的AI开发助手
- **多平台全覆盖**:支持7大主流通讯平台,从国内办公的飞书钉钉到海外常用的Slack、Telegram都照顾到了
- **多模型兼容**:不只是 Claude,Cursor、Gemini CLI、Codex 这些热门AI编程工具统统能接入
- **开发场景友好**:特别适合需要移动办公、团队协作或者不想一直盯着终端窗口的开发者
文章URL:
https://github.com/chenhg5/cc-connect
《Agent Harness 的解剖学:将 LLM 转化为工作引擎的系统工程》
标签:#AI_Agent #LLM #LangChain #Harness_Engineering #Context_Management #Tool_Orchestration
总结:Agent Harness 是包裹在大模型之外的全套"脚手架"——包括系统提示词、工具调用、文件系统、沙盒环境、记忆管理和编排逻辑等。它把只能输入输出文本的"裸模型",改造成能持久化状态、执行代码、自主规划并长期协作的合格智能体。文章从模型能力边界出发,逆向推导出每个 Harness 组件存在的必然性,并指出 Harness 工程与模型训练正在协同进化,优化 Harness 本身就能让同一模型在基准测试上从 Top 30 跃升至 Top 5。
文章要点:
- Agent = Model + Harness:如果你不是模型本身,那你就是 Harness。Harness 是除模型权重外的一切代码、配置与执行逻辑,负责把模型的"智商"转化为"产能"
- 模型天生会"健忘":裸模型只能处理上下文窗口内的信息,无法跨会话记住状态、执行代码或获取实时知识,这些"超能力"全靠 Harness 赋予
- 文件系统是最底层的基础设施:给 Agent 一个工作目录,它就能读写数据、卸载超长上下文、还能让多个 Agent 像同事一样通过共享文件协作
- Bash + 代码执行是万能瑞士军刀:与其为每个场景预写工具,不如直接给 Agent 一个终端,让它现场写代码、装依赖、自己造工具解决问题
- 沙盒让 Agent 安全地"动手":在隔离环境里跑代码、测效果、看日志,既防手滑删库,又能按需扩容、用完即焚
- 记忆靠"上下文注入"实现:通过 AGENTS.md 等记忆文件标准,把历史经验塞进新会话;再配合网络搜索和 MCP 工具,突破训练数据的时间 cutoff
- 上下文腐烂是隐形杀手:随着对话变长,模型性能会断崖下跌。Harness 通过 Compaction(智能摘要)、Tool 输出卸载和 Skills 渐进式加载来保护宝贵的上下文空间
- 长程任务需要"接力跑":Ralph Loop 机制让 Agent 在上下文耗尽时,从文件系统读取进度、换一块"干净"上下文继续干;配合 git 记录和自验证循环,实现跨会话的复杂项目开发
- Harness 与模型在"共同进化":Claude Code、Codex 等产品会把 Harness 逻辑也放进后训练环节,但有趣的是——换一套更优 Harness,同一模型排名能从 30 名外冲进前 5
- 未来 Harness 会"瘦身"但不会消失:随着模型原生规划、验证能力变强,部分 Harness 功能会被模型吸收;但就像提示工程至今仍有价值,Harness 工程作为"围绕模型智能设计系统"的学科,仍将持续发光
文章URL:https://www.langchain.com/blog/the-anatomy-of-an-agent-harness
标签:#AI_Agent #LLM #LangChain #Harness_Engineering #Context_Management #Tool_Orchestration
总结:Agent Harness 是包裹在大模型之外的全套"脚手架"——包括系统提示词、工具调用、文件系统、沙盒环境、记忆管理和编排逻辑等。它把只能输入输出文本的"裸模型",改造成能持久化状态、执行代码、自主规划并长期协作的合格智能体。文章从模型能力边界出发,逆向推导出每个 Harness 组件存在的必然性,并指出 Harness 工程与模型训练正在协同进化,优化 Harness 本身就能让同一模型在基准测试上从 Top 30 跃升至 Top 5。
文章要点:
- Agent = Model + Harness:如果你不是模型本身,那你就是 Harness。Harness 是除模型权重外的一切代码、配置与执行逻辑,负责把模型的"智商"转化为"产能"
- 模型天生会"健忘":裸模型只能处理上下文窗口内的信息,无法跨会话记住状态、执行代码或获取实时知识,这些"超能力"全靠 Harness 赋予
- 文件系统是最底层的基础设施:给 Agent 一个工作目录,它就能读写数据、卸载超长上下文、还能让多个 Agent 像同事一样通过共享文件协作
- Bash + 代码执行是万能瑞士军刀:与其为每个场景预写工具,不如直接给 Agent 一个终端,让它现场写代码、装依赖、自己造工具解决问题
- 沙盒让 Agent 安全地"动手":在隔离环境里跑代码、测效果、看日志,既防手滑删库,又能按需扩容、用完即焚
- 记忆靠"上下文注入"实现:通过 AGENTS.md 等记忆文件标准,把历史经验塞进新会话;再配合网络搜索和 MCP 工具,突破训练数据的时间 cutoff
- 上下文腐烂是隐形杀手:随着对话变长,模型性能会断崖下跌。Harness 通过 Compaction(智能摘要)、Tool 输出卸载和 Skills 渐进式加载来保护宝贵的上下文空间
- 长程任务需要"接力跑":Ralph Loop 机制让 Agent 在上下文耗尽时,从文件系统读取进度、换一块"干净"上下文继续干;配合 git 记录和自验证循环,实现跨会话的复杂项目开发
- Harness 与模型在"共同进化":Claude Code、Codex 等产品会把 Harness 逻辑也放进后训练环节,但有趣的是——换一套更优 Harness,同一模型排名能从 30 名外冲进前 5
- 未来 Harness 会"瘦身"但不会消失:随着模型原生规划、验证能力变强,部分 Harness 功能会被模型吸收;但就像提示工程至今仍有价值,Harness 工程作为"围绕模型智能设计系统"的学科,仍将持续发光
文章URL:https://www.langchain.com/blog/the-anatomy-of-an-agent-harness
《OpenWolf:Claude Code 的开源"第二大脑"》
标签:#AI辅助编程 #Claude_Code #Token优化 #开发工具
总结:OpenWolf 是一款为 Claude Code CLI 设计的开源中间件,通过 6 个无感知的生命周期钩子脚本,为 AI 助手提供项目文件索引、学习记忆和 Token 追踪能力。实测在 20 个项目、132+ 会话中平均减少 65.8% 的 Token 消耗,最高可达 80%,同时拦截 71% 的重复文件读取,让 Claude Code 从"盲目工作"变成"有记忆地智能工作"。
文章要点:
- 解决 Claude Code 的"盲目"痛点:Claude 在读取文件前不知道文件内容,会重复读取同一文件、扫描整个目录找函数,导致 Token 消耗过快
- 6 个钩子脚本实现无感知增强:基于 SessionStart、PreToolUse、PostToolUse、Stop 三个生命周期事件,自动执行文件索引、重复读取拦截、偏好记忆和 Token 估算,无需改变任何工作习惯
- 核心文件系统构建"第二大脑":
- 显著的 Token 节省效果:大型项目实测从 250 万 Token 降至 42.5 万(节省约 80%),20 个项目平均节省 65.8%,拦截 71% 的重复读取,累计节省超 200 万 Token
- 纯本地运行零额外成本:所有钩子均为纯 Node.js 文件 I/O,无网络请求、无外部 API 调用,仅依赖 Node.js 20+ 和 Claude Code CLI
- 额外实用功能:内置 Design QC 自动截图供 Claude 评估 UI,Reframe 功能提供 12 个 UI 框架的迁移知识库,支持实时 Web 仪表盘查看统计数据
- 诚实的局限性说明:Claude Code 钩子功能较新偶有可靠性问题,Token 追踪基于字符比例估算(误差约 15%),cerebrum.md 依赖 Claude 遵守指令更新(合规率 85-90%)
文章URL:https://github.com/cytostack/openwolf
标签:#AI辅助编程 #Claude_Code #Token优化 #开发工具
总结:OpenWolf 是一款为 Claude Code CLI 设计的开源中间件,通过 6 个无感知的生命周期钩子脚本,为 AI 助手提供项目文件索引、学习记忆和 Token 追踪能力。实测在 20 个项目、132+ 会话中平均减少 65.8% 的 Token 消耗,最高可达 80%,同时拦截 71% 的重复文件读取,让 Claude Code 从"盲目工作"变成"有记忆地智能工作"。
文章要点:
- 解决 Claude Code 的"盲目"痛点:Claude 在读取文件前不知道文件内容,会重复读取同一文件、扫描整个目录找函数,导致 Token 消耗过快
- 6 个钩子脚本实现无感知增强:基于 SessionStart、PreToolUse、PostToolUse、Stop 三个生命周期事件,自动执行文件索引、重复读取拦截、偏好记忆和 Token 估算,无需改变任何工作习惯
- 核心文件系统构建"第二大脑":
anatomy.md 记录项目文件地图与 Token 估算,cerebrum.md 积累用户偏好与"不再重复"清单,buglog.json 归档历史 Bug 修复方案,token-ledger.json 追踪终身 Token 消耗 - 显著的 Token 节省效果:大型项目实测从 250 万 Token 降至 42.5 万(节省约 80%),20 个项目平均节省 65.8%,拦截 71% 的重复读取,累计节省超 200 万 Token
- 纯本地运行零额外成本:所有钩子均为纯 Node.js 文件 I/O,无网络请求、无外部 API 调用,仅依赖 Node.js 20+ 和 Claude Code CLI
- 额外实用功能:内置 Design QC 自动截图供 Claude 评估 UI,Reframe 功能提供 12 个 UI 框架的迁移知识库,支持实时 Web 仪表盘查看统计数据
- 诚实的局限性说明:Claude Code 钩子功能较新偶有可靠性问题,Token 追踪基于字符比例估算(误差约 15%),cerebrum.md 依赖 Claude 遵守指令更新(合规率 85-90%)
文章URL:https://github.com/cytostack/openwolf
《AI编码代理生产级工程技能集》
标签:#AI辅助编程 #开发工具 #AI_Agent #工程规范 #ClaudeCode #Cursor #代码审查 #测试驱动开发 #CI_CD
总结:
这是一个为AI编码代理(如Claude Code、Cursor、GitHub Copilot等)设计的生产级工程技能仓库,由Addy Osmani维护。它将资深工程师在真实项目中的工作流、质量门禁和最佳实践编码为20个结构化技能,覆盖从需求定义到上线发布的完整开发生命周期,让AI代理在每次编码时都能保持一致的专业水准,避免走"最短路径"而跳过测试、审查等关键环节。
文章要点:
- 六阶段开发流水线:从Define(定义需求)→ Plan(拆解任务)→ Build(增量编码)→ Verify(验证测试)→ Review(质量门禁)→ Ship(安全发布),像工厂流水线一样规范AI的每一步动作
- 7个斜杠命令即开即用:
- 20个实战技能全覆盖:从API设计、前端工程、TDD测试驱动,到性能优化、安全加固、Git工作流、CI/CD自动化,每个技能都自带步骤清单、验证标准和"反找借口"表格(比如AI想跳过测试时,会被技能里的反驳论据怼回去😄)
- 多工具无缝兼容:Claude Code一键插件安装,Cursor复制到rules目录,Gemini CLI、Windsurf、GitHub Copilot、Kiro等主流AI编程工具都能直接用,技能就是纯Markdown,通吃所有支持系统提示词的代理
- Google工程文化落地:融入了Hyrum定律、Beyonce规则、测试金字塔、Chesterton围栏等Google实战智慧,不是泛泛而谈的理论,而是嵌入到每一步工作流中的可执行标准
文章URL:https://github.com/addyosmani/agent-skills
标签:#AI辅助编程 #开发工具 #AI_Agent #工程规范 #ClaudeCode #Cursor #代码审查 #测试驱动开发 #CI_CD
总结:
这是一个为AI编码代理(如Claude Code、Cursor、GitHub Copilot等)设计的生产级工程技能仓库,由Addy Osmani维护。它将资深工程师在真实项目中的工作流、质量门禁和最佳实践编码为20个结构化技能,覆盖从需求定义到上线发布的完整开发生命周期,让AI代理在每次编码时都能保持一致的专业水准,避免走"最短路径"而跳过测试、审查等关键环节。
文章要点:
- 六阶段开发流水线:从Define(定义需求)→ Plan(拆解任务)→ Build(增量编码)→ Verify(验证测试)→ Review(质量门禁)→ Ship(安全发布),像工厂流水线一样规范AI的每一步动作
- 7个斜杠命令即开即用:
/spec写需求文档、/build增量开发、/test跑测试、/review代码审查……输入命令就能自动激活对应的技能组合,非常顺手- 20个实战技能全覆盖:从API设计、前端工程、TDD测试驱动,到性能优化、安全加固、Git工作流、CI/CD自动化,每个技能都自带步骤清单、验证标准和"反找借口"表格(比如AI想跳过测试时,会被技能里的反驳论据怼回去😄)
- 多工具无缝兼容:Claude Code一键插件安装,Cursor复制到rules目录,Gemini CLI、Windsurf、GitHub Copilot、Kiro等主流AI编程工具都能直接用,技能就是纯Markdown,通吃所有支持系统提示词的代理
- Google工程文化落地:融入了Hyrum定律、Beyonce规则、测试金字塔、Chesterton围栏等Google实战智慧,不是泛泛而谈的理论,而是嵌入到每一步工作流中的可执行标准
文章URL:https://github.com/addyosmani/agent-skills
《Vibe_Coding已死:Agent工程取而代之》
标签:#AI #Agent #软件工程 #VibeCoding #多Agent协作
总结:
本文作者Collin Wilkins指出,"Vibe Coding"(凭感觉编程)这一由Karpathy提出的概念已被其本人"杀死"——现在的开发者99%时间不是在写代码,而是在编排Agent。作者分享了自己工作方式的转变:从一年前80%代码手写,到现在主要分解问题、分配Agent并审核输出。文章强调,2026年2月的四大模型发布都将多Agent编排作为核心能力,真正的差距在于工作流而非工具。
文章要点:
- Vibe Coding的致命缺陷:它只优化了代码生成速度,却忽视了后续环节——SonarSource调查显示AI代码占提交量的42%,但96%的开发者不完全信任它,仅48%会在提交前验证,审查负担真实存在且大多数团队根本没做
- Agent工程的新范式:先规划和设计系统,定义边界和契约,再让Agent在约束内执行,像分布式系统工程一样处理Agent编排——同样的分解、组件间契约、可观测性
- 多Agent成为主流:Claude的Agent团队用2000次协调会话构建了10万行C编译器,Kimi K2.5单个任务可运行100个子Agent进行1500次工具调用
- 工作方式的彻底转变:作者现在每天的工作是分解问题、分配Agent、审核输出,"写代码"已不能描述他的日常工作
- AI是动力工具而非替代品:会用AI的工程师交付更快,但只会用AI的工程师交付垃圾,关键是知道何时该提示、何时该思考
- 瓶颈已转移:写代码不再是慢的部分,思考要构建什么、如何组合、什么会在规模下崩溃——这些才是耗时的地方
- 文档化决策:LLM不存储上下文,如果想让AI助手在现有代码库上快速移动,它需要加载已记录的决策
文章URL:
https://buttondown.com/collinwilkins/archive/vibe-coding-is-dead-heres-what-replaced-it/
标签:#AI #Agent #软件工程 #VibeCoding #多Agent协作
总结:
本文作者Collin Wilkins指出,"Vibe Coding"(凭感觉编程)这一由Karpathy提出的概念已被其本人"杀死"——现在的开发者99%时间不是在写代码,而是在编排Agent。作者分享了自己工作方式的转变:从一年前80%代码手写,到现在主要分解问题、分配Agent并审核输出。文章强调,2026年2月的四大模型发布都将多Agent编排作为核心能力,真正的差距在于工作流而非工具。
文章要点:
- Vibe Coding的致命缺陷:它只优化了代码生成速度,却忽视了后续环节——SonarSource调查显示AI代码占提交量的42%,但96%的开发者不完全信任它,仅48%会在提交前验证,审查负担真实存在且大多数团队根本没做
- Agent工程的新范式:先规划和设计系统,定义边界和契约,再让Agent在约束内执行,像分布式系统工程一样处理Agent编排——同样的分解、组件间契约、可观测性
- 多Agent成为主流:Claude的Agent团队用2000次协调会话构建了10万行C编译器,Kimi K2.5单个任务可运行100个子Agent进行1500次工具调用
- 工作方式的彻底转变:作者现在每天的工作是分解问题、分配Agent、审核输出,"写代码"已不能描述他的日常工作
- AI是动力工具而非替代品:会用AI的工程师交付更快,但只会用AI的工程师交付垃圾,关键是知道何时该提示、何时该思考
- 瓶颈已转移:写代码不再是慢的部分,思考要构建什么、如何组合、什么会在规模下崩溃——这些才是耗时的地方
- 文档化决策:LLM不存储上下文,如果想让AI助手在现有代码库上快速移动,它需要加载已记录的决策
文章URL:
https://buttondown.com/collinwilkins/archive/vibe-coding-is-dead-heres-what-replaced-it/
《编程 Agent 如何重塑工程、产品和设计》
标签:#AI #编程Agent #软件开发 #产品经理 #系统设计 #VibeCoding
总结:
编程 Agent 正在颠覆传统的 EPD(工程、产品、设计)协作模式。当代码生成变得轻而易举,团队的核心价值从"写代码"转向"评审代码"。PRD 不再是流程起点,而是与原型并行的意图说明文档。这场变革让通才价值飙升,也让角色边界变得模糊——你要么是能用 Agent 独立完成功能的建设者,要么是具备顶级系统思维的专业评审者。无论出身产品、设计还是工程,拥有跨领域认知和清晰心智模型的人,将在这个新时代占据绝对优势。
文章要点:
- **PRD 的角色正在蜕变**:传统的"PRD → 设计稿 → 代码"线性流程已终结,但描述产品意图的文档依然重要。未来的 PRD 可能是结构化的、带版本管理的 Prompt,与可运行的代码原型共同构成评审基础。
- **瓶颈从实现转向评审**:当任何人都能快速生成代码原型时,工程、产品和设计的核心价值转变为把关质量——评估架构合理性、用户价值与体验流畅度。评审能力成为新的稀缺资源。
- **通才迎来黄金时代**:能同时驾驭产品思维、设计直觉和工程实现的"多面手"比以往更有影响力,因为他们省去了跨部门沟通的成本,可以直接与 Agent 协作完成端到端的交付。
- **角色分化为建设者与评审者**:团队将呈现两极分化。建设者擅长用 Agent 快速落地想法;评审者则是各领域的系统思维专家,负责把关复杂项目的质量。中间地带的从业者面临最大挑战。
- **产品意识成为全员必修课**:无论是工程师还是设计师,都需要具备判断"该做什么"的能力,否则会产生大量需要他人评审的"垃圾原型",拖累团队效率。
- **AI 放大 PM 的能力差距**:优秀的产品经理能借助 Agent 快速验证洞见,而思考不清晰的 PM 会产生更多低质量原型,造成资源浪费并增加"半成品上线"的风险。
文章URL:
https://baoyu.io/translations/2026-03-11/coding-agents-reshaping-epd
标签:#AI #编程Agent #软件开发 #产品经理 #系统设计 #VibeCoding
总结:
编程 Agent 正在颠覆传统的 EPD(工程、产品、设计)协作模式。当代码生成变得轻而易举,团队的核心价值从"写代码"转向"评审代码"。PRD 不再是流程起点,而是与原型并行的意图说明文档。这场变革让通才价值飙升,也让角色边界变得模糊——你要么是能用 Agent 独立完成功能的建设者,要么是具备顶级系统思维的专业评审者。无论出身产品、设计还是工程,拥有跨领域认知和清晰心智模型的人,将在这个新时代占据绝对优势。
文章要点:
- **PRD 的角色正在蜕变**:传统的"PRD → 设计稿 → 代码"线性流程已终结,但描述产品意图的文档依然重要。未来的 PRD 可能是结构化的、带版本管理的 Prompt,与可运行的代码原型共同构成评审基础。
- **瓶颈从实现转向评审**:当任何人都能快速生成代码原型时,工程、产品和设计的核心价值转变为把关质量——评估架构合理性、用户价值与体验流畅度。评审能力成为新的稀缺资源。
- **通才迎来黄金时代**:能同时驾驭产品思维、设计直觉和工程实现的"多面手"比以往更有影响力,因为他们省去了跨部门沟通的成本,可以直接与 Agent 协作完成端到端的交付。
- **角色分化为建设者与评审者**:团队将呈现两极分化。建设者擅长用 Agent 快速落地想法;评审者则是各领域的系统思维专家,负责把关复杂项目的质量。中间地带的从业者面临最大挑战。
- **产品意识成为全员必修课**:无论是工程师还是设计师,都需要具备判断"该做什么"的能力,否则会产生大量需要他人评审的"垃圾原型",拖累团队效率。
- **AI 放大 PM 的能力差距**:优秀的产品经理能借助 Agent 快速验证洞见,而思考不清晰的 PM 会产生更多低质量原型,造成资源浪费并增加"半成品上线"的风险。
文章URL:
https://baoyu.io/translations/2026-03-11/coding-agents-reshaping-epd
《从写代码到管 Agent:斯坦福首门 AI 软件开发课的启示》
标签:#AI #Agent #软件工程 #斯坦福 #职业发展 #人机协作 #代码质量
总结
本文是对斯坦福讲师 Mihail Eric 访谈的解读,他是全美首门 AI 原生软件开发课程 CS146S 的负责人。文章分析了初级开发者面临的"三重风暴"(裁员潮、毕业生激增、AI 替代压力),提出 AI 时代工程师的核心竞争力已从写代码转向"管理 Agent"——即编排多个 AI Agent 完成复杂任务的能力。同时强调 Agent 友好的代码库需要充分的测试覆盖、一致的文档和清晰的设计模式,这些本质上也是对人友好的工程实践。文章还指出资深开发者往往因路径依赖抗拒 AI 工具,而初级工程师的"无知无畏"反而成为快速适应新范式的优势。
文章要点:
- **初级开发者的三重困境**:COVID 后企业裁员 20-30%、CS 毕业生十年翻倍、雇主倾向"少招人+AI"策略,叠加导致新人求职难度激增
- **Agent 编排是顶级技能**:能同时管理多个 Agent 的工程师属于顶尖 0.1%,但应从单个 Agent 开始逐步增加,避免盲目追求数量
- **上下文切换是核心挑战**:管理多 Agent 需要频繁切换注意力并记住各任务进度,这与管理人类团队的能力高度相似
- **Agent 友好代码库三要素**:充分的测试覆盖(作为显式合约)、README 与代码一致性、统一的设计模式,Agent 会在错误基础上快速复合错误
- **品味决定软件质量**:功能性软件与卓越软件的分界在于"最后一公里"的打磨,顶尖工程师在发现可能性时加速而非完成任务即停止
- **初级工程师的独特优势**:没有历史包袱,学习 AI 工具更快;"无知无畏"的特质使其敢于挑战行业难题,这是创业所需的完美品质
- **避免过度工程化陷阱**:AI 让构建变得太容易,可能导致造出精美但无人需要的产品,需先验证需求再动手开发
文章URL:https://baoyu.io/blog/2026-02-27/from-writing-code-to-managing-agents
标签:#AI #Agent #软件工程 #斯坦福 #职业发展 #人机协作 #代码质量
总结
本文是对斯坦福讲师 Mihail Eric 访谈的解读,他是全美首门 AI 原生软件开发课程 CS146S 的负责人。文章分析了初级开发者面临的"三重风暴"(裁员潮、毕业生激增、AI 替代压力),提出 AI 时代工程师的核心竞争力已从写代码转向"管理 Agent"——即编排多个 AI Agent 完成复杂任务的能力。同时强调 Agent 友好的代码库需要充分的测试覆盖、一致的文档和清晰的设计模式,这些本质上也是对人友好的工程实践。文章还指出资深开发者往往因路径依赖抗拒 AI 工具,而初级工程师的"无知无畏"反而成为快速适应新范式的优势。
文章要点:
- **初级开发者的三重困境**:COVID 后企业裁员 20-30%、CS 毕业生十年翻倍、雇主倾向"少招人+AI"策略,叠加导致新人求职难度激增
- **Agent 编排是顶级技能**:能同时管理多个 Agent 的工程师属于顶尖 0.1%,但应从单个 Agent 开始逐步增加,避免盲目追求数量
- **上下文切换是核心挑战**:管理多 Agent 需要频繁切换注意力并记住各任务进度,这与管理人类团队的能力高度相似
- **Agent 友好代码库三要素**:充分的测试覆盖(作为显式合约)、README 与代码一致性、统一的设计模式,Agent 会在错误基础上快速复合错误
- **品味决定软件质量**:功能性软件与卓越软件的分界在于"最后一公里"的打磨,顶尖工程师在发现可能性时加速而非完成任务即停止
- **初级工程师的独特优势**:没有历史包袱,学习 AI 工具更快;"无知无畏"的特质使其敢于挑战行业难题,这是创业所需的完美品质
- **避免过度工程化陷阱**:AI 让构建变得太容易,可能导致造出精美但无人需要的产品,需先验证需求再动手开发
文章URL:https://baoyu.io/blog/2026-02-27/from-writing-code-to-managing-agents
《Claude技能构建完整指南》
标签:#AI #Claude #MCP #Agent_Skills #Workflow_Automation #开发工具 #Anthropic
总结:Anthropic官方发布的Claude技能构建指南,系统介绍了如何通过SKILL.md文件创建可复用的AI工作流。技能采用渐进式披露架构(YAML前置元数据+Markdown指令+引用资源),可与MCP工具集成实现多步骤自动化。文档涵盖规划、测试、分发全流程,提供5种设计模式(顺序工作流、多MCP协调、迭代优化等),并给出量化评估指标(90%触发准确率、零API失败率),目标帮助开发者在15-30分钟内构建生产级AI技能。
文章要点:
- 技能定义:包含SKILL.md(必需)、scripts/、references/、assets/的文件夹结构,采用kebab-case命名规范,支持Claude.ai、Claude Code和API三端通用
- 渐进式披露设计:三级加载机制(YAML元数据→SKILL.md正文→链接资源),最小化token消耗同时保持专业性
- 三大应用场景:文档/资源创建(如前端设计)、工作流自动化(如项目管理)、MCP增强(如Sentry代码审查),后者将工具访问转化为可靠工作流
- 成功指标:技能应在90%相关查询中自动触发,单次工作流工具调用次数明确,零失败API调用,用户无需提示下一步操作
- 核心设计模式:顺序工作流编排、多MCP协调(跨Figma/Linear/Slack等)、迭代优化循环、上下文感知工具选择、领域特定智能(如合规检查)
- 测试策略:触发测试( obvious/paraphrased/negative cases)、功能测试、性能对比(有无技能时的token消耗和交互轮次差异)
- 分发方式:GitHub托管+Claude.ai设置上传,支持组织级部署和API程序化调用,定位为MCP的"知识层"(厨房类比:MCP是厨房设备,技能是食谱)
- 常见陷阱:描述字段过于模糊导致触发失败、包含XML标签的安全限制、README.md与SKILL.md混淆、指令过于冗长导致模型"懒惰"
https://resources.anthropic.com/hubfs/The-Complete-Guide-to-Building-Skill-for-Claude.pdf
标签:#AI #Claude #MCP #Agent_Skills #Workflow_Automation #开发工具 #Anthropic
总结:Anthropic官方发布的Claude技能构建指南,系统介绍了如何通过SKILL.md文件创建可复用的AI工作流。技能采用渐进式披露架构(YAML前置元数据+Markdown指令+引用资源),可与MCP工具集成实现多步骤自动化。文档涵盖规划、测试、分发全流程,提供5种设计模式(顺序工作流、多MCP协调、迭代优化等),并给出量化评估指标(90%触发准确率、零API失败率),目标帮助开发者在15-30分钟内构建生产级AI技能。
文章要点:
- 技能定义:包含SKILL.md(必需)、scripts/、references/、assets/的文件夹结构,采用kebab-case命名规范,支持Claude.ai、Claude Code和API三端通用
- 渐进式披露设计:三级加载机制(YAML元数据→SKILL.md正文→链接资源),最小化token消耗同时保持专业性
- 三大应用场景:文档/资源创建(如前端设计)、工作流自动化(如项目管理)、MCP增强(如Sentry代码审查),后者将工具访问转化为可靠工作流
- 成功指标:技能应在90%相关查询中自动触发,单次工作流工具调用次数明确,零失败API调用,用户无需提示下一步操作
- 核心设计模式:顺序工作流编排、多MCP协调(跨Figma/Linear/Slack等)、迭代优化循环、上下文感知工具选择、领域特定智能(如合规检查)
- 测试策略:触发测试( obvious/paraphrased/negative cases)、功能测试、性能对比(有无技能时的token消耗和交互轮次差异)
- 分发方式:GitHub托管+Claude.ai设置上传,支持组织级部署和API程序化调用,定位为MCP的"知识层"(厨房类比:MCP是厨房设备,技能是食谱)
- 常见陷阱:描述字段过于模糊导致触发失败、包含XML标签的安全限制、README.md与SKILL.md混淆、指令过于冗长导致模型"懒惰"
https://resources.anthropic.com/hubfs/The-Complete-Guide-to-Building-Skill-for-Claude.pdf
#AI 2025 年是 LLM 从“玩具”走向“工具”的转折年:推理模型+代码 Agent+异步任务+手机编程,构成了新的开发范式。中国模型崛起、Google 发力、OpenAI 失领先,格局已变。
https://simonwillison.net/2025/Dec/31/the-year-in-llms/
https://simonwillison.net/2025/Dec/31/the-year-in-llms/
#AI #文章 直到现在,代理们都是“蒙着眼睛写代码”。他们虽然能快速生成代码,却看不到那个按钮是否真的可以点击,也无法了解你的 Lighthouse 评分到底是什么样的,更搞不清楚为什么你的 API 调用会失败。
这个新工具通过将 Chrome 开发者工具与基于 Puppeteer 的 MCP 服务器连接起来,解决了这一问题,任何人工智能都可以调用该服务器。这样一来,你的代理就有了“眼睛”,能够深入到沙盒化的 Chrome 配置文件中进行探索,并完成一些有趣的事情,例如:
1. 像开发者一样进行调试—通过 MCP 直接检查 DOM、查看控制台日志并审查网络请求,让您的代理能够真正排查运行时错误,而无需盲目猜测。
2. 自动化用户流程—通过模拟真实用户行为,点击按钮、填写表单、上传文件,并重现漏洞。
3. 运行性能审计—触发 Chrome 性能跟踪,并提取可操作的指标,例如 LCP 和 TBT。现在,你可以再次把糟糕的 Lighthouse 分数归咎于 React,而不是 AI 了。
https://developer.chrome.com/blog/chrome-devtools-mcp?hl=zh-cn
这个新工具通过将 Chrome 开发者工具与基于 Puppeteer 的 MCP 服务器连接起来,解决了这一问题,任何人工智能都可以调用该服务器。这样一来,你的代理就有了“眼睛”,能够深入到沙盒化的 Chrome 配置文件中进行探索,并完成一些有趣的事情,例如:
1. 像开发者一样进行调试—通过 MCP 直接检查 DOM、查看控制台日志并审查网络请求,让您的代理能够真正排查运行时错误,而无需盲目猜测。
2. 自动化用户流程—通过模拟真实用户行为,点击按钮、填写表单、上传文件,并重现漏洞。
3. 运行性能审计—触发 Chrome 性能跟踪,并提取可操作的指标,例如 LCP 和 TBT。现在,你可以再次把糟糕的 Lighthouse 分数归咎于 React,而不是 AI 了。
https://developer.chrome.com/blog/chrome-devtools-mcp?hl=zh-cn
#AI #文章 直到现在,代理们都是“蒙着眼睛写代码”。他们虽然能快速生成代码,却看不到那个按钮是否真的可以点击,也无法了解你的 Lighthouse 评分到底是什么样的,更搞不清楚为什么你的 API 调用会失败。
这个新工具通过将 Chrome 开发者工具与基于 Puppeteer 的 MCP 服务器连接起来,解决了这一问题,任何人工智能都可以调用该服务器。这样一来,你的代理就有了“眼睛”,能够深入到沙盒化的 Chrome 配置文件中进行探索,并完成一些有趣的事情,例如:
1. 像开发者一样进行调试—通过 MCP 直接检查 DOM、查看控制台日志并审查网络请求,让您的代理能够真正排查运行时错误,而无需盲目猜测。
2. 自动化用户流程—通过模拟真实用户行为,点击按钮、填写表单、上传文件,并重现漏洞。
3. 运行性能审计—触发 Chrome 性能跟踪,并提取可操作的指标,例如 LCP 和 TBT。现在,你可以再次把糟糕的 Lighthouse 分数归咎于 React,而不是 AI 了。
https://developer.chrome.com/blog/chrome-devtools-mcp?hl=zh-cn
这个新工具通过将 Chrome 开发者工具与基于 Puppeteer 的 MCP 服务器连接起来,解决了这一问题,任何人工智能都可以调用该服务器。这样一来,你的代理就有了“眼睛”,能够深入到沙盒化的 Chrome 配置文件中进行探索,并完成一些有趣的事情,例如:
1. 像开发者一样进行调试—通过 MCP 直接检查 DOM、查看控制台日志并审查网络请求,让您的代理能够真正排查运行时错误,而无需盲目猜测。
2. 自动化用户流程—通过模拟真实用户行为,点击按钮、填写表单、上传文件,并重现漏洞。
3. 运行性能审计—触发 Chrome 性能跟踪,并提取可操作的指标,例如 LCP 和 TBT。现在,你可以再次把糟糕的 Lighthouse 分数归咎于 React,而不是 AI 了。
https://developer.chrome.com/blog/chrome-devtools-mcp?hl=zh-cn
#AI #文章
「 AI 辅助编码的残酷真相:它能帮你完成70%的工作,但最后30%令人非常沮丧 」
英文原文:「70%问题-AI 辅助编程的现状和代价」
AI可以帮助我们更快地迭代和实验,但只有当我们保持对项目代码的掌控和理解并把AI作为工具而不是替代良好软件实践时,我们才能构建更好的应用。
「 AI 辅助编码的残酷真相:它能帮你完成70%的工作,但最后30%令人非常沮丧 」
英文原文:「70%问题-AI 辅助编程的现状和代价」
AI可以帮助我们更快地迭代和实验,但只有当我们保持对项目代码的掌控和理解并把AI作为工具而不是替代良好软件实践时,我们才能构建更好的应用。