Now vibe coding, so learning hammer FE ?
《如何构建你自己的Agent_Harness:从单体框架到可组合Worker架构》

标签:#AI工程 #Agent架构 #系统设计 #开源框架 #Worker模型

总结:
iii创始人Mike_Piccolo提出了一种全新的Agent_Harness构建理念——将传统单体框架拆分为15个独立的可替换Worker,通过统一的iii.trigger()原语和WebSocket协议进行通信。这种架构让团队不再需要Fork或绕过现有框架,而是通过"安装/替换Worker"来精确组装符合自身需求的Agent运行时,实现从极简到企业级的平滑伸缩。

文章要点:
1. 传统框架的痛点:LangChain、LangGraph等将循环、工具、记忆、编排等打包成单体,团队要么全盘接受,要么Fork或Hack,导致长期运行后不得不重写整个Harness
2. iii的核心理念:将15个Harness职责(凭证解析、模型目录、预算追踪、审批门、 durable_turn_loop等)拆分为独立Worker,每个Worker通过iii.trigger()触发,可独立版本化、用任意语言编写、随时替换
3. 实际生产栈示例:包括turn_orchestrator(11状态FSM)、approval_gate(审批路由)、llm_budget(预算管控)、hook_fanout(钩子发布)、provider_anthropic/openai/kimi(模型提供商)等11个Worker,全部通过同一引擎总线通信
4. 替换的便利性:想换动态模型目录?写一个注册models::list的新Worker即可;想从Slack审批?写一个监听slash命令并调用approval::resolve的Worker;整个堆栈其他部分完全无感知
5. 架构优势:单体框架的"薄vs厚"之争在这里变成配置问题——极简Harness只需4个Worker,企业级Harness安装全部13个+自定义策略引擎,距离只是config.yaml的条目增减,而非重写
6. 可观测性统一:每个Worker自动注入OpenTelemetry追踪,通过iii.session.id等标签实现跨Worker的完整调用链可视化

URL:https://iii.dev/blog/how-to-build-your-own-agent-harness/ How to Build Your Own Agent Harness
《Markdown SVG 渲染器:AI 辅助开发的实用小工具》

标签:#前端 #工具 #Markdown #SVG #AI辅助编程 #SimonWillison #WebComponents

总结:

Simon Willison 分享了他用 Claude Opus 4.8 和 GPT-5.5 辅助开发的一个轻量级 Markdown 渲染工具,核心亮点是对 SVG 代码块的特殊处理——不仅能渲染出图像,还提供「渲染图 / 源代码」双标签切换。该工具支持直接粘贴 Markdown、加载远程文件或 GitHub Gist,并用 Fragment URL 记录状态以便分享。整个项目从需求到安全加固完全由 AI 驱动,是「提示驱动开发」的又一实例。

文章要点:

1. 这个工具的诞生源于一个具体场景:Simon 用 LLM CLI 让 Claude Opus 4.8 生成了五组不同思考深度(low 到 max)的「鹈鹕骑自行车」SVG,想找个优雅的方式展示这些 Markdown 日志
2. 核心定制点在于 SVG 围栏代码块(\\\`svg)——普通 Markdown 渲染器只会显示代码,而这个工具会把它变成可交互的 Web Component,默认展示渲染好的 SVG,点击可切换到源码查看
3. 支持三种内容输入方式:直接粘贴 Markdown、输入 CORS 兼容的远程 Markdown 文件 URL、或者加载 GitHub Gist 中的第一个文件
4. 用 URL Fragment(#)记录当前加载的文件地址,刷新页面或分享链接时能自动恢复状态,不用依赖后端
5. 安全方面,Simon 后续用 GPT-5.5(Codex xhigh 模式)专门审计并修复了 XSS 漏洞,体现了 AI 辅助开发中「生成 + 安全加固」的两步走思路
6. 整个工具属于 Simon 的「HTML Tools」系列——单文件 HTML+JS+CSS、无构建步骤、托管在 tools.simonwillison.net,目前已积累超过 150 个类似小工具

URL:https://simonwillison.net/2026/May/28/markdown-svg-renderer/
《AI 正在重演前端的"失落十年"吗?》

标签:#前端 #AI编程 #职业发展 #软件工程 # craftsmanship #Bauhaus

总结:
作者将 AI 对编程行业的冲击与前十年 JavaScript 框架对前端的"去技能化"(deskilling)进行类比。框架把浏览器当作编译目标,让通用开发者无需理解 HTML 语义、无障碍、性能等底层知识就能"搞定"前端;AI 编码则进一步将手工写代码的技能消解为"操作半熟练工人使用的技术"。文章认为这降低了从业者议价能力、牺牲了质量,但也承认这是效率提升和抽象层级升高的必然趋势。作者借用 Bauhaus 运动的启示——不是对抗工业化,而是让工匠与工厂协作、以用户为中心重新设计——呼吁在 AI 时代依然需要"懂材料"的人,同时指出商业成功与软件质量本就很少相关,真正的 craft 只会成为更小的切片。

文章要点:
1. "去技能化"正在从特定领域扩散到整个编程行业:框架让前端从专精技能变成通用技能,AI 让编程本身面临同样命运
2. 现代"全栈开发者"往往不是前后端都精通,而是能用框架两边都糊弄的通才,企业因此获得成本节省和人员灵活调配
3. AI 编码是"非确定性抽象"——不像编译器那样稳定,输入或模型的微小变化会导致截然不同的结果,更像是"不会学习的初级工程师"
4. LLM 是 Stack Overflow 复制粘贴的终极进化:让懂行的人更快,让不懂的人也能凑出"能跑"的东西,但抽象泄漏时依然需要有人深入理解并修复
5. 商业成功与软件质量几乎不相关,糟糕的网站对转化率影响有限,且"没人因为选了 React 而被解雇"
6. Bauhaus 运动的启示:不复古也不对抗工业化,而是让设计师回到工坊、与材料共事,最终产出兼顾批量生产和用户体验的设计
7. 前端 craft 不会消失,但会成为更小的切片;就像字体设计不再是全职工作、塑料垃圾泛滥但好工业设计依然存在
8. 快速迭代和 MVP 有其价值,但需要知道自己在验证什么;性能和无障碍等基础如果一开始没做对,后期很难补救
9. AI 只是工具箱里的又一件工具,但 hype 周期内我们会看到丑陋的代码、破碎的沟通和借 AI 之名裁员
10. 作者自己的框架 Mastro 倡导"从简单栈开始、后续再添加功能",反对先上重型框架再试图优化

URL:https://mastrojs.github.io/blog/2026-05-23-is-AI-causing-a-repeat-of-frontends-lost-decade/
《Chrome DevTools MCP v1 发布:为 AI 编码代理赋予浏览器调试超能力》

标签:#前端 #AI_Tools #Chrome_DevTools #MCP #Browser_Automation #Performance_Debugging

总结:
Chrome 团队正式发布 DevTools MCP v1,通过 Model Context Protocol 将 Chrome DevTools 的完整调试能力开放给 AI 编码代理。它让 Claude、Cursor、Copilot 等 AI 助手能够实时控制浏览器、抓取性能 trace、分析网络请求、检查控制台日志,甚至处理 1500 万行级别的性能数据,从而把"盲写代码"的 AI 变成能看、能测、能调优的闭环调试器。

文章要点:
1. 告别盲写时代:以前 AI 编码代理只能凭空推理代码,无法看到实际渲染效果。DevTools MCP 直接给 AI 装上"眼睛",让它能截图、查 DOM、读控制台、抓网络请求,基于真实浏览器状态做判断。
2. 40+ 工具全覆盖:从点击、填表、导航等自动化操作,到性能 trace 录制、Lighthouse 审计、内存堆快照、网络请求分析,几乎把 DevTools 面板的能力完整暴露给了 AI。
3. 性能分析是杀手锏:Paul Irish 演示了如何处理 1500 万行 JSON 的复杂性能 trace,MCP 服务器会解析并提炼出关键洞察,让 AI 帮你做原本需要资深性能专家才能完成的初步诊断。
4. 接入零门槛:支持 Claude Code、Cursor、Copilot、Gemini CLI、VS Code 等主流工具,一条 npx 命令即可启动,还能自动连接本地已运行的 Chrome 实例,无需额外配置。
5. 架构扎实可靠:底层基于 Chrome DevTools Protocol 和 Puppeteer,自动化操作自带智能等待,避免 flaky;同时支持 headless 和有头模式,适应不同场景需求。

URL:https://developer.chrome.com/blog/devtools-for-agents-v1 Streamline your AI coding workflow with Chrome DevTools for agents 1.0  |  Blog  |  Chrome for Developers
《AI重塑软件行业:从稀缺到泛滥的四大影响》

标签:#科技趋势 #AI变革 #软件行业 #SaaS #VibeCoding

总结:
AI让软件开发门槛骤降,软件正从"高壁垒高尊重"的稀缺品变成"人人可评判"的日用品。行业将经历薪资压缩、选择过剩导致用户忠诚度下降、中层产品消亡等剧变。未来赢家不再卖工具,而是直接卖服务结果;个人需成为领域专家或超级个体,才能在幂律分布中存活。

文章要点:
1. 软件行业正在"营销化":门槛降低+可见性提高=尊重崩塌。就像没人敢评判数学证明,但人人能对落地页配色指手画脚一样,VibeCoding让外行也能"看懂"软件,开发者薪资分布将从当前最紧的2.65倍向写作/设计行业的3.5倍扩散
2. 选择悖论杀死用户忠诚度:当项目管理工具有3个时你会选定一个,有300个时你会不断寻找"完美匹配"甚至自己Vibe一个。软件将从差异化卖点变成像水一样的基础资源
3. 中层SaaS即将灭绝:App Store里1%的App拿走95%收入,SaaS也将幂律化。中等规模公司(收费高但无网络效应)会被免费AI工具和大平台两头挤压,同时超长尾的"一次性个人工具"将爆发式增长
4. 卖服务而非卖产品才是未来:企业每花1美元买软件,花6美元买服务。AI时代的机会是用软件成本做服务生意——不是卖更好的记账软件,而是直接帮你把账做完。专家可以服务200个客户,AI处理琐事,人只做判断

URL:
https://www.terezatizkova.com/writing/software-abundance Software is becoming marketing
《cc-connect:本地AI编程助手连接消息平台桥梁》

标签:#开发工具 #AI编程助手 #ClaudeCode #CursorAgent #GeminiCLI #Codex #Telegram #飞书 #钉钉 #Slack #Discord #WeChatWork #LINE #QQ #Weibo

总结:
cc-connect 是一个开源的本地AI编程代理桥接工具,让你可以在飞书、钉钉、Telegram、Slack、Discord、企业微信、LINE、QQ、微博甚至个人微信等11个平台上,随时随地"聊天式"操控 Claude Code、Cursor、Gemini CLI、Codex 等10+种AI编程助手。无需公网IP,手机发消息就能让AI写代码、改Bug、做数据分析,真正实现" anywhere, anytime "的AI开发体验。

文章要点:
• 超全平台覆盖:支持飞书、钉钉、Telegram、Slack、Discord、企业微信、LINE、QQ、微博、个人微信等11个主流聊天平台,大部分平台无需公网IP即可直连,手机/平板随时操控
• 10+AI助手全家桶:完美桥接 Claude Code、Codex、Cursor Agent、Gemini CLI、Kimi CLI、Qoder CLI、OpenCode、iFlow CLI、Pi、Devin 等,还支持 ACP 协议兼容的任何新代理
• 聊天里掌控一切:通过 /model 切换模型、/mode 调整权限模式、/dir 切换工作目录、/new 管理会话、/cron 设置定时任务,所有操作都在聊天窗口完成
• 多Agent协同作战:支持在一个群聊里绑定多个AI机器人,让Claude和Gemini互相配合、接力完成任务,实现"AI团队"协作
• 多模态与记忆:支持语音消息(STT/TTS)、图片截图、文件收发;Agent记忆持久化,/memory 指令随时读写,避免重复交代背景
• Web管理后台:内置完整的Web Admin UI,支持项目CRUD、会话监控、定时任务编辑、Provider管理,5种语言界面,零配置上手
• 安全隔离:支持 Linux/macOS 下的 OS-User 隔离运行,不同项目可用不同Unix用户启动Agent,配合 cc-connect doctor 做安全审计
• 生命周期钩子:支持7种事件类型(消息收发、会话启停、定时触发、权限请求、错误)触发Shell命令或HTTP Webhook,方便集成CI/CD

URL:https://github.com/chenhg5/cc-connect GitHub - chenhg5/cc-connect: Bridge local AI coding agents (Claude Code, Cursor, Gemini CLI, Codex) to messaging platforms (Feishu/Lark…
《Agent Harness 的解剖学:将 LLM 转化为工作引擎的系统工程》

标签:#AI_Agent #LLM #LangChain #Harness_Engineering #Context_Management #Tool_Orchestration

总结:Agent Harness 是包裹在大模型之外的全套"脚手架"——包括系统提示词、工具调用、文件系统、沙盒环境、记忆管理和编排逻辑等。它把只能输入输出文本的"裸模型",改造成能持久化状态、执行代码、自主规划并长期协作的合格智能体。文章从模型能力边界出发,逆向推导出每个 Harness 组件存在的必然性,并指出 Harness 工程与模型训练正在协同进化,优化 Harness 本身就能让同一模型在基准测试上从 Top 30 跃升至 Top 5。

文章要点:
- Agent = Model + Harness:如果你不是模型本身,那你就是 Harness。Harness 是除模型权重外的一切代码、配置与执行逻辑,负责把模型的"智商"转化为"产能"
- 模型天生会"健忘":裸模型只能处理上下文窗口内的信息,无法跨会话记住状态、执行代码或获取实时知识,这些"超能力"全靠 Harness 赋予
- 文件系统是最底层的基础设施:给 Agent 一个工作目录,它就能读写数据、卸载超长上下文、还能让多个 Agent 像同事一样通过共享文件协作
- Bash + 代码执行是万能瑞士军刀:与其为每个场景预写工具,不如直接给 Agent 一个终端,让它现场写代码、装依赖、自己造工具解决问题
- 沙盒让 Agent 安全地"动手":在隔离环境里跑代码、测效果、看日志,既防手滑删库,又能按需扩容、用完即焚
- 记忆靠"上下文注入"实现:通过 AGENTS.md 等记忆文件标准,把历史经验塞进新会话;再配合网络搜索和 MCP 工具,突破训练数据的时间 cutoff
- 上下文腐烂是隐形杀手:随着对话变长,模型性能会断崖下跌。Harness 通过 Compaction(智能摘要)、Tool 输出卸载和 Skills 渐进式加载来保护宝贵的上下文空间
- 长程任务需要"接力跑":Ralph Loop 机制让 Agent 在上下文耗尽时,从文件系统读取进度、换一块"干净"上下文继续干;配合 git 记录和自验证循环,实现跨会话的复杂项目开发
- Harness 与模型在"共同进化":Claude Code、Codex 等产品会把 Harness 逻辑也放进后训练环节,但有趣的是——换一套更优 Harness,同一模型排名能从 30 名外冲进前 5
- 未来 Harness 会"瘦身"但不会消失:随着模型原生规划、验证能力变强,部分 Harness 功能会被模型吸收;但就像提示工程至今仍有价值,Harness 工程作为"围绕模型智能设计系统"的学科,仍将持续发光

文章URL:https://www.langchain.com/blog/the-anatomy-of-an-agent-harness
《Mirage:AI Agent的统一虚拟文件系统》

标签:#AI_Tools #AI_Agent #文件系统 #Python #TypeScript #SDK #S3 #Slack #GitHub #Redis #缓存 #OpenAI #Vercel_AI_SDK #LangChain

总结:
Mirage 是一个专为 AI Agent 设计的统一虚拟文件系统,它将 S3、Google Drive、Slack、Gmail、Redis 等数十种后端服务挂载到同一棵文件树下。Agent 只需用熟悉的 Unix/bash 工具(如 grep、cat、cp)就能跨服务读写数据,无需学习 N 个 SDK 或 MCP。支持 Python/TypeScript SDK 和 CLI,可嵌入 FastAPI、Express 等应用,并内置双层缓存(索引缓存 + 文件缓存)减少网络开销,兼容 OpenAI Agents SDK、Vercel AI SDK、LangChain 等主流框架。

文章要点:
- 统一挂载,万物皆文件:把 S3、GDrive、Slack、GitHub、MongoDB、Redis 等后端并排挂载到同一个根目录下,Agent 看到的始终只有一棵树
- 零学习成本:任何懂 bash 的 LLM 都能直接上手,用 grepcatcpwc 这些经典命令跨服务操作,不用记新 API
- 双层缓存省流量:自带索引缓存(目录列表)和文件缓存(对象字节),默认用内存,也可切 Redis 共享给多进程/多机器
- 多语言 SDK + CLI:提供 Python 和 TypeScript(Node / Browser / Core)SDK,以及轻量 CLI,可嵌入你的 FastAPI、Express 或浏览器应用
- 主流框架即插即用:已适配 OpenAI Agents SDK、Vercel AI SDK、LangChain、Pydantic AI、CAMEL、OpenHands 等
- 工作空间可移植:支持克隆、快照、版本化管理,Agent 运行环境能在机器间迁移而不必重新配置

文章URL:https://github.com/strukto-ai/mirage GitHub - strukto-ai/mirage: A Unified Virtual Filesystem For AI Agents
《Pixelle-Video:AI全自动短视频引擎》

标签:#AI工具 #视频生成 #ComfyUI #TTS #开源项目 #Streamlit #Python

总结:
Pixelle-Video 是一款开源的 AI 全自动短视频生成工具,通过 Streamlit 提供可视化 Web 界面,支持从文案创作、AI 配图、语音合成到视频拼接的完整工作流,用户只需输入主题即可一键生成带 BGM 的短视频,且支持完全本地免费运行。

文章要点:
- **全流程自动化**:输入主题后,AI 自动完成脚本撰写、分镜规划、图片生成、语音配音和视频合成,几分钟内输出成品短视频
- **灵活的内容输入**:支持"AI 生成内容"模式(输入主题自动写稿)和"固定文案"模式(直接粘贴现成文案),满足不同创作需求
- **丰富的语音与视觉配置**:TTS 支持 Edge-TTS、Index-TTS 等多种工作流,还可上传参考音频进行声音克隆;图像生成支持本地 ComfyUI 和云端 RunningHub,风格可通过提示词前缀自由定制
- **可扩展的模板系统**:提供静态、图片、视频三类 HTML 模板,支持竖屏/横屏/方形多种尺寸,懂前端的同学还能自定义模板
- **零成本运行方案**:本地部署 Ollama + ComfyUI 可实现完全免费使用;也支持通义千问、GPT、DeepSeek 等云端 API 作为备选
- **开箱即用的部署方式**:Windows 用户有免配置一键整合包,macOS/Linux 用户通过 uv 即可快速启动,门槛非常友好

文章URL:https://github.com/AIDC-AI/Pixelle-Video GitHub - AIDC-AI/Pixelle-Video: 🚀 AI 全自动短视频引擎 | AI Fully Automated Short Video Engine
《OpenWolf:Claude Code 的开源"第二大脑"》

标签:#AI辅助编程 #Claude_Code #Token优化 #开发工具

总结:OpenWolf 是一款为 Claude Code CLI 设计的开源中间件,通过 6 个无感知的生命周期钩子脚本,为 AI 助手提供项目文件索引、学习记忆和 Token 追踪能力。实测在 20 个项目、132+ 会话中平均减少 65.8% 的 Token 消耗,最高可达 80%,同时拦截 71% 的重复文件读取,让 Claude Code 从"盲目工作"变成"有记忆地智能工作"。

文章要点:
- 解决 Claude Code 的"盲目"痛点:Claude 在读取文件前不知道文件内容,会重复读取同一文件、扫描整个目录找函数,导致 Token 消耗过快
- 6 个钩子脚本实现无感知增强:基于 SessionStart、PreToolUse、PostToolUse、Stop 三个生命周期事件,自动执行文件索引、重复读取拦截、偏好记忆和 Token 估算,无需改变任何工作习惯
- 核心文件系统构建"第二大脑":anatomy.md 记录项目文件地图与 Token 估算,cerebrum.md 积累用户偏好与"不再重复"清单,buglog.json 归档历史 Bug 修复方案,token-ledger.json 追踪终身 Token 消耗
- 显著的 Token 节省效果:大型项目实测从 250 万 Token 降至 42.5 万(节省约 80%),20 个项目平均节省 65.8%,拦截 71% 的重复读取,累计节省超 200 万 Token
- 纯本地运行零额外成本:所有钩子均为纯 Node.js 文件 I/O,无网络请求、无外部 API 调用,仅依赖 Node.js 20+ 和 Claude Code CLI
- 额外实用功能:内置 Design QC 自动截图供 Claude 评估 UI,Reframe 功能提供 12 个 UI 框架的迁移知识库,支持实时 Web 仪表盘查看统计数据
- 诚实的局限性说明:Claude Code 钩子功能较新偶有可靠性问题,Token 追踪基于字符比例估算(误差约 15%),cerebrum.md 依赖 Claude 遵守指令更新(合规率 85-90%)

文章URL:https://github.com/cytostack/openwolf GitHub - cytostack/openwolf: Sharper context. Fewer tokens. Open-source middleware for Claude Code.
《MCP已死,CLI万岁》

标签:#AI工具 #开发工具 #MCP #CLI #LLM工具链 #Anthropic #AI代理

总结:
作者认为Anthropic推出的MCP协议正走向消亡,主张LLM应直接使用CLI工具而非专用协议。CLI具备可组合性、调试友好、认证成熟、无额外进程等优势,而MCP存在初始化不稳定、重复认证、权限粒度粗等实际痛点。最好的工具应同时服务人类与机器,开发者应优先打磨API和CLI。

文章要点:
- LLM天生就会用命令行:它们在海量man page、Stack Overflow和shell脚本中训练过,给Claude一个CLI和文档,它就能直接上手,根本不需要新协议
- 调试体验天差地别:CLI出问题你可以亲自跑一遍同样的命令,看到和AI完全一致的输入输出;MCP出错却要钻JSON传输日志,排查像考古
- 管道和组合才是生产力:CLI能通过`jq`、`grep`、重定向灵活处理数据;MCP面对大型Terraform计划只能全塞进上下文窗口,或额外写过滤逻辑,费力不讨好
- 认证体系早已成熟:`aws`、`gh`、`kubectl`都有经过实战检验的SSO和凭证管理,AI和人类共用同一套流程,坏了就按老办法修,不用学MCP专属排错
- 没有后台进程更省心:MCP服务器是常驻进程,会挂起、会掉线、需要状态管理;CLI只是磁盘上的二进制文件,随用随走,干净利落
- 日常使用的真实摩擦:MCP初始化经常抽风要重启,多工具反复认证让人崩溃,权限控制只有白名单名字做不到只读或参数级限制;CLI完全没有这些烦恼
- MCP并非毫无价值:只有当某个工具确实没有CLI时,MCP才是合理选择,标准化接口在极少数场景也有意义
- 给工具开发者的建议:如果你公司在砸钱做MCP服务器却没有官方CLI,赶紧停下来——先把API和CLI做好,AI代理自己会搞定剩下的

文章URL:https://ejholmes.github.io/2026/02/28/mcp-is-dead-long-live-the-cli.html
《为AI智能体设计产品:从界面思维到智能体思维》

标签:#AI产品 #MCP #智能体交互设计 #产品架构 #API设计 #Salesforce #Ramp #Notion

总结:
本文由Ramp产品负责人Teddy Riker撰写,探讨了AI智能体时代产品设计的范式转变。作者指出,未来80%的软件交互将通过AI智能体完成,产品团队需要从"为用户设计界面"转向"为智能体设计能力"。文章以Ramp、Salesforce、Notion等案例,提出了三大核心设计原则:主动提供成功所需的上下文规范、建立基于工具调用的反馈循环、识别并填补智能体间的上下文缺口。

文章要点:

- **交互范式正在翻转**:传统模式是"用户→界面→数据库",而AI时代正在变成"用户→用户智能体→软件智能体→数据库"。界面不会消失,但80%的交互将发生在智能体之间,产品团队需要为"看不见的用户"重新设计。

- **Salesforce的激进转型**:这家27年的传统软件巨头推出"Headless 360"计划,将平台所有能力暴露为API、MCP工具或CLI命令,承认图形界面CRM的护城河正在被侵蚀,主动拥抱"无界面"未来。

- **教会智能体如何成功**:Notion的MCP设计是个正面教材——它在工具描述中明确要求智能体先读取Markdown规范再操作,确保格式准确。相比之下,Slack MCP让智能体"自己摸索"格式规则,结果用户反而要花更多时间修正。产品团队应该主动告诉调用方"你需要知道什么才能成功"。

- **用反馈循环驱动产品迭代**:Ramp通过三个机制解决智能体交互的可观测性难题:要求每次工具调用附带`rationale`参数解释意图、提供独立的反馈提交工具、在特定工具中预埋上下文种子。这些反馈比人类用户更具体、更一致,能直接转化为新功能需求。

- **填补上下文缺口是核心设计挑战**:在"用户智能体↔️软件智能体"的协作中,双方各自掌握对方没有的信息。优秀的设计不是让智能体去猜技术细节(如GL code),而是让它们交换语义上下文(如"这是客户晚餐还是团队建设"),由各自擅长的那一方完成最终决策。

- **敷衍智能体支持的产品会被淘汰**:仅仅发布一个MCP服务器、勾上"支持AI"的 checkbox 是不够的。客户最终会流向那些认真打磨智能体体验、真正理解"最后签支票的可能是AI"的产品。

文章URL:https://baoyu.io/blog/2026-04-24/teddy-riker-2047312986696454584 为 Agent 设计产品
《AI编码代理生产级工程技能集》

标签:#AI辅助编程 #开发工具 #AI_Agent #工程规范 #ClaudeCode #Cursor #代码审查 #测试驱动开发 #CI_CD

总结:
这是一个为AI编码代理(如Claude Code、Cursor、GitHub Copilot等)设计的生产级工程技能仓库,由Addy Osmani维护。它将资深工程师在真实项目中的工作流、质量门禁和最佳实践编码为20个结构化技能,覆盖从需求定义到上线发布的完整开发生命周期,让AI代理在每次编码时都能保持一致的专业水准,避免走"最短路径"而跳过测试、审查等关键环节。

文章要点:
- 六阶段开发流水线:从Define(定义需求)→ Plan(拆解任务)→ Build(增量编码)→ Verify(验证测试)→ Review(质量门禁)→ Ship(安全发布),像工厂流水线一样规范AI的每一步动作
- 7个斜杠命令即开即用:/spec写需求文档、/build增量开发、/test跑测试、/review代码审查……输入命令就能自动激活对应的技能组合,非常顺手
- 20个实战技能全覆盖:从API设计、前端工程、TDD测试驱动,到性能优化、安全加固、Git工作流、CI/CD自动化,每个技能都自带步骤清单、验证标准和"反找借口"表格(比如AI想跳过测试时,会被技能里的反驳论据怼回去😄
- 多工具无缝兼容:Claude Code一键插件安装,Cursor复制到rules目录,Gemini CLI、Windsurf、GitHub Copilot、Kiro等主流AI编程工具都能直接用,技能就是纯Markdown,通吃所有支持系统提示词的代理
- Google工程文化落地:融入了Hyrum定律、Beyonce规则、测试金字塔、Chesterton围栏等Google实战智慧,不是泛泛而谈的理论,而是嵌入到每一步工作流中的可执行标准

文章URL:https://github.com/addyosmani/agent-skills
《OpenAI Agents SDK:轻量级多智能体工作流框架》

标签:#AI #多智能体 #Python #OpenAI #MCP #智能体工作流 #LLM #实时语音 #沙箱环境

总结:
OpenAI Agents SDK 是一个轻量但功能强大的 Python 框架,用于构建多智能体工作流。它支持 OpenAI 的 Responses 和 Chat Completions API,同时兼容 100 多种其他 LLM,具有供应商无关性。框架围绕"智能体"这一核心概念展开,每个智能体都配备指令、工具、护栏和交接机制,让复杂任务可以像搭积木一样拆解协作。

文章要点:
- 智能体是核心乐高积木:每个智能体都自带"说明书"(指令)、"工具箱"(函数/MCP/托管工具)和"安全护栏"(输入输出校验),还能互相"交接"任务,像团队协作一样分工处理复杂流程
- 沙箱智能体让AI真正"动手干活":0.14.0 版本新增的 Sandbox Agent 能在容器环境里操作文件系统、运行命令、打补丁,适合需要长时间执行且要保留工作状态的"重体力"任务
- 人在回路,安全可控:内置了人类介入机制,在关键节点可以暂停流程等人来确认,避免AI"自作主张"搞出大新闻
- 全链路可观测:自带 Tracing 追踪系统,能可视化查看每个智能体的思考过程、工具调用耗时和 Token 消耗,方便调试和优化
- 不挑模型,兼容百家:虽然是 OpenAI 出品,但设计上保持中立,支持接入 100+ 种 LLM,包括通过 LiteLLM 等适配层接入国产模型
- 实时语音也能玩:支持用 gpt-realtime-1.5 构建语音智能体,把实时语音能力也纳入多智能体协作体系

文章URL:https://github.com/openai/openai-agents-python GitHub - openai/openai-agents-python: A lightweight, powerful framework for multi-agent workflows
《Claude架构图生成器:AI一键绘制专业系统架构图》

标签:#AI工具 #Claude_Skill #架构可视化 #开发效率 #系统架构图

总结:
这是一款专为Claude AI设计的Skill工具,让用户只需用自然语言描述系统架构,即可生成精美的暗色系专业架构图。输出为独立的HTML/SVG文件,无需任何设计技能或额外软件,适合快速迭代和团队协作分享。

文章要点:
- 零门槛使用:不需要设计基础,用大白话描述系统组件和连接关系,Claude就能帮你画出专业级架构图
- 多种输入方式:可以让AI分析代码库自动生成描述,也可以自己手写组件列表,还能直接问Claude要典型架构模板
- 精美视觉风格:采用暗色主题(Slate-950背景),组件按类型着色(前端青色、后端翠绿、数据库紫色、云服务琥珀色),自带网格底纹和JetBrains Mono字体
- 独立文件输出:生成单个HTML文件,内嵌CSS和SVG,任何浏览器都能直接打开,方便分享、打印或嵌入文档
- 实时迭代优化:生成后可以继续在对话中要求修改,比如"加上Redis缓存"或"调整布局",Claude会即时更新图表
- 多平台安装:支持Claude.ai网页版(Pro/Max/Team/Enterprise)、Claude Code CLI、以及Projects知识库三种方式
- 丰富示例覆盖:内置Web应用(React+Node+PostgreSQL)、AWS无服务器(Lambda+API Gateway)、微服务(K8s+多语言服务)等典型场景模板

文章URL:https://github.com/Cocoon-AI/architecture-diagram-generator GitHub - Cocoon-AI/architecture-diagram-generator: Generate beautiful dark-themed system architecture diagrams as standalone HTML/SVG…
《Karpathy把私藏的知识管理方法开源了:让LLM帮你维护Wiki,自己只管提问》

标签:#AI #知识管理 #LLM_Knowledge_Base #Personal_Wiki #Obsidian #RAG #Agent

总结:

Andrej Karpathy 分享了他用 LLM 管理个人知识库的方法:将原始资料放入只读目录,由 LLM 自动生成和维护结构化的 Wiki,再通过 Obsidian 查看。这套"摄入-查询-检查"工作流让他在小规模数据下无需 RAG 也能高效检索,更重要的是体现了 AI 时代的新范式——分享想法而非代码,让每个人的 Agent 按需实现。这对知识工作者如何从"操纵代码"转向"操纵知识"具有启发意义。

文章要点:

- **三层架构设计超清晰**:原始资料放在 raw/ 目录保持只读,LLM 自动读取并编译成结构化的 Wiki 文档,最后用 Obsidian 当查看器来展示。整套系统就像"原料→加工厂→展示厅"一样分工明确!

- **四个核心操作好懂又实用**:Ingest(新资料进来时 LLM 自动更新相关页面)、Query(日常提问让 LLM 去 Wiki 里搜索综合回答)、Lint(定期检查知识库有没有矛盾或遗漏)、Extra Tools(比如 vibe coding 的小搜索引擎)。整个知识库会越用越丰富~

- **为什么不用 RAG?Karpathy 的回答很实在**:他的知识库大约 100 篇文章、40 万字,在这个量级下 LLM 自己维护的索引和摘要已经够用了,不需要复杂的向量检索。Wiki 本身就是一种"压缩过的知识表示"

- **从"分享代码"到"分享想法"**:他把这套方法写成"idea file"公开,认为在 Agent 时代,清晰的思路比具体代码更有价值。每个人把自己的 Agent 叫来,照着这个想法文件就能搭出适合自己的版本

- **工作重心正在悄悄转移**:Karpathy 说他最近的 token 消耗从"写代码"大幅转向"操纵知识"。这对咱们知识工作者也是个信号——让 LLM 当长期的知识管家,而不只是临时问答工具,效率会更高呢!

文章URL:https://mp.weixin.qq.com/s/EoGLi067d_3huZf-X0Q6Fg
《OpenHarness:开源智能体基础设施框架》

标签:#AI #Agent #智能体 #开源 #Python #工具调用

总结:
OpenHarness是港大数据智能实验室(HKUDS)推出的轻量级开源智能体基础设施框架,仅用Python实现,代码量比Claude Code轻44倍(1.1万行vs 51万行),提供完整的工具调用、技能加载、记忆管理和多智能体协调功能,让开发者快速构建安全可靠的AI Agent应用。

文章要点:
- 极简架构设计:相比Claude Code的51万行TypeScript代码,OpenHarness仅用1.1万行Python实现,去除了企业级复杂依赖如遥测和OAuth,专注于核心Harness架构
- 五大核心模块:包含Agent循环(支持流式工具调用、并行执行、成本追踪)、工具套件(43种工具覆盖文件/Shell/搜索/Web/MCP)、上下文记忆(CLAUDE.md自动注入、MEMORY.md持久化)、权限治理(多级权限模式、交互式审批)、Swarm多智能体协调(子智能体委派、任务管理)
- 生态兼容性:完全兼容anthropics/skills技能格式和claude-code/plugins插件生态,支持OpenClaw、nanobot、Cursor等CLI工具集成
- 开箱即用:一条命令oh即可启动,内置114个单元测试和6个E2E测试套件,提供稳定可靠的基础能力

文章URL:
https://github.com/HKUDS/OpenHarness GitHub - HKUDS/OpenHarness:
《Vibe_Coding已死:Agent工程取而代之》

标签:#AI #Agent #软件工程 #VibeCoding #多Agent协作

总结:

本文作者Collin Wilkins指出,"Vibe Coding"(凭感觉编程)这一由Karpathy提出的概念已被其本人"杀死"——现在的开发者99%时间不是在写代码,而是在编排Agent。作者分享了自己工作方式的转变:从一年前80%代码手写,到现在主要分解问题、分配Agent并审核输出。文章强调,2026年2月的四大模型发布都将多Agent编排作为核心能力,真正的差距在于工作流而非工具。

文章要点:

- Vibe Coding的致命缺陷:它只优化了代码生成速度,却忽视了后续环节——SonarSource调查显示AI代码占提交量的42%,但96%的开发者不完全信任它,仅48%会在提交前验证,审查负担真实存在且大多数团队根本没做
- Agent工程的新范式:先规划和设计系统,定义边界和契约,再让Agent在约束内执行,像分布式系统工程一样处理Agent编排——同样的分解、组件间契约、可观测性
- 多Agent成为主流:Claude的Agent团队用2000次协调会话构建了10万行C编译器,Kimi K2.5单个任务可运行100个子Agent进行1500次工具调用
- 工作方式的彻底转变:作者现在每天的工作是分解问题、分配Agent、审核输出,"写代码"已不能描述他的日常工作
- AI是动力工具而非替代品:会用AI的工程师交付更快,但只会用AI的工程师交付垃圾,关键是知道何时该提示、何时该思考
- 瓶颈已转移:写代码不再是慢的部分,思考要构建什么、如何组合、什么会在规模下崩溃——这些才是耗时的地方
- 文档化决策:LLM不存储上下文,如果想让AI助手在现有代码库上快速移动,它需要加载已记录的决策

文章URL:

https://buttondown.com/collinwilkins/archive/vibe-coding-is-dead-heres-what-replaced-it/ Vibe coding is dead. Here's what replaced it
《AI指数级增长时代的产品管理》

标签:#产品管理 #AI #ClaudeCode #敏捷开发 #原型优先

总结:

本文由Anthropic的Claude Code产品负责人撰写,探讨了AI模型指数级进步如何颠覆传统产品管理范式。作者指出,过去PM依赖"项目开始时确定技术边界"的假设已失效,因为模型能力在项目周期内可能跃升数十倍。新的工作流强调快速实验、原型优先、角色融合和持续迭代,PM的核心价值转向在不确定性中创造清晰度、推动团队大胆设想可能性,并加速产品交付。

文章要点:

- 传统假设被打破**:过去PM基于"技术能力在项目周期内相对稳定"制定长期路线图,但AI模型能力呈指数级增长(如Claude在16个月内任务处理能力提升41倍),项目初期的技术约束可能在开发中途消失
- **角色边界模糊化**:AI工具让设计师能写代码、工程师做产品决策、PM直接构建原型和评估,产品/设计/工程从线性流程变为高度重叠的协作模式
- **原型优先于文档**:用Claude Code等工具几小时就能做出可演示的原型,团队用Demo代替PRD进行内部验证,错误决策的成本大幅降低
-
"支线任务"文化**:鼓励成员在正式路线图外进行短期自主实验,Claude Code桌面版、AskUserQuestion等热门功能都源自这种探索
- **模型迭代即产品迭代**:每个新模型发布都应触发对已有功能的重新审视,作者建议每天主动测试"可能太难"的任务,当模型能完成时就是产品该升级的信号
- **简单至上原则**:避免为绕过模型限制而设计复杂方案,这些"巧妙"的workaround会在新模型发布后变成技术债务,Claude Code的系统提示词已随模型升级精简了20%

文章URL:

https://claude.com/blog/product-management-on-the-ai-exponential Product management on the AI exponential  | Claude
《AI发展太快跟不上?一张四象限图帮你做减法》

标签:#AI #学习策略 #知识管理 #四象限法则 #生产力工具 #FOMO

总结:

本文针对AI领域信息爆炸、FOMO(害怕错过)焦虑普遍的现状,提出了一套基于"离生产力距离"和"知识保鲜期"两个维度的四象限筛选框架。通过将AI新事物划分为"直接跳过""维持地图感""动手试试""深度投入"四个区域,帮助读者在有限时间内做出更明智的学习决策,避免沉没成本,聚焦真正产生复利的高价值技能。

文章要点:

- **两根轴定策略**:横轴是"离当前生产力的距离"(能否直接帮你干活),纵轴是"知识保鲜期"(学了能用多久),两轴交叉形成四个象限,帮你快速判断值不值得花时间
- **左下角直接跳过**:融资新闻、模型跑分排名、AI套壳产品等"远+短"的噪音,过早投入沉没成本最大,三个月后如果还重要再看也不迟
- **左上角维持地图感**:RAG、Chain-of-Thought、Scaling Laws等概念性知识,只需花15分钟读篇好文章了解大概,不用动手,目的是能听懂同事聊天、看懂产品介绍
- **右下角动手试试**:AI画图工具、浏览器智能体等"近+短"的工具,花几小时上手体验即可,但别花一周精通——MidJourney提示词工程在GPT-4o出来后一夜贬值就是典型教训
- **右上角深度投入**:软件工程、上下文工程、Claude Code等"近+长"的核心能力,值得认真对待,深度使用一个核心工具的复利远大于浅尝十个工具
- **象限会移动**:OpenClaw四个月从个人项目变成GitHub最热门开源项目就是例子,判断移动方向看三个信号——谁在用、背后谁在投入、形态是否收敛

文章URL:

https://baoyu.io/blog/ai-learning-priority-quadrant AI 发展太快跟不上?一张四象限图帮你做减法
 
 
Back to Top