Now vibe coding, so learning hammer FE ?
《永不浪费一个Token:AI推理流的可恢复性设计》

标签:#后端 #AI推理 #Cloudflare #DurableObject #流式恢复 #Token计费优化

总结:
本文探讨了AI Agent在推理过程中因进程崩溃或重新部署导致流式连接中断、已付费Token被重复计费的痛点。核心方案是在Agent与LLM提供商之间引入一个持久化缓冲区(Durable Object),将流式数据实时写入SQLite,使连接与Agent进程解耦。Agent重启后可通过游标恢复,避免重复调用和重复付费。该机制同时解决了浏览器断网重连和进程崩溃恢复两种场景,且即将集成到Cloudflare AI Gateway中,实现一键开启的持久化推理。

文章要点:
1. 隐藏的成本黑洞:Agent进程崩溃或重新部署时,正在进行的LLM流式请求会中断,已付费的生成Token全部丢失,恢复后必须重新调用并重新付费,且旗舰模型(如GPT-5.5)的重复成本是小模型的15倍。
2. 解耦连接与进程:将LLM提供商连接移出Agent进程,部署为独立的持久化缓冲区(Durable Object),在后台持续将流式数据写入SQLite。即使Agent进程被替换,缓冲区仍继续接收数据,Token不再浪费。
3. 一份日志,两种用途:持久化缓冲区存储的原始字节流既支持浏览器断网重连(追赶实时游标),也支持进程崩溃恢复(回放已存储的片段)。两者共用同一套SQLite日志机制,仅需判断生产者是否仍在运行。
4. 零自定义解析:存储原始字节而非解析后的SSE事件,恢复时通过各提供商的官方插件(如OpenAI、Anthropic)重新解析,避免维护多套格式解析器,且能自动适配格式变更。
5. 行业现状对比:OpenAI Responses API已原生支持后台模式恢复;Anthropic和Google Gemini均不支持服务端续流,只能重新提示并重复计费;Vercel的resumable-stream为应用层方案,无法承受部署替换。
6. 即将落地AI Gateway:Cloudflare AI Gateway正在集成该持久化恢复能力,未来只需在Agent基类中设置durableBuffer = true即可一键开启,实现跨提供商的Token零浪费。

URL:https://sunilpai.dev/posts/never-waste-a-token/ never waste a token
《Chrome DevTools MCP v1 发布:为 AI 编码代理赋予浏览器调试超能力》

标签:#前端 #AI_Tools #Chrome_DevTools #MCP #Browser_Automation #Performance_Debugging

总结:
Chrome 团队正式发布 DevTools MCP v1,通过 Model Context Protocol 将 Chrome DevTools 的完整调试能力开放给 AI 编码代理。它让 Claude、Cursor、Copilot 等 AI 助手能够实时控制浏览器、抓取性能 trace、分析网络请求、检查控制台日志,甚至处理 1500 万行级别的性能数据,从而把"盲写代码"的 AI 变成能看、能测、能调优的闭环调试器。

文章要点:
1. 告别盲写时代:以前 AI 编码代理只能凭空推理代码,无法看到实际渲染效果。DevTools MCP 直接给 AI 装上"眼睛",让它能截图、查 DOM、读控制台、抓网络请求,基于真实浏览器状态做判断。
2. 40+ 工具全覆盖:从点击、填表、导航等自动化操作,到性能 trace 录制、Lighthouse 审计、内存堆快照、网络请求分析,几乎把 DevTools 面板的能力完整暴露给了 AI。
3. 性能分析是杀手锏:Paul Irish 演示了如何处理 1500 万行 JSON 的复杂性能 trace,MCP 服务器会解析并提炼出关键洞察,让 AI 帮你做原本需要资深性能专家才能完成的初步诊断。
4. 接入零门槛:支持 Claude Code、Cursor、Copilot、Gemini CLI、VS Code 等主流工具,一条 npx 命令即可启动,还能自动连接本地已运行的 Chrome 实例,无需额外配置。
5. 架构扎实可靠:底层基于 Chrome DevTools Protocol 和 Puppeteer,自动化操作自带智能等待,避免 flaky;同时支持 headless 和有头模式,适应不同场景需求。

URL:https://developer.chrome.com/blog/devtools-for-agents-v1 Streamline your AI coding workflow with Chrome DevTools for agents 1.0  |  Blog  |  Chrome for Developers
《Agent Harness 的解剖学:将 LLM 转化为工作引擎的系统工程》

标签:#AI_Agent #LLM #LangChain #Harness_Engineering #Context_Management #Tool_Orchestration

总结:Agent Harness 是包裹在大模型之外的全套"脚手架"——包括系统提示词、工具调用、文件系统、沙盒环境、记忆管理和编排逻辑等。它把只能输入输出文本的"裸模型",改造成能持久化状态、执行代码、自主规划并长期协作的合格智能体。文章从模型能力边界出发,逆向推导出每个 Harness 组件存在的必然性,并指出 Harness 工程与模型训练正在协同进化,优化 Harness 本身就能让同一模型在基准测试上从 Top 30 跃升至 Top 5。

文章要点:
- Agent = Model + Harness:如果你不是模型本身,那你就是 Harness。Harness 是除模型权重外的一切代码、配置与执行逻辑,负责把模型的"智商"转化为"产能"
- 模型天生会"健忘":裸模型只能处理上下文窗口内的信息,无法跨会话记住状态、执行代码或获取实时知识,这些"超能力"全靠 Harness 赋予
- 文件系统是最底层的基础设施:给 Agent 一个工作目录,它就能读写数据、卸载超长上下文、还能让多个 Agent 像同事一样通过共享文件协作
- Bash + 代码执行是万能瑞士军刀:与其为每个场景预写工具,不如直接给 Agent 一个终端,让它现场写代码、装依赖、自己造工具解决问题
- 沙盒让 Agent 安全地"动手":在隔离环境里跑代码、测效果、看日志,既防手滑删库,又能按需扩容、用完即焚
- 记忆靠"上下文注入"实现:通过 AGENTS.md 等记忆文件标准,把历史经验塞进新会话;再配合网络搜索和 MCP 工具,突破训练数据的时间 cutoff
- 上下文腐烂是隐形杀手:随着对话变长,模型性能会断崖下跌。Harness 通过 Compaction(智能摘要)、Tool 输出卸载和 Skills 渐进式加载来保护宝贵的上下文空间
- 长程任务需要"接力跑":Ralph Loop 机制让 Agent 在上下文耗尽时,从文件系统读取进度、换一块"干净"上下文继续干;配合 git 记录和自验证循环,实现跨会话的复杂项目开发
- Harness 与模型在"共同进化":Claude Code、Codex 等产品会把 Harness 逻辑也放进后训练环节,但有趣的是——换一套更优 Harness,同一模型排名能从 30 名外冲进前 5
- 未来 Harness 会"瘦身"但不会消失:随着模型原生规划、验证能力变强,部分 Harness 功能会被模型吸收;但就像提示工程至今仍有价值,Harness 工程作为"围绕模型智能设计系统"的学科,仍将持续发光

文章URL:https://www.langchain.com/blog/the-anatomy-of-an-agent-harness
《MCP已死,CLI万岁》

标签:#AI工具 #开发工具 #MCP #CLI #LLM工具链 #Anthropic #AI代理

总结:
作者认为Anthropic推出的MCP协议正走向消亡,主张LLM应直接使用CLI工具而非专用协议。CLI具备可组合性、调试友好、认证成熟、无额外进程等优势,而MCP存在初始化不稳定、重复认证、权限粒度粗等实际痛点。最好的工具应同时服务人类与机器,开发者应优先打磨API和CLI。

文章要点:
- LLM天生就会用命令行:它们在海量man page、Stack Overflow和shell脚本中训练过,给Claude一个CLI和文档,它就能直接上手,根本不需要新协议
- 调试体验天差地别:CLI出问题你可以亲自跑一遍同样的命令,看到和AI完全一致的输入输出;MCP出错却要钻JSON传输日志,排查像考古
- 管道和组合才是生产力:CLI能通过`jq`、`grep`、重定向灵活处理数据;MCP面对大型Terraform计划只能全塞进上下文窗口,或额外写过滤逻辑,费力不讨好
- 认证体系早已成熟:`aws`、`gh`、`kubectl`都有经过实战检验的SSO和凭证管理,AI和人类共用同一套流程,坏了就按老办法修,不用学MCP专属排错
- 没有后台进程更省心:MCP服务器是常驻进程,会挂起、会掉线、需要状态管理;CLI只是磁盘上的二进制文件,随用随走,干净利落
- 日常使用的真实摩擦:MCP初始化经常抽风要重启,多工具反复认证让人崩溃,权限控制只有白名单名字做不到只读或参数级限制;CLI完全没有这些烦恼
- MCP并非毫无价值:只有当某个工具确实没有CLI时,MCP才是合理选择,标准化接口在极少数场景也有意义
- 给工具开发者的建议:如果你公司在砸钱做MCP服务器却没有官方CLI,赶紧停下来——先把API和CLI做好,AI代理自己会搞定剩下的

文章URL:https://ejholmes.github.io/2026/02/28/mcp-is-dead-long-live-the-cli.html
《为AI智能体设计产品:从界面思维到智能体思维》

标签:#AI产品 #MCP #智能体交互设计 #产品架构 #API设计 #Salesforce #Ramp #Notion

总结:
本文由Ramp产品负责人Teddy Riker撰写,探讨了AI智能体时代产品设计的范式转变。作者指出,未来80%的软件交互将通过AI智能体完成,产品团队需要从"为用户设计界面"转向"为智能体设计能力"。文章以Ramp、Salesforce、Notion等案例,提出了三大核心设计原则:主动提供成功所需的上下文规范、建立基于工具调用的反馈循环、识别并填补智能体间的上下文缺口。

文章要点:

- **交互范式正在翻转**:传统模式是"用户→界面→数据库",而AI时代正在变成"用户→用户智能体→软件智能体→数据库"。界面不会消失,但80%的交互将发生在智能体之间,产品团队需要为"看不见的用户"重新设计。

- **Salesforce的激进转型**:这家27年的传统软件巨头推出"Headless 360"计划,将平台所有能力暴露为API、MCP工具或CLI命令,承认图形界面CRM的护城河正在被侵蚀,主动拥抱"无界面"未来。

- **教会智能体如何成功**:Notion的MCP设计是个正面教材——它在工具描述中明确要求智能体先读取Markdown规范再操作,确保格式准确。相比之下,Slack MCP让智能体"自己摸索"格式规则,结果用户反而要花更多时间修正。产品团队应该主动告诉调用方"你需要知道什么才能成功"。

- **用反馈循环驱动产品迭代**:Ramp通过三个机制解决智能体交互的可观测性难题:要求每次工具调用附带`rationale`参数解释意图、提供独立的反馈提交工具、在特定工具中预埋上下文种子。这些反馈比人类用户更具体、更一致,能直接转化为新功能需求。

- **填补上下文缺口是核心设计挑战**:在"用户智能体↔️软件智能体"的协作中,双方各自掌握对方没有的信息。优秀的设计不是让智能体去猜技术细节(如GL code),而是让它们交换语义上下文(如"这是客户晚餐还是团队建设"),由各自擅长的那一方完成最终决策。

- **敷衍智能体支持的产品会被淘汰**:仅仅发布一个MCP服务器、勾上"支持AI"的 checkbox 是不够的。客户最终会流向那些认真打磨智能体体验、真正理解"最后签支票的可能是AI"的产品。

文章URL:https://baoyu.io/blog/2026-04-24/teddy-riker-2047312986696454584 为 Agent 设计产品
《从基础学科到通用人工智能:25学科知识地图》

标签:#AI教育 #知识图谱 #AGI #跨学科学习 #深度学习 #机器学习 #强化学习 #认知科学 #DataWhale

总结:
这是一份由DataWhale社区维护的AI跨学科知识导航页,将支撑通用人工智能的25门基础学科按数学、计算、认知、决策、物理哲学五大簇组织,并提供多条能力形成路径(表示训练、结构关系、智能体控制、自然智能与AGI),帮助学习者从"学科目录"走向"能力路径",降低跨学科学习成本,避免在庞杂专题中迷路。

文章要点:
- AI本质是跨学科汇流系统,从1943年McCulloch-Pitts神经元到2022年后大模型与Agent,历史脉络清晰展示了数学、工程、认知、哲学等学科的交汇
- 25门学科被系统分为五大簇:数学与形式基础(概率/线代/优化/信息论等)、计算与系统工程(数值分析/控制论/硬件并行等)、认知生物与语言(神经科学/心理学/语言学等)、决策交互与社会机制(运筹学/博弈论/经济学)、物理与哲学基础(统计物理/哲学)
- 提供了五条能力形成路径:表示与训练、结构与关系、不确定性与因果、控制与智能体、自然智能与AGI,让学习围绕"能力如何长出来"而非"学科如何分类"来组织
- 针对不同目标读者定制了四条入门路线:机器学习/深度学习、结构化AI/图学习、强化学习/智能体、推理/AGI,并精选10个优先专题作为"最短抓手"
- 核心定位是"导航页"而非"正文替代者",强调通过横向跳转、反向链接和跨学科汇流点来提升学习效率,避免线性单学科推进

文章URL:https://github.com/datawhalechina/Path2AGI GitHub - datawhalechina/Path2AGI: 从基础学科到通用人工智能 - 跨学科知识图谱
《OpenHarness:开源智能体基础设施框架》

标签:#AI #Agent #智能体 #开源 #Python #工具调用

总结:
OpenHarness是港大数据智能实验室(HKUDS)推出的轻量级开源智能体基础设施框架,仅用Python实现,代码量比Claude Code轻44倍(1.1万行vs 51万行),提供完整的工具调用、技能加载、记忆管理和多智能体协调功能,让开发者快速构建安全可靠的AI Agent应用。

文章要点:
- 极简架构设计:相比Claude Code的51万行TypeScript代码,OpenHarness仅用1.1万行Python实现,去除了企业级复杂依赖如遥测和OAuth,专注于核心Harness架构
- 五大核心模块:包含Agent循环(支持流式工具调用、并行执行、成本追踪)、工具套件(43种工具覆盖文件/Shell/搜索/Web/MCP)、上下文记忆(CLAUDE.md自动注入、MEMORY.md持久化)、权限治理(多级权限模式、交互式审批)、Swarm多智能体协调(子智能体委派、任务管理)
- 生态兼容性:完全兼容anthropics/skills技能格式和claude-code/plugins插件生态,支持OpenClaw、nanobot、Cursor等CLI工具集成
- 开箱即用:一条命令oh即可启动,内置114个单元测试和6个E2E测试套件,提供稳定可靠的基础能力

文章URL:
https://github.com/HKUDS/OpenHarness GitHub - HKUDS/OpenHarness:
《AI指数级增长时代的产品管理》

标签:#产品管理 #AI #ClaudeCode #敏捷开发 #原型优先

总结:

本文由Anthropic的Claude Code产品负责人撰写,探讨了AI模型指数级进步如何颠覆传统产品管理范式。作者指出,过去PM依赖"项目开始时确定技术边界"的假设已失效,因为模型能力在项目周期内可能跃升数十倍。新的工作流强调快速实验、原型优先、角色融合和持续迭代,PM的核心价值转向在不确定性中创造清晰度、推动团队大胆设想可能性,并加速产品交付。

文章要点:

- 传统假设被打破**:过去PM基于"技术能力在项目周期内相对稳定"制定长期路线图,但AI模型能力呈指数级增长(如Claude在16个月内任务处理能力提升41倍),项目初期的技术约束可能在开发中途消失
- **角色边界模糊化**:AI工具让设计师能写代码、工程师做产品决策、PM直接构建原型和评估,产品/设计/工程从线性流程变为高度重叠的协作模式
- **原型优先于文档**:用Claude Code等工具几小时就能做出可演示的原型,团队用Demo代替PRD进行内部验证,错误决策的成本大幅降低
-
"支线任务"文化**:鼓励成员在正式路线图外进行短期自主实验,Claude Code桌面版、AskUserQuestion等热门功能都源自这种探索
- **模型迭代即产品迭代**:每个新模型发布都应触发对已有功能的重新审视,作者建议每天主动测试"可能太难"的任务,当模型能完成时就是产品该升级的信号
- **简单至上原则**:避免为绕过模型限制而设计复杂方案,这些"巧妙"的workaround会在新模型发布后变成技术债务,Claude Code的系统提示词已随模型升级精简了20%

文章URL:

https://claude.com/blog/product-management-on-the-ai-exponential Product management on the AI exponential  | Claude
#AI 2025 年是 LLM 从“玩具”走向“工具”的转折年:推理模型+代码 Agent+异步任务+手机编程,构成了新的开发范式。中国模型崛起、Google 发力、OpenAI 失领先,格局已变。

https://simonwillison.net/2025/Dec/31/the-year-in-llms/
 
 
Back to Top