Now vibe coding, so learning hammer FE ?
《永不浪费一个Token:AI推理流的可恢复性设计》
标签:#后端 #AI推理 #Cloudflare #DurableObject #流式恢复 #Token计费优化
总结:
本文探讨了AI Agent在推理过程中因进程崩溃或重新部署导致流式连接中断、已付费Token被重复计费的痛点。核心方案是在Agent与LLM提供商之间引入一个持久化缓冲区(Durable Object),将流式数据实时写入SQLite,使连接与Agent进程解耦。Agent重启后可通过游标恢复,避免重复调用和重复付费。该机制同时解决了浏览器断网重连和进程崩溃恢复两种场景,且即将集成到Cloudflare AI Gateway中,实现一键开启的持久化推理。
文章要点:
1. 隐藏的成本黑洞:Agent进程崩溃或重新部署时,正在进行的LLM流式请求会中断,已付费的生成Token全部丢失,恢复后必须重新调用并重新付费,且旗舰模型(如GPT-5.5)的重复成本是小模型的15倍。
2. 解耦连接与进程:将LLM提供商连接移出Agent进程,部署为独立的持久化缓冲区(Durable Object),在后台持续将流式数据写入SQLite。即使Agent进程被替换,缓冲区仍继续接收数据,Token不再浪费。
3. 一份日志,两种用途:持久化缓冲区存储的原始字节流既支持浏览器断网重连(追赶实时游标),也支持进程崩溃恢复(回放已存储的片段)。两者共用同一套SQLite日志机制,仅需判断生产者是否仍在运行。
4. 零自定义解析:存储原始字节而非解析后的SSE事件,恢复时通过各提供商的官方插件(如OpenAI、Anthropic)重新解析,避免维护多套格式解析器,且能自动适配格式变更。
5. 行业现状对比:OpenAI Responses API已原生支持后台模式恢复;Anthropic和Google Gemini均不支持服务端续流,只能重新提示并重复计费;Vercel的
6. 即将落地AI Gateway:Cloudflare AI Gateway正在集成该持久化恢复能力,未来只需在Agent基类中设置
URL:https://sunilpai.dev/posts/never-waste-a-token/
标签:#后端 #AI推理 #Cloudflare #DurableObject #流式恢复 #Token计费优化
总结:
本文探讨了AI Agent在推理过程中因进程崩溃或重新部署导致流式连接中断、已付费Token被重复计费的痛点。核心方案是在Agent与LLM提供商之间引入一个持久化缓冲区(Durable Object),将流式数据实时写入SQLite,使连接与Agent进程解耦。Agent重启后可通过游标恢复,避免重复调用和重复付费。该机制同时解决了浏览器断网重连和进程崩溃恢复两种场景,且即将集成到Cloudflare AI Gateway中,实现一键开启的持久化推理。
文章要点:
1. 隐藏的成本黑洞:Agent进程崩溃或重新部署时,正在进行的LLM流式请求会中断,已付费的生成Token全部丢失,恢复后必须重新调用并重新付费,且旗舰模型(如GPT-5.5)的重复成本是小模型的15倍。
2. 解耦连接与进程:将LLM提供商连接移出Agent进程,部署为独立的持久化缓冲区(Durable Object),在后台持续将流式数据写入SQLite。即使Agent进程被替换,缓冲区仍继续接收数据,Token不再浪费。
3. 一份日志,两种用途:持久化缓冲区存储的原始字节流既支持浏览器断网重连(追赶实时游标),也支持进程崩溃恢复(回放已存储的片段)。两者共用同一套SQLite日志机制,仅需判断生产者是否仍在运行。
4. 零自定义解析:存储原始字节而非解析后的SSE事件,恢复时通过各提供商的官方插件(如OpenAI、Anthropic)重新解析,避免维护多套格式解析器,且能自动适配格式变更。
5. 行业现状对比:OpenAI Responses API已原生支持后台模式恢复;Anthropic和Google Gemini均不支持服务端续流,只能重新提示并重复计费;Vercel的
resumable-stream为应用层方案,无法承受部署替换。6. 即将落地AI Gateway:Cloudflare AI Gateway正在集成该持久化恢复能力,未来只需在Agent基类中设置
durableBuffer = true即可一键开启,实现跨提供商的Token零浪费。URL:https://sunilpai.dev/posts/never-waste-a-token/
《现代工程价值观:AI 时代的效率与品味》
标签:#软件工程 #AI编程 #代码审查 #团队管理 #技术栈 #开发者体验 #工程管理
总结:
作者 Christoph Nakazawa(cpojer)分享了他近半年完全依赖 AI 编码代理完成多个项目的实战经验,指出编程已从"手写代码"转向"指挥系统生成代码"。文章提炼了 AI 时代仍至关重要的五大工程价值观:强所有权、品味至上、严格约束与快速反馈、代码库即上下文、掌控技术栈,并强调管理需更技术化。作者用数据证明效率提升 3 倍,认为未来瓶颈不再是写代码,而是判断力与品味。
文章要点:
1. **AI 编码已成常态**:作者过去数月多个项目(Vite+、fate、Codiff、Athena Crisis 等)90%-100% 由 AI 编写,代码质量甚至超越手写,且能在几分钟内完成过去数周的工作
2. **Codex CLI 是最佳搭档**:使用 GPT 5.5 high 配合 Codex CLI,配合"先写失败测试再修复"的策略,能极大提高一次性正确率;多项目并行时建议每个项目独立窗口,利用空间记忆提升效率
3. **强所有权比代码更重要**:AI 放大了"懂行"与"不懂行"的差距,小团队(2-3 人)+ 清晰边界 + 独立仓库比大团队协作更高效,审查应聚焦对齐而非代码细节争论
4. **品味是防"垃圾"泛滥的护城河**:AI 能全天候生成大量平庸代码,工程师的核心价值转向判断"什么值得做",团队应花更多时间思考方向而非盲目堆功能
5. **严格约束 = 速度**:把代码规范、自动化测试、快速验证等"护栏"做得越严,AI 迭代越快(1 分钟 vs 60 分钟的差距);工具必须支持增量检查,避免随代码量增长而变慢
6. **代码库即唯一上下文**:将设计文档、产品行为、决策记录全部沉淀在仓库内,让 AI 和人类都能快速理解;代码越简洁、越易读,AI 修复和迭代越高效
7. **自研技术栈重新划算**:过去依赖第三方库是因为手写代码慢,现在 AI 降低了自研成本,掌控核心依赖能避免被外部框架绑架,获得完全的产品体验控制权
8. **保留选择权(Option Value)**:任何架构改动都应保留未来大幅调整的可能性,AI 虽让重构变快,但把自己逼进死胡同依然难以脱身
9. **管理必须更技术化**:执行成本降低后,管理者不能只做方向把控,必须保持领域 expertise,能亲自改代码、做技术决策,"技术型管理"(Tech Lead Management)将成为主流
10. **效率数据惊人**:近 30 天日均提交 770 次、修改 15k 行代码,是两年前的 3 倍;过去手写巅峰一天 1200 行,现在 AI 辅助可达 10 倍且质量更高
URL:
https://cpojer.net/posts/modern-engineering-values
标签:#软件工程 #AI编程 #代码审查 #团队管理 #技术栈 #开发者体验 #工程管理
总结:
作者 Christoph Nakazawa(cpojer)分享了他近半年完全依赖 AI 编码代理完成多个项目的实战经验,指出编程已从"手写代码"转向"指挥系统生成代码"。文章提炼了 AI 时代仍至关重要的五大工程价值观:强所有权、品味至上、严格约束与快速反馈、代码库即上下文、掌控技术栈,并强调管理需更技术化。作者用数据证明效率提升 3 倍,认为未来瓶颈不再是写代码,而是判断力与品味。
文章要点:
1. **AI 编码已成常态**:作者过去数月多个项目(Vite+、fate、Codiff、Athena Crisis 等)90%-100% 由 AI 编写,代码质量甚至超越手写,且能在几分钟内完成过去数周的工作
2. **Codex CLI 是最佳搭档**:使用 GPT 5.5 high 配合 Codex CLI,配合"先写失败测试再修复"的策略,能极大提高一次性正确率;多项目并行时建议每个项目独立窗口,利用空间记忆提升效率
3. **强所有权比代码更重要**:AI 放大了"懂行"与"不懂行"的差距,小团队(2-3 人)+ 清晰边界 + 独立仓库比大团队协作更高效,审查应聚焦对齐而非代码细节争论
4. **品味是防"垃圾"泛滥的护城河**:AI 能全天候生成大量平庸代码,工程师的核心价值转向判断"什么值得做",团队应花更多时间思考方向而非盲目堆功能
5. **严格约束 = 速度**:把代码规范、自动化测试、快速验证等"护栏"做得越严,AI 迭代越快(1 分钟 vs 60 分钟的差距);工具必须支持增量检查,避免随代码量增长而变慢
6. **代码库即唯一上下文**:将设计文档、产品行为、决策记录全部沉淀在仓库内,让 AI 和人类都能快速理解;代码越简洁、越易读,AI 修复和迭代越高效
7. **自研技术栈重新划算**:过去依赖第三方库是因为手写代码慢,现在 AI 降低了自研成本,掌控核心依赖能避免被外部框架绑架,获得完全的产品体验控制权
8. **保留选择权(Option Value)**:任何架构改动都应保留未来大幅调整的可能性,AI 虽让重构变快,但把自己逼进死胡同依然难以脱身
9. **管理必须更技术化**:执行成本降低后,管理者不能只做方向把控,必须保持领域 expertise,能亲自改代码、做技术决策,"技术型管理"(Tech Lead Management)将成为主流
10. **效率数据惊人**:近 30 天日均提交 770 次、修改 15k 行代码,是两年前的 3 倍;过去手写巅峰一天 1200 行,现在 AI 辅助可达 10 倍且质量更高
URL:
https://cpojer.net/posts/modern-engineering-values
《如何构建你自己的Agent_Harness:从单体框架到可组合Worker架构》
标签:#AI工程 #Agent架构 #系统设计 #开源框架 #Worker模型
总结:
iii创始人Mike_Piccolo提出了一种全新的Agent_Harness构建理念——将传统单体框架拆分为15个独立的可替换Worker,通过统一的
文章要点:
1. 传统框架的痛点:LangChain、LangGraph等将循环、工具、记忆、编排等打包成单体,团队要么全盘接受,要么Fork或Hack,导致长期运行后不得不重写整个Harness
2. iii的核心理念:将15个Harness职责(凭证解析、模型目录、预算追踪、审批门、 durable_turn_loop等)拆分为独立Worker,每个Worker通过
3. 实际生产栈示例:包括turn_orchestrator(11状态FSM)、approval_gate(审批路由)、llm_budget(预算管控)、hook_fanout(钩子发布)、provider_anthropic/openai/kimi(模型提供商)等11个Worker,全部通过同一引擎总线通信
4. 替换的便利性:想换动态模型目录?写一个注册
5. 架构优势:单体框架的"薄vs厚"之争在这里变成配置问题——极简Harness只需4个Worker,企业级Harness安装全部13个+自定义策略引擎,距离只是
6. 可观测性统一:每个Worker自动注入OpenTelemetry追踪,通过
URL:https://iii.dev/blog/how-to-build-your-own-agent-harness/
标签:#AI工程 #Agent架构 #系统设计 #开源框架 #Worker模型
总结:
iii创始人Mike_Piccolo提出了一种全新的Agent_Harness构建理念——将传统单体框架拆分为15个独立的可替换Worker,通过统一的
iii.trigger()原语和WebSocket协议进行通信。这种架构让团队不再需要Fork或绕过现有框架,而是通过"安装/替换Worker"来精确组装符合自身需求的Agent运行时,实现从极简到企业级的平滑伸缩。文章要点:
1. 传统框架的痛点:LangChain、LangGraph等将循环、工具、记忆、编排等打包成单体,团队要么全盘接受,要么Fork或Hack,导致长期运行后不得不重写整个Harness
2. iii的核心理念:将15个Harness职责(凭证解析、模型目录、预算追踪、审批门、 durable_turn_loop等)拆分为独立Worker,每个Worker通过
iii.trigger()触发,可独立版本化、用任意语言编写、随时替换3. 实际生产栈示例:包括turn_orchestrator(11状态FSM)、approval_gate(审批路由)、llm_budget(预算管控)、hook_fanout(钩子发布)、provider_anthropic/openai/kimi(模型提供商)等11个Worker,全部通过同一引擎总线通信
4. 替换的便利性:想换动态模型目录?写一个注册
models::list的新Worker即可;想从Slack审批?写一个监听slash命令并调用approval::resolve的Worker;整个堆栈其他部分完全无感知5. 架构优势:单体框架的"薄vs厚"之争在这里变成配置问题——极简Harness只需4个Worker,企业级Harness安装全部13个+自定义策略引擎,距离只是
config.yaml的条目增减,而非重写6. 可观测性统一:每个Worker自动注入OpenTelemetry追踪,通过
iii.session.id等标签实现跨Worker的完整调用链可视化URL:https://iii.dev/blog/how-to-build-your-own-agent-harness/
《Markdown SVG 渲染器:AI 辅助开发的实用小工具》
标签:#前端 #工具 #Markdown #SVG #AI辅助编程 #SimonWillison #WebComponents
总结:
Simon Willison 分享了他用 Claude Opus 4.8 和 GPT-5.5 辅助开发的一个轻量级 Markdown 渲染工具,核心亮点是对 SVG 代码块的特殊处理——不仅能渲染出图像,还提供「渲染图 / 源代码」双标签切换。该工具支持直接粘贴 Markdown、加载远程文件或 GitHub Gist,并用 Fragment URL 记录状态以便分享。整个项目从需求到安全加固完全由 AI 驱动,是「提示驱动开发」的又一实例。
文章要点:
1. 这个工具的诞生源于一个具体场景:Simon 用 LLM CLI 让 Claude Opus 4.8 生成了五组不同思考深度(low 到 max)的「鹈鹕骑自行车」SVG,想找个优雅的方式展示这些 Markdown 日志
2. 核心定制点在于 SVG 围栏代码块(\
3. 支持三种内容输入方式:直接粘贴 Markdown、输入 CORS 兼容的远程 Markdown 文件 URL、或者加载 GitHub Gist 中的第一个文件
4. 用 URL Fragment(#)记录当前加载的文件地址,刷新页面或分享链接时能自动恢复状态,不用依赖后端
5. 安全方面,Simon 后续用 GPT-5.5(Codex xhigh 模式)专门审计并修复了 XSS 漏洞,体现了 AI 辅助开发中「生成 + 安全加固」的两步走思路
6. 整个工具属于 Simon 的「HTML Tools」系列——单文件 HTML+JS+CSS、无构建步骤、托管在 tools.simonwillison.net,目前已积累超过 150 个类似小工具
URL:https://simonwillison.net/2026/May/28/markdown-svg-renderer/
标签:#前端 #工具 #Markdown #SVG #AI辅助编程 #SimonWillison #WebComponents
总结:
Simon Willison 分享了他用 Claude Opus 4.8 和 GPT-5.5 辅助开发的一个轻量级 Markdown 渲染工具,核心亮点是对 SVG 代码块的特殊处理——不仅能渲染出图像,还提供「渲染图 / 源代码」双标签切换。该工具支持直接粘贴 Markdown、加载远程文件或 GitHub Gist,并用 Fragment URL 记录状态以便分享。整个项目从需求到安全加固完全由 AI 驱动,是「提示驱动开发」的又一实例。
文章要点:
1. 这个工具的诞生源于一个具体场景:Simon 用 LLM CLI 让 Claude Opus 4.8 生成了五组不同思考深度(low 到 max)的「鹈鹕骑自行车」SVG,想找个优雅的方式展示这些 Markdown 日志
2. 核心定制点在于 SVG 围栏代码块(\
\\`svg)——普通 Markdown 渲染器只会显示代码,而这个工具会把它变成可交互的 Web Component,默认展示渲染好的 SVG,点击可切换到源码查看3. 支持三种内容输入方式:直接粘贴 Markdown、输入 CORS 兼容的远程 Markdown 文件 URL、或者加载 GitHub Gist 中的第一个文件
4. 用 URL Fragment(#)记录当前加载的文件地址,刷新页面或分享链接时能自动恢复状态,不用依赖后端
5. 安全方面,Simon 后续用 GPT-5.5(Codex xhigh 模式)专门审计并修复了 XSS 漏洞,体现了 AI 辅助开发中「生成 + 安全加固」的两步走思路
6. 整个工具属于 Simon 的「HTML Tools」系列——单文件 HTML+JS+CSS、无构建步骤、托管在 tools.simonwillison.net,目前已积累超过 150 个类似小工具
URL:https://simonwillison.net/2026/May/28/markdown-svg-renderer/
《AI 正在重演前端的"失落十年"吗?》
标签:#前端 #AI编程 #职业发展 #软件工程 # craftsmanship #Bauhaus
总结:
作者将 AI 对编程行业的冲击与前十年 JavaScript 框架对前端的"去技能化"(deskilling)进行类比。框架把浏览器当作编译目标,让通用开发者无需理解 HTML 语义、无障碍、性能等底层知识就能"搞定"前端;AI 编码则进一步将手工写代码的技能消解为"操作半熟练工人使用的技术"。文章认为这降低了从业者议价能力、牺牲了质量,但也承认这是效率提升和抽象层级升高的必然趋势。作者借用 Bauhaus 运动的启示——不是对抗工业化,而是让工匠与工厂协作、以用户为中心重新设计——呼吁在 AI 时代依然需要"懂材料"的人,同时指出商业成功与软件质量本就很少相关,真正的 craft 只会成为更小的切片。
文章要点:
1. "去技能化"正在从特定领域扩散到整个编程行业:框架让前端从专精技能变成通用技能,AI 让编程本身面临同样命运
2. 现代"全栈开发者"往往不是前后端都精通,而是能用框架两边都糊弄的通才,企业因此获得成本节省和人员灵活调配
3. AI 编码是"非确定性抽象"——不像编译器那样稳定,输入或模型的微小变化会导致截然不同的结果,更像是"不会学习的初级工程师"
4. LLM 是 Stack Overflow 复制粘贴的终极进化:让懂行的人更快,让不懂的人也能凑出"能跑"的东西,但抽象泄漏时依然需要有人深入理解并修复
5. 商业成功与软件质量几乎不相关,糟糕的网站对转化率影响有限,且"没人因为选了 React 而被解雇"
6. Bauhaus 运动的启示:不复古也不对抗工业化,而是让设计师回到工坊、与材料共事,最终产出兼顾批量生产和用户体验的设计
7. 前端 craft 不会消失,但会成为更小的切片;就像字体设计不再是全职工作、塑料垃圾泛滥但好工业设计依然存在
8. 快速迭代和 MVP 有其价值,但需要知道自己在验证什么;性能和无障碍等基础如果一开始没做对,后期很难补救
9. AI 只是工具箱里的又一件工具,但 hype 周期内我们会看到丑陋的代码、破碎的沟通和借 AI 之名裁员
10. 作者自己的框架 Mastro 倡导"从简单栈开始、后续再添加功能",反对先上重型框架再试图优化
URL:https://mastrojs.github.io/blog/2026-05-23-is-AI-causing-a-repeat-of-frontends-lost-decade/
标签:#前端 #AI编程 #职业发展 #软件工程 # craftsmanship #Bauhaus
总结:
作者将 AI 对编程行业的冲击与前十年 JavaScript 框架对前端的"去技能化"(deskilling)进行类比。框架把浏览器当作编译目标,让通用开发者无需理解 HTML 语义、无障碍、性能等底层知识就能"搞定"前端;AI 编码则进一步将手工写代码的技能消解为"操作半熟练工人使用的技术"。文章认为这降低了从业者议价能力、牺牲了质量,但也承认这是效率提升和抽象层级升高的必然趋势。作者借用 Bauhaus 运动的启示——不是对抗工业化,而是让工匠与工厂协作、以用户为中心重新设计——呼吁在 AI 时代依然需要"懂材料"的人,同时指出商业成功与软件质量本就很少相关,真正的 craft 只会成为更小的切片。
文章要点:
1. "去技能化"正在从特定领域扩散到整个编程行业:框架让前端从专精技能变成通用技能,AI 让编程本身面临同样命运
2. 现代"全栈开发者"往往不是前后端都精通,而是能用框架两边都糊弄的通才,企业因此获得成本节省和人员灵活调配
3. AI 编码是"非确定性抽象"——不像编译器那样稳定,输入或模型的微小变化会导致截然不同的结果,更像是"不会学习的初级工程师"
4. LLM 是 Stack Overflow 复制粘贴的终极进化:让懂行的人更快,让不懂的人也能凑出"能跑"的东西,但抽象泄漏时依然需要有人深入理解并修复
5. 商业成功与软件质量几乎不相关,糟糕的网站对转化率影响有限,且"没人因为选了 React 而被解雇"
6. Bauhaus 运动的启示:不复古也不对抗工业化,而是让设计师回到工坊、与材料共事,最终产出兼顾批量生产和用户体验的设计
7. 前端 craft 不会消失,但会成为更小的切片;就像字体设计不再是全职工作、塑料垃圾泛滥但好工业设计依然存在
8. 快速迭代和 MVP 有其价值,但需要知道自己在验证什么;性能和无障碍等基础如果一开始没做对,后期很难补救
9. AI 只是工具箱里的又一件工具,但 hype 周期内我们会看到丑陋的代码、破碎的沟通和借 AI 之名裁员
10. 作者自己的框架 Mastro 倡导"从简单栈开始、后续再添加功能",反对先上重型框架再试图优化
URL:https://mastrojs.github.io/blog/2026-05-23-is-AI-causing-a-repeat-of-frontends-lost-decade/
《AI辅助工程师正在倦怠,这真的没问题吗?》
标签:#软件工程 #AI辅助编程 #职业倦怠 #心理健康 #开发者体验 #生产力陷阱
总结:
文章揭示了AI辅助编程带来的隐性危机——AI倦怠。尽管AI让代码产出速度翻倍,但工程师们实际工作强度更高、成就感更低。文章通过"Ben和Alice"的认知负荷对比分析,指出AI将编程从"计划→ crafting→结果"的愉悦循环,变成了高强度审查和调试的消耗模式。同时探讨了失去代码库上下文、被动思考时间被挤压、虚假期望膨胀等日常 burnout 诱因,并提供了五条可落地的自救建议:认可自身价值、重构AI工作流、保留手工编码时间、严守工作边界、探索新兴趣领域。
文章要点:
1. AI让产出翻倍,却让工作强度翻倍——Alice用2小时完成Ben 4小时的活,但认知负荷极高且停不下来,最终4小时内做了2倍高强度工作,成就感反而更低
2. 编程的快乐循环被打破了——以前"计划→写代码→看到结果"的过程很治愈,现在变成"计划→直接看AI生成的结果",跳过了最享受的crafting环节,只剩下累人的审查工作
3. 你的代码库正在"离开你"——AI代理帮你记住了架构和边界情况,你不再需要在脑中维护整个系统,久而久之直觉判断力下降, supervising一个自己不懂的系统超级累
4. 被动思考时间被AI偷走了——以前洗澡、散步时大脑后台会默默解题,现在跟AI几分钟来回就"搞定"了,但往往是次优解,后面还要返工
5. 虚假期望是个陷阱——AI初期进展顺利,客户/老板把冲刺速度当成基线,等瓶颈出现时你反而要拼命维持那个不可能的节奏
6. 审查瓶颈在转移压力——AI生成代码量远超单人审查能力, senior工程师被迫承担不成比例的风险和认知负荷,维护系统 sanity 越来越吃力
7. 五条自救建议超实用——包括写胜利日志、Plan模式优先、不连续做AI任务、保护手工编码时间、到点就停不补任务等,帮你把AI从"消耗品"变回"助手"
URL:
https://evilmartians.com/chronicles/ai-assisted-engineers-are-burning-out-is-this-fine
标签:#软件工程 #AI辅助编程 #职业倦怠 #心理健康 #开发者体验 #生产力陷阱
总结:
文章揭示了AI辅助编程带来的隐性危机——AI倦怠。尽管AI让代码产出速度翻倍,但工程师们实际工作强度更高、成就感更低。文章通过"Ben和Alice"的认知负荷对比分析,指出AI将编程从"计划→ crafting→结果"的愉悦循环,变成了高强度审查和调试的消耗模式。同时探讨了失去代码库上下文、被动思考时间被挤压、虚假期望膨胀等日常 burnout 诱因,并提供了五条可落地的自救建议:认可自身价值、重构AI工作流、保留手工编码时间、严守工作边界、探索新兴趣领域。
文章要点:
1. AI让产出翻倍,却让工作强度翻倍——Alice用2小时完成Ben 4小时的活,但认知负荷极高且停不下来,最终4小时内做了2倍高强度工作,成就感反而更低
2. 编程的快乐循环被打破了——以前"计划→写代码→看到结果"的过程很治愈,现在变成"计划→直接看AI生成的结果",跳过了最享受的crafting环节,只剩下累人的审查工作
3. 你的代码库正在"离开你"——AI代理帮你记住了架构和边界情况,你不再需要在脑中维护整个系统,久而久之直觉判断力下降, supervising一个自己不懂的系统超级累
4. 被动思考时间被AI偷走了——以前洗澡、散步时大脑后台会默默解题,现在跟AI几分钟来回就"搞定"了,但往往是次优解,后面还要返工
5. 虚假期望是个陷阱——AI初期进展顺利,客户/老板把冲刺速度当成基线,等瓶颈出现时你反而要拼命维持那个不可能的节奏
6. 审查瓶颈在转移压力——AI生成代码量远超单人审查能力, senior工程师被迫承担不成比例的风险和认知负荷,维护系统 sanity 越来越吃力
7. 五条自救建议超实用——包括写胜利日志、Plan模式优先、不连续做AI任务、保护手工编码时间、到点就停不补任务等,帮你把AI从"消耗品"变回"助手"
URL:
https://evilmartians.com/chronicles/ai-assisted-engineers-are-burning-out-is-this-fine
《Chrome DevTools MCP v1 发布:为 AI 编码代理赋予浏览器调试超能力》
标签:#前端 #AI_Tools #Chrome_DevTools #MCP #Browser_Automation #Performance_Debugging
总结:
Chrome 团队正式发布 DevTools MCP v1,通过 Model Context Protocol 将 Chrome DevTools 的完整调试能力开放给 AI 编码代理。它让 Claude、Cursor、Copilot 等 AI 助手能够实时控制浏览器、抓取性能 trace、分析网络请求、检查控制台日志,甚至处理 1500 万行级别的性能数据,从而把"盲写代码"的 AI 变成能看、能测、能调优的闭环调试器。
文章要点:
1. 告别盲写时代:以前 AI 编码代理只能凭空推理代码,无法看到实际渲染效果。DevTools MCP 直接给 AI 装上"眼睛",让它能截图、查 DOM、读控制台、抓网络请求,基于真实浏览器状态做判断。
2. 40+ 工具全覆盖:从点击、填表、导航等自动化操作,到性能 trace 录制、Lighthouse 审计、内存堆快照、网络请求分析,几乎把 DevTools 面板的能力完整暴露给了 AI。
3. 性能分析是杀手锏:Paul Irish 演示了如何处理 1500 万行 JSON 的复杂性能 trace,MCP 服务器会解析并提炼出关键洞察,让 AI 帮你做原本需要资深性能专家才能完成的初步诊断。
4. 接入零门槛:支持 Claude Code、Cursor、Copilot、Gemini CLI、VS Code 等主流工具,一条 npx 命令即可启动,还能自动连接本地已运行的 Chrome 实例,无需额外配置。
5. 架构扎实可靠:底层基于 Chrome DevTools Protocol 和 Puppeteer,自动化操作自带智能等待,避免 flaky;同时支持 headless 和有头模式,适应不同场景需求。
URL:https://developer.chrome.com/blog/devtools-for-agents-v1
标签:#前端 #AI_Tools #Chrome_DevTools #MCP #Browser_Automation #Performance_Debugging
总结:
Chrome 团队正式发布 DevTools MCP v1,通过 Model Context Protocol 将 Chrome DevTools 的完整调试能力开放给 AI 编码代理。它让 Claude、Cursor、Copilot 等 AI 助手能够实时控制浏览器、抓取性能 trace、分析网络请求、检查控制台日志,甚至处理 1500 万行级别的性能数据,从而把"盲写代码"的 AI 变成能看、能测、能调优的闭环调试器。
文章要点:
1. 告别盲写时代:以前 AI 编码代理只能凭空推理代码,无法看到实际渲染效果。DevTools MCP 直接给 AI 装上"眼睛",让它能截图、查 DOM、读控制台、抓网络请求,基于真实浏览器状态做判断。
2. 40+ 工具全覆盖:从点击、填表、导航等自动化操作,到性能 trace 录制、Lighthouse 审计、内存堆快照、网络请求分析,几乎把 DevTools 面板的能力完整暴露给了 AI。
3. 性能分析是杀手锏:Paul Irish 演示了如何处理 1500 万行 JSON 的复杂性能 trace,MCP 服务器会解析并提炼出关键洞察,让 AI 帮你做原本需要资深性能专家才能完成的初步诊断。
4. 接入零门槛:支持 Claude Code、Cursor、Copilot、Gemini CLI、VS Code 等主流工具,一条 npx 命令即可启动,还能自动连接本地已运行的 Chrome 实例,无需额外配置。
5. 架构扎实可靠:底层基于 Chrome DevTools Protocol 和 Puppeteer,自动化操作自带智能等待,避免 flaky;同时支持 headless 和有头模式,适应不同场景需求。
URL:https://developer.chrome.com/blog/devtools-for-agents-v1
《AI重塑软件行业:从稀缺到泛滥的四大影响》
标签:#科技趋势 #AI变革 #软件行业 #SaaS #VibeCoding
总结:
AI让软件开发门槛骤降,软件正从"高壁垒高尊重"的稀缺品变成"人人可评判"的日用品。行业将经历薪资压缩、选择过剩导致用户忠诚度下降、中层产品消亡等剧变。未来赢家不再卖工具,而是直接卖服务结果;个人需成为领域专家或超级个体,才能在幂律分布中存活。
文章要点:
1. 软件行业正在"营销化":门槛降低+可见性提高=尊重崩塌。就像没人敢评判数学证明,但人人能对落地页配色指手画脚一样,VibeCoding让外行也能"看懂"软件,开发者薪资分布将从当前最紧的2.65倍向写作/设计行业的3.5倍扩散
2. 选择悖论杀死用户忠诚度:当项目管理工具有3个时你会选定一个,有300个时你会不断寻找"完美匹配"甚至自己Vibe一个。软件将从差异化卖点变成像水一样的基础资源
3. 中层SaaS即将灭绝:App Store里1%的App拿走95%收入,SaaS也将幂律化。中等规模公司(收费高但无网络效应)会被免费AI工具和大平台两头挤压,同时超长尾的"一次性个人工具"将爆发式增长
4. 卖服务而非卖产品才是未来:企业每花1美元买软件,花6美元买服务。AI时代的机会是用软件成本做服务生意——不是卖更好的记账软件,而是直接帮你把账做完。专家可以服务200个客户,AI处理琐事,人只做判断
URL:
https://www.terezatizkova.com/writing/software-abundance
标签:#科技趋势 #AI变革 #软件行业 #SaaS #VibeCoding
总结:
AI让软件开发门槛骤降,软件正从"高壁垒高尊重"的稀缺品变成"人人可评判"的日用品。行业将经历薪资压缩、选择过剩导致用户忠诚度下降、中层产品消亡等剧变。未来赢家不再卖工具,而是直接卖服务结果;个人需成为领域专家或超级个体,才能在幂律分布中存活。
文章要点:
1. 软件行业正在"营销化":门槛降低+可见性提高=尊重崩塌。就像没人敢评判数学证明,但人人能对落地页配色指手画脚一样,VibeCoding让外行也能"看懂"软件,开发者薪资分布将从当前最紧的2.65倍向写作/设计行业的3.5倍扩散
2. 选择悖论杀死用户忠诚度:当项目管理工具有3个时你会选定一个,有300个时你会不断寻找"完美匹配"甚至自己Vibe一个。软件将从差异化卖点变成像水一样的基础资源
3. 中层SaaS即将灭绝:App Store里1%的App拿走95%收入,SaaS也将幂律化。中等规模公司(收费高但无网络效应)会被免费AI工具和大平台两头挤压,同时超长尾的"一次性个人工具"将爆发式增长
4. 卖服务而非卖产品才是未来:企业每花1美元买软件,花6美元买服务。AI时代的机会是用软件成本做服务生意——不是卖更好的记账软件,而是直接帮你把账做完。专家可以服务200个客户,AI处理琐事,人只做判断
URL:
https://www.terezatizkova.com/writing/software-abundance
《cc-connect:本地AI编程助手连接消息平台桥梁》
标签:#开发工具 #AI编程助手 #ClaudeCode #CursorAgent #GeminiCLI #Codex #Telegram #飞书 #钉钉 #Slack #Discord #WeChatWork #LINE #QQ #Weibo
总结:
cc-connect 是一个开源的本地AI编程代理桥接工具,让你可以在飞书、钉钉、Telegram、Slack、Discord、企业微信、LINE、QQ、微博甚至个人微信等11个平台上,随时随地"聊天式"操控 Claude Code、Cursor、Gemini CLI、Codex 等10+种AI编程助手。无需公网IP,手机发消息就能让AI写代码、改Bug、做数据分析,真正实现" anywhere, anytime "的AI开发体验。
文章要点:
• 超全平台覆盖:支持飞书、钉钉、Telegram、Slack、Discord、企业微信、LINE、QQ、微博、个人微信等11个主流聊天平台,大部分平台无需公网IP即可直连,手机/平板随时操控
• 10+AI助手全家桶:完美桥接 Claude Code、Codex、Cursor Agent、Gemini CLI、Kimi CLI、Qoder CLI、OpenCode、iFlow CLI、Pi、Devin 等,还支持 ACP 协议兼容的任何新代理
• 聊天里掌控一切:通过 /model 切换模型、/mode 调整权限模式、/dir 切换工作目录、/new 管理会话、/cron 设置定时任务,所有操作都在聊天窗口完成
• 多Agent协同作战:支持在一个群聊里绑定多个AI机器人,让Claude和Gemini互相配合、接力完成任务,实现"AI团队"协作
• 多模态与记忆:支持语音消息(STT/TTS)、图片截图、文件收发;Agent记忆持久化,/memory 指令随时读写,避免重复交代背景
• Web管理后台:内置完整的Web Admin UI,支持项目CRUD、会话监控、定时任务编辑、Provider管理,5种语言界面,零配置上手
• 安全隔离:支持 Linux/macOS 下的 OS-User 隔离运行,不同项目可用不同Unix用户启动Agent,配合 cc-connect doctor 做安全审计
• 生命周期钩子:支持7种事件类型(消息收发、会话启停、定时触发、权限请求、错误)触发Shell命令或HTTP Webhook,方便集成CI/CD
URL:https://github.com/chenhg5/cc-connect
标签:#开发工具 #AI编程助手 #ClaudeCode #CursorAgent #GeminiCLI #Codex #Telegram #飞书 #钉钉 #Slack #Discord #WeChatWork #LINE #QQ #Weibo
总结:
cc-connect 是一个开源的本地AI编程代理桥接工具,让你可以在飞书、钉钉、Telegram、Slack、Discord、企业微信、LINE、QQ、微博甚至个人微信等11个平台上,随时随地"聊天式"操控 Claude Code、Cursor、Gemini CLI、Codex 等10+种AI编程助手。无需公网IP,手机发消息就能让AI写代码、改Bug、做数据分析,真正实现" anywhere, anytime "的AI开发体验。
文章要点:
• 超全平台覆盖:支持飞书、钉钉、Telegram、Slack、Discord、企业微信、LINE、QQ、微博、个人微信等11个主流聊天平台,大部分平台无需公网IP即可直连,手机/平板随时操控
• 10+AI助手全家桶:完美桥接 Claude Code、Codex、Cursor Agent、Gemini CLI、Kimi CLI、Qoder CLI、OpenCode、iFlow CLI、Pi、Devin 等,还支持 ACP 协议兼容的任何新代理
• 聊天里掌控一切:通过 /model 切换模型、/mode 调整权限模式、/dir 切换工作目录、/new 管理会话、/cron 设置定时任务,所有操作都在聊天窗口完成
• 多Agent协同作战:支持在一个群聊里绑定多个AI机器人,让Claude和Gemini互相配合、接力完成任务,实现"AI团队"协作
• 多模态与记忆:支持语音消息(STT/TTS)、图片截图、文件收发;Agent记忆持久化,/memory 指令随时读写,避免重复交代背景
• Web管理后台:内置完整的Web Admin UI,支持项目CRUD、会话监控、定时任务编辑、Provider管理,5种语言界面,零配置上手
• 安全隔离:支持 Linux/macOS 下的 OS-User 隔离运行,不同项目可用不同Unix用户启动Agent,配合 cc-connect doctor 做安全审计
• 生命周期钩子:支持7种事件类型(消息收发、会话启停、定时触发、权限请求、错误)触发Shell命令或HTTP Webhook,方便集成CI/CD
URL:https://github.com/chenhg5/cc-connect
《Agent Harness 的解剖学:将 LLM 转化为工作引擎的系统工程》
标签:#AI_Agent #LLM #LangChain #Harness_Engineering #Context_Management #Tool_Orchestration
总结:Agent Harness 是包裹在大模型之外的全套"脚手架"——包括系统提示词、工具调用、文件系统、沙盒环境、记忆管理和编排逻辑等。它把只能输入输出文本的"裸模型",改造成能持久化状态、执行代码、自主规划并长期协作的合格智能体。文章从模型能力边界出发,逆向推导出每个 Harness 组件存在的必然性,并指出 Harness 工程与模型训练正在协同进化,优化 Harness 本身就能让同一模型在基准测试上从 Top 30 跃升至 Top 5。
文章要点:
- Agent = Model + Harness:如果你不是模型本身,那你就是 Harness。Harness 是除模型权重外的一切代码、配置与执行逻辑,负责把模型的"智商"转化为"产能"
- 模型天生会"健忘":裸模型只能处理上下文窗口内的信息,无法跨会话记住状态、执行代码或获取实时知识,这些"超能力"全靠 Harness 赋予
- 文件系统是最底层的基础设施:给 Agent 一个工作目录,它就能读写数据、卸载超长上下文、还能让多个 Agent 像同事一样通过共享文件协作
- Bash + 代码执行是万能瑞士军刀:与其为每个场景预写工具,不如直接给 Agent 一个终端,让它现场写代码、装依赖、自己造工具解决问题
- 沙盒让 Agent 安全地"动手":在隔离环境里跑代码、测效果、看日志,既防手滑删库,又能按需扩容、用完即焚
- 记忆靠"上下文注入"实现:通过 AGENTS.md 等记忆文件标准,把历史经验塞进新会话;再配合网络搜索和 MCP 工具,突破训练数据的时间 cutoff
- 上下文腐烂是隐形杀手:随着对话变长,模型性能会断崖下跌。Harness 通过 Compaction(智能摘要)、Tool 输出卸载和 Skills 渐进式加载来保护宝贵的上下文空间
- 长程任务需要"接力跑":Ralph Loop 机制让 Agent 在上下文耗尽时,从文件系统读取进度、换一块"干净"上下文继续干;配合 git 记录和自验证循环,实现跨会话的复杂项目开发
- Harness 与模型在"共同进化":Claude Code、Codex 等产品会把 Harness 逻辑也放进后训练环节,但有趣的是——换一套更优 Harness,同一模型排名能从 30 名外冲进前 5
- 未来 Harness 会"瘦身"但不会消失:随着模型原生规划、验证能力变强,部分 Harness 功能会被模型吸收;但就像提示工程至今仍有价值,Harness 工程作为"围绕模型智能设计系统"的学科,仍将持续发光
文章URL:https://www.langchain.com/blog/the-anatomy-of-an-agent-harness
标签:#AI_Agent #LLM #LangChain #Harness_Engineering #Context_Management #Tool_Orchestration
总结:Agent Harness 是包裹在大模型之外的全套"脚手架"——包括系统提示词、工具调用、文件系统、沙盒环境、记忆管理和编排逻辑等。它把只能输入输出文本的"裸模型",改造成能持久化状态、执行代码、自主规划并长期协作的合格智能体。文章从模型能力边界出发,逆向推导出每个 Harness 组件存在的必然性,并指出 Harness 工程与模型训练正在协同进化,优化 Harness 本身就能让同一模型在基准测试上从 Top 30 跃升至 Top 5。
文章要点:
- Agent = Model + Harness:如果你不是模型本身,那你就是 Harness。Harness 是除模型权重外的一切代码、配置与执行逻辑,负责把模型的"智商"转化为"产能"
- 模型天生会"健忘":裸模型只能处理上下文窗口内的信息,无法跨会话记住状态、执行代码或获取实时知识,这些"超能力"全靠 Harness 赋予
- 文件系统是最底层的基础设施:给 Agent 一个工作目录,它就能读写数据、卸载超长上下文、还能让多个 Agent 像同事一样通过共享文件协作
- Bash + 代码执行是万能瑞士军刀:与其为每个场景预写工具,不如直接给 Agent 一个终端,让它现场写代码、装依赖、自己造工具解决问题
- 沙盒让 Agent 安全地"动手":在隔离环境里跑代码、测效果、看日志,既防手滑删库,又能按需扩容、用完即焚
- 记忆靠"上下文注入"实现:通过 AGENTS.md 等记忆文件标准,把历史经验塞进新会话;再配合网络搜索和 MCP 工具,突破训练数据的时间 cutoff
- 上下文腐烂是隐形杀手:随着对话变长,模型性能会断崖下跌。Harness 通过 Compaction(智能摘要)、Tool 输出卸载和 Skills 渐进式加载来保护宝贵的上下文空间
- 长程任务需要"接力跑":Ralph Loop 机制让 Agent 在上下文耗尽时,从文件系统读取进度、换一块"干净"上下文继续干;配合 git 记录和自验证循环,实现跨会话的复杂项目开发
- Harness 与模型在"共同进化":Claude Code、Codex 等产品会把 Harness 逻辑也放进后训练环节,但有趣的是——换一套更优 Harness,同一模型排名能从 30 名外冲进前 5
- 未来 Harness 会"瘦身"但不会消失:随着模型原生规划、验证能力变强,部分 Harness 功能会被模型吸收;但就像提示工程至今仍有价值,Harness 工程作为"围绕模型智能设计系统"的学科,仍将持续发光
文章URL:https://www.langchain.com/blog/the-anatomy-of-an-agent-harness
《Mirage:AI Agent的统一虚拟文件系统》
标签:#AI_Tools #AI_Agent #文件系统 #Python #TypeScript #SDK #S3 #Slack #GitHub #Redis #缓存 #OpenAI #Vercel_AI_SDK #LangChain
总结:
Mirage 是一个专为 AI Agent 设计的统一虚拟文件系统,它将 S3、Google Drive、Slack、Gmail、Redis 等数十种后端服务挂载到同一棵文件树下。Agent 只需用熟悉的 Unix/bash 工具(如 grep、cat、cp)就能跨服务读写数据,无需学习 N 个 SDK 或 MCP。支持 Python/TypeScript SDK 和 CLI,可嵌入 FastAPI、Express 等应用,并内置双层缓存(索引缓存 + 文件缓存)减少网络开销,兼容 OpenAI Agents SDK、Vercel AI SDK、LangChain 等主流框架。
文章要点:
- 统一挂载,万物皆文件:把 S3、GDrive、Slack、GitHub、MongoDB、Redis 等后端并排挂载到同一个根目录下,Agent 看到的始终只有一棵树
- 零学习成本:任何懂 bash 的 LLM 都能直接上手,用
- 双层缓存省流量:自带索引缓存(目录列表)和文件缓存(对象字节),默认用内存,也可切 Redis 共享给多进程/多机器
- 多语言 SDK + CLI:提供 Python 和 TypeScript(Node / Browser / Core)SDK,以及轻量 CLI,可嵌入你的 FastAPI、Express 或浏览器应用
- 主流框架即插即用:已适配 OpenAI Agents SDK、Vercel AI SDK、LangChain、Pydantic AI、CAMEL、OpenHands 等
- 工作空间可移植:支持克隆、快照、版本化管理,Agent 运行环境能在机器间迁移而不必重新配置
文章URL:https://github.com/strukto-ai/mirage
标签:#AI_Tools #AI_Agent #文件系统 #Python #TypeScript #SDK #S3 #Slack #GitHub #Redis #缓存 #OpenAI #Vercel_AI_SDK #LangChain
总结:
Mirage 是一个专为 AI Agent 设计的统一虚拟文件系统,它将 S3、Google Drive、Slack、Gmail、Redis 等数十种后端服务挂载到同一棵文件树下。Agent 只需用熟悉的 Unix/bash 工具(如 grep、cat、cp)就能跨服务读写数据,无需学习 N 个 SDK 或 MCP。支持 Python/TypeScript SDK 和 CLI,可嵌入 FastAPI、Express 等应用,并内置双层缓存(索引缓存 + 文件缓存)减少网络开销,兼容 OpenAI Agents SDK、Vercel AI SDK、LangChain 等主流框架。
文章要点:
- 统一挂载,万物皆文件:把 S3、GDrive、Slack、GitHub、MongoDB、Redis 等后端并排挂载到同一个根目录下,Agent 看到的始终只有一棵树
- 零学习成本:任何懂 bash 的 LLM 都能直接上手,用
grep、cat、cp、wc 这些经典命令跨服务操作,不用记新 API- 双层缓存省流量:自带索引缓存(目录列表)和文件缓存(对象字节),默认用内存,也可切 Redis 共享给多进程/多机器
- 多语言 SDK + CLI:提供 Python 和 TypeScript(Node / Browser / Core)SDK,以及轻量 CLI,可嵌入你的 FastAPI、Express 或浏览器应用
- 主流框架即插即用:已适配 OpenAI Agents SDK、Vercel AI SDK、LangChain、Pydantic AI、CAMEL、OpenHands 等
- 工作空间可移植:支持克隆、快照、版本化管理,Agent 运行环境能在机器间迁移而不必重新配置
文章URL:https://github.com/strukto-ai/mirage
《Obscura:专为AI代理和爬虫打造的轻量级无头浏览器》
标签:#后端 #Rust #HeadlessBrowser #WebScraping #AI_Agent #Chrome_DevTools_Protocol #Puppeteer #Playwright #Anti_Detection
总结:
Obscura是一款基于Rust编写的开源无头浏览器引擎,专为大规模网页抓取和AI自动化场景设计。它通过内置V8引擎运行真实JavaScript,完整支持Chrome DevTools Protocol,可直接替代Puppeteer和Playwright依赖的Headless Chrome,在内存占用(30MB vs 200MB+)、启动速度和反检测能力上具有显著优势。
文章要点:
- **极致轻量,资源友好**:相比Headless Chrome动辄200MB+的内存占用和300MB+的体积,Obscura仅需30MB内存和70MB二进制文件,启动几乎瞬时完成,页面加载速度提升约6倍
- **零依赖,开箱即用**:无需安装Chrome或Node.js,单个二进制文件即可运行,支持Linux、macOS(Intel/Apple Silicon)和Windows平台
- **无缝兼容现有生态**:完整实现Chrome DevTools Protocol,可作为Puppeteer和Playwright的底层浏览器直接连接使用,现有爬虫脚本迁移成本低
- **内置隐身模式**:自带反指纹追踪(随机化GPU、屏幕、Canvas等参数)和3520个域名级别的追踪器拦截,无需额外配置即可绕过常见反爬机制
- **并行爬取能力**:提供`obscura scrape`命令支持多URL并发抓取,配合`--concurrency`参数可灵活控制worker数量,适合批量数据采集场景
- **开源承诺与商业化路径**:核心引擎采用Apache 2.0协议且承诺永不功能阉割,同时正在开发托管版Obscura Cloud提供代理和基础设施服务
文章URL:
https://github.com/h4ckf0r0day/obscura
标签:#后端 #Rust #HeadlessBrowser #WebScraping #AI_Agent #Chrome_DevTools_Protocol #Puppeteer #Playwright #Anti_Detection
总结:
Obscura是一款基于Rust编写的开源无头浏览器引擎,专为大规模网页抓取和AI自动化场景设计。它通过内置V8引擎运行真实JavaScript,完整支持Chrome DevTools Protocol,可直接替代Puppeteer和Playwright依赖的Headless Chrome,在内存占用(30MB vs 200MB+)、启动速度和反检测能力上具有显著优势。
文章要点:
- **极致轻量,资源友好**:相比Headless Chrome动辄200MB+的内存占用和300MB+的体积,Obscura仅需30MB内存和70MB二进制文件,启动几乎瞬时完成,页面加载速度提升约6倍
- **零依赖,开箱即用**:无需安装Chrome或Node.js,单个二进制文件即可运行,支持Linux、macOS(Intel/Apple Silicon)和Windows平台
- **无缝兼容现有生态**:完整实现Chrome DevTools Protocol,可作为Puppeteer和Playwright的底层浏览器直接连接使用,现有爬虫脚本迁移成本低
- **内置隐身模式**:自带反指纹追踪(随机化GPU、屏幕、Canvas等参数)和3520个域名级别的追踪器拦截,无需额外配置即可绕过常见反爬机制
- **并行爬取能力**:提供`obscura scrape`命令支持多URL并发抓取,配合`--concurrency`参数可灵活控制worker数量,适合批量数据采集场景
- **开源承诺与商业化路径**:核心引擎采用Apache 2.0协议且承诺永不功能阉割,同时正在开发托管版Obscura Cloud提供代理和基础设施服务
文章URL:
https://github.com/h4ckf0r0day/obscura
《Pixelle-Video:AI全自动短视频引擎》
标签:#AI工具 #视频生成 #ComfyUI #TTS #开源项目 #Streamlit #Python
总结:
Pixelle-Video 是一款开源的 AI 全自动短视频生成工具,通过 Streamlit 提供可视化 Web 界面,支持从文案创作、AI 配图、语音合成到视频拼接的完整工作流,用户只需输入主题即可一键生成带 BGM 的短视频,且支持完全本地免费运行。
文章要点:
- **全流程自动化**:输入主题后,AI 自动完成脚本撰写、分镜规划、图片生成、语音配音和视频合成,几分钟内输出成品短视频
- **灵活的内容输入**:支持"AI 生成内容"模式(输入主题自动写稿)和"固定文案"模式(直接粘贴现成文案),满足不同创作需求
- **丰富的语音与视觉配置**:TTS 支持 Edge-TTS、Index-TTS 等多种工作流,还可上传参考音频进行声音克隆;图像生成支持本地 ComfyUI 和云端 RunningHub,风格可通过提示词前缀自由定制
- **可扩展的模板系统**:提供静态、图片、视频三类 HTML 模板,支持竖屏/横屏/方形多种尺寸,懂前端的同学还能自定义模板
- **零成本运行方案**:本地部署 Ollama + ComfyUI 可实现完全免费使用;也支持通义千问、GPT、DeepSeek 等云端 API 作为备选
- **开箱即用的部署方式**:Windows 用户有免配置一键整合包,macOS/Linux 用户通过 uv 即可快速启动,门槛非常友好
文章URL:https://github.com/AIDC-AI/Pixelle-Video
标签:#AI工具 #视频生成 #ComfyUI #TTS #开源项目 #Streamlit #Python
总结:
Pixelle-Video 是一款开源的 AI 全自动短视频生成工具,通过 Streamlit 提供可视化 Web 界面,支持从文案创作、AI 配图、语音合成到视频拼接的完整工作流,用户只需输入主题即可一键生成带 BGM 的短视频,且支持完全本地免费运行。
文章要点:
- **全流程自动化**:输入主题后,AI 自动完成脚本撰写、分镜规划、图片生成、语音配音和视频合成,几分钟内输出成品短视频
- **灵活的内容输入**:支持"AI 生成内容"模式(输入主题自动写稿)和"固定文案"模式(直接粘贴现成文案),满足不同创作需求
- **丰富的语音与视觉配置**:TTS 支持 Edge-TTS、Index-TTS 等多种工作流,还可上传参考音频进行声音克隆;图像生成支持本地 ComfyUI 和云端 RunningHub,风格可通过提示词前缀自由定制
- **可扩展的模板系统**:提供静态、图片、视频三类 HTML 模板,支持竖屏/横屏/方形多种尺寸,懂前端的同学还能自定义模板
- **零成本运行方案**:本地部署 Ollama + ComfyUI 可实现完全免费使用;也支持通义千问、GPT、DeepSeek 等云端 API 作为备选
- **开箱即用的部署方式**:Windows 用户有免配置一键整合包,macOS/Linux 用户通过 uv 即可快速启动,门槛非常友好
文章URL:https://github.com/AIDC-AI/Pixelle-Video
《OpenWolf:Claude Code 的开源"第二大脑"》
标签:#AI辅助编程 #Claude_Code #Token优化 #开发工具
总结:OpenWolf 是一款为 Claude Code CLI 设计的开源中间件,通过 6 个无感知的生命周期钩子脚本,为 AI 助手提供项目文件索引、学习记忆和 Token 追踪能力。实测在 20 个项目、132+ 会话中平均减少 65.8% 的 Token 消耗,最高可达 80%,同时拦截 71% 的重复文件读取,让 Claude Code 从"盲目工作"变成"有记忆地智能工作"。
文章要点:
- 解决 Claude Code 的"盲目"痛点:Claude 在读取文件前不知道文件内容,会重复读取同一文件、扫描整个目录找函数,导致 Token 消耗过快
- 6 个钩子脚本实现无感知增强:基于 SessionStart、PreToolUse、PostToolUse、Stop 三个生命周期事件,自动执行文件索引、重复读取拦截、偏好记忆和 Token 估算,无需改变任何工作习惯
- 核心文件系统构建"第二大脑":
- 显著的 Token 节省效果:大型项目实测从 250 万 Token 降至 42.5 万(节省约 80%),20 个项目平均节省 65.8%,拦截 71% 的重复读取,累计节省超 200 万 Token
- 纯本地运行零额外成本:所有钩子均为纯 Node.js 文件 I/O,无网络请求、无外部 API 调用,仅依赖 Node.js 20+ 和 Claude Code CLI
- 额外实用功能:内置 Design QC 自动截图供 Claude 评估 UI,Reframe 功能提供 12 个 UI 框架的迁移知识库,支持实时 Web 仪表盘查看统计数据
- 诚实的局限性说明:Claude Code 钩子功能较新偶有可靠性问题,Token 追踪基于字符比例估算(误差约 15%),cerebrum.md 依赖 Claude 遵守指令更新(合规率 85-90%)
文章URL:https://github.com/cytostack/openwolf
标签:#AI辅助编程 #Claude_Code #Token优化 #开发工具
总结:OpenWolf 是一款为 Claude Code CLI 设计的开源中间件,通过 6 个无感知的生命周期钩子脚本,为 AI 助手提供项目文件索引、学习记忆和 Token 追踪能力。实测在 20 个项目、132+ 会话中平均减少 65.8% 的 Token 消耗,最高可达 80%,同时拦截 71% 的重复文件读取,让 Claude Code 从"盲目工作"变成"有记忆地智能工作"。
文章要点:
- 解决 Claude Code 的"盲目"痛点:Claude 在读取文件前不知道文件内容,会重复读取同一文件、扫描整个目录找函数,导致 Token 消耗过快
- 6 个钩子脚本实现无感知增强:基于 SessionStart、PreToolUse、PostToolUse、Stop 三个生命周期事件,自动执行文件索引、重复读取拦截、偏好记忆和 Token 估算,无需改变任何工作习惯
- 核心文件系统构建"第二大脑":
anatomy.md 记录项目文件地图与 Token 估算,cerebrum.md 积累用户偏好与"不再重复"清单,buglog.json 归档历史 Bug 修复方案,token-ledger.json 追踪终身 Token 消耗 - 显著的 Token 节省效果:大型项目实测从 250 万 Token 降至 42.5 万(节省约 80%),20 个项目平均节省 65.8%,拦截 71% 的重复读取,累计节省超 200 万 Token
- 纯本地运行零额外成本:所有钩子均为纯 Node.js 文件 I/O,无网络请求、无外部 API 调用,仅依赖 Node.js 20+ 和 Claude Code CLI
- 额外实用功能:内置 Design QC 自动截图供 Claude 评估 UI,Reframe 功能提供 12 个 UI 框架的迁移知识库,支持实时 Web 仪表盘查看统计数据
- 诚实的局限性说明:Claude Code 钩子功能较新偶有可靠性问题,Token 追踪基于字符比例估算(误差约 15%),cerebrum.md 依赖 Claude 遵守指令更新(合规率 85-90%)
文章URL:https://github.com/cytostack/openwolf
《大规模AI代码审查编排实践》
标签:#DevOps #AI辅助编程 #CodeReview #CI_CD #LLM #多智能体系统 #Cloudflare #OpenCode #插件架构
总结:
Cloudflare为解决代码审查瓶颈,放弃单一LLM直接审diff的噪音方案,转而基于开源代理OpenCode构建CI原生编排系统。该系统采用可组合插件架构,通过风险分级(Trivial/Lite/Full)动态调度最多7个专业审查智能体(安全、性能、质量等),由协调者代理去重、过滤并做出审批决策。系统已在数万MR上运行,能精准拦截真实漏洞,同时保留"break glass"人工逃生通道。
文章要点:
- **从噪音到精准**:早期直接把git diff塞给LLM的方案产生了大量幻觉和模糊建议,团队很快意识到需要专业化分工而非单一通用提示词
- **插件化架构**:系统基于OpenCode构建,采用完全解耦的插件体系(GitLab、AI网关、合规检查、遥测等各自独立),通过`ConfigureContext` API贡献配置,最终组装成`opencode.json`
- **多智能体协作**:最多同时启动7个专业审查者各司其职,协调者代理负责去重、重新分类、合理性验证,并按严格规则做出approve/approve_with_comments/unapprove/request_changes四级决策
- **风险分级省成本**:按代码行数和文件数将MR分为Trivial/Lite/Full三级,小改动只派2个轻量代理且降级模型,安全相关文件永远触发Full审查,避免用大模型审typo
- **工程细节满满**:使用JSONL流式处理避免内存爆炸;通过磁盘patch文件共享上下文节省7倍token;清理XML边界标签防止提示注入;30秒心跳日志消除"模型思考中"的误取消
文章URL:https://blog.cloudflare.com/ai-code-review
标签:#DevOps #AI辅助编程 #CodeReview #CI_CD #LLM #多智能体系统 #Cloudflare #OpenCode #插件架构
总结:
Cloudflare为解决代码审查瓶颈,放弃单一LLM直接审diff的噪音方案,转而基于开源代理OpenCode构建CI原生编排系统。该系统采用可组合插件架构,通过风险分级(Trivial/Lite/Full)动态调度最多7个专业审查智能体(安全、性能、质量等),由协调者代理去重、过滤并做出审批决策。系统已在数万MR上运行,能精准拦截真实漏洞,同时保留"break glass"人工逃生通道。
文章要点:
- **从噪音到精准**:早期直接把git diff塞给LLM的方案产生了大量幻觉和模糊建议,团队很快意识到需要专业化分工而非单一通用提示词
- **插件化架构**:系统基于OpenCode构建,采用完全解耦的插件体系(GitLab、AI网关、合规检查、遥测等各自独立),通过`ConfigureContext` API贡献配置,最终组装成`opencode.json`
- **多智能体协作**:最多同时启动7个专业审查者各司其职,协调者代理负责去重、重新分类、合理性验证,并按严格规则做出approve/approve_with_comments/unapprove/request_changes四级决策
- **风险分级省成本**:按代码行数和文件数将MR分为Trivial/Lite/Full三级,小改动只派2个轻量代理且降级模型,安全相关文件永远触发Full审查,避免用大模型审typo
- **工程细节满满**:使用JSONL流式处理避免内存爆炸;通过磁盘patch文件共享上下文节省7倍token;清理XML边界标签防止提示注入;30秒心跳日志消除"模型思考中"的误取消
文章URL:https://blog.cloudflare.com/ai-code-review
《MCP已死,CLI万岁》
标签:#AI工具 #开发工具 #MCP #CLI #LLM工具链 #Anthropic #AI代理
总结:
作者认为Anthropic推出的MCP协议正走向消亡,主张LLM应直接使用CLI工具而非专用协议。CLI具备可组合性、调试友好、认证成熟、无额外进程等优势,而MCP存在初始化不稳定、重复认证、权限粒度粗等实际痛点。最好的工具应同时服务人类与机器,开发者应优先打磨API和CLI。
文章要点:
- LLM天生就会用命令行:它们在海量man page、Stack Overflow和shell脚本中训练过,给Claude一个CLI和文档,它就能直接上手,根本不需要新协议
- 调试体验天差地别:CLI出问题你可以亲自跑一遍同样的命令,看到和AI完全一致的输入输出;MCP出错却要钻JSON传输日志,排查像考古
- 管道和组合才是生产力:CLI能通过`jq`、`grep`、重定向灵活处理数据;MCP面对大型Terraform计划只能全塞进上下文窗口,或额外写过滤逻辑,费力不讨好
- 认证体系早已成熟:`aws`、`gh`、`kubectl`都有经过实战检验的SSO和凭证管理,AI和人类共用同一套流程,坏了就按老办法修,不用学MCP专属排错
- 没有后台进程更省心:MCP服务器是常驻进程,会挂起、会掉线、需要状态管理;CLI只是磁盘上的二进制文件,随用随走,干净利落
- 日常使用的真实摩擦:MCP初始化经常抽风要重启,多工具反复认证让人崩溃,权限控制只有白名单名字做不到只读或参数级限制;CLI完全没有这些烦恼
- MCP并非毫无价值:只有当某个工具确实没有CLI时,MCP才是合理选择,标准化接口在极少数场景也有意义
- 给工具开发者的建议:如果你公司在砸钱做MCP服务器却没有官方CLI,赶紧停下来——先把API和CLI做好,AI代理自己会搞定剩下的
文章URL:https://ejholmes.github.io/2026/02/28/mcp-is-dead-long-live-the-cli.html
标签:#AI工具 #开发工具 #MCP #CLI #LLM工具链 #Anthropic #AI代理
总结:
作者认为Anthropic推出的MCP协议正走向消亡,主张LLM应直接使用CLI工具而非专用协议。CLI具备可组合性、调试友好、认证成熟、无额外进程等优势,而MCP存在初始化不稳定、重复认证、权限粒度粗等实际痛点。最好的工具应同时服务人类与机器,开发者应优先打磨API和CLI。
文章要点:
- LLM天生就会用命令行:它们在海量man page、Stack Overflow和shell脚本中训练过,给Claude一个CLI和文档,它就能直接上手,根本不需要新协议
- 调试体验天差地别:CLI出问题你可以亲自跑一遍同样的命令,看到和AI完全一致的输入输出;MCP出错却要钻JSON传输日志,排查像考古
- 管道和组合才是生产力:CLI能通过`jq`、`grep`、重定向灵活处理数据;MCP面对大型Terraform计划只能全塞进上下文窗口,或额外写过滤逻辑,费力不讨好
- 认证体系早已成熟:`aws`、`gh`、`kubectl`都有经过实战检验的SSO和凭证管理,AI和人类共用同一套流程,坏了就按老办法修,不用学MCP专属排错
- 没有后台进程更省心:MCP服务器是常驻进程,会挂起、会掉线、需要状态管理;CLI只是磁盘上的二进制文件,随用随走,干净利落
- 日常使用的真实摩擦:MCP初始化经常抽风要重启,多工具反复认证让人崩溃,权限控制只有白名单名字做不到只读或参数级限制;CLI完全没有这些烦恼
- MCP并非毫无价值:只有当某个工具确实没有CLI时,MCP才是合理选择,标准化接口在极少数场景也有意义
- 给工具开发者的建议:如果你公司在砸钱做MCP服务器却没有官方CLI,赶紧停下来——先把API和CLI做好,AI代理自己会搞定剩下的
文章URL:https://ejholmes.github.io/2026/02/28/mcp-is-dead-long-live-the-cli.html
《为AI智能体设计产品:从界面思维到智能体思维》
标签:#AI产品 #MCP #智能体交互设计 #产品架构 #API设计 #Salesforce #Ramp #Notion
总结:
本文由Ramp产品负责人Teddy Riker撰写,探讨了AI智能体时代产品设计的范式转变。作者指出,未来80%的软件交互将通过AI智能体完成,产品团队需要从"为用户设计界面"转向"为智能体设计能力"。文章以Ramp、Salesforce、Notion等案例,提出了三大核心设计原则:主动提供成功所需的上下文规范、建立基于工具调用的反馈循环、识别并填补智能体间的上下文缺口。
文章要点:
- **交互范式正在翻转**:传统模式是"用户→界面→数据库",而AI时代正在变成"用户→用户智能体→软件智能体→数据库"。界面不会消失,但80%的交互将发生在智能体之间,产品团队需要为"看不见的用户"重新设计。
- **Salesforce的激进转型**:这家27年的传统软件巨头推出"Headless 360"计划,将平台所有能力暴露为API、MCP工具或CLI命令,承认图形界面CRM的护城河正在被侵蚀,主动拥抱"无界面"未来。
- **教会智能体如何成功**:Notion的MCP设计是个正面教材——它在工具描述中明确要求智能体先读取Markdown规范再操作,确保格式准确。相比之下,Slack MCP让智能体"自己摸索"格式规则,结果用户反而要花更多时间修正。产品团队应该主动告诉调用方"你需要知道什么才能成功"。
- **用反馈循环驱动产品迭代**:Ramp通过三个机制解决智能体交互的可观测性难题:要求每次工具调用附带`rationale`参数解释意图、提供独立的反馈提交工具、在特定工具中预埋上下文种子。这些反馈比人类用户更具体、更一致,能直接转化为新功能需求。
- **填补上下文缺口是核心设计挑战**:在"用户智能体↔️软件智能体"的协作中,双方各自掌握对方没有的信息。优秀的设计不是让智能体去猜技术细节(如GL code),而是让它们交换语义上下文(如"这是客户晚餐还是团队建设"),由各自擅长的那一方完成最终决策。
- **敷衍智能体支持的产品会被淘汰**:仅仅发布一个MCP服务器、勾上"支持AI"的 checkbox 是不够的。客户最终会流向那些认真打磨智能体体验、真正理解"最后签支票的可能是AI"的产品。
文章URL:https://baoyu.io/blog/2026-04-24/teddy-riker-2047312986696454584
标签:#AI产品 #MCP #智能体交互设计 #产品架构 #API设计 #Salesforce #Ramp #Notion
总结:
本文由Ramp产品负责人Teddy Riker撰写,探讨了AI智能体时代产品设计的范式转变。作者指出,未来80%的软件交互将通过AI智能体完成,产品团队需要从"为用户设计界面"转向"为智能体设计能力"。文章以Ramp、Salesforce、Notion等案例,提出了三大核心设计原则:主动提供成功所需的上下文规范、建立基于工具调用的反馈循环、识别并填补智能体间的上下文缺口。
文章要点:
- **交互范式正在翻转**:传统模式是"用户→界面→数据库",而AI时代正在变成"用户→用户智能体→软件智能体→数据库"。界面不会消失,但80%的交互将发生在智能体之间,产品团队需要为"看不见的用户"重新设计。
- **Salesforce的激进转型**:这家27年的传统软件巨头推出"Headless 360"计划,将平台所有能力暴露为API、MCP工具或CLI命令,承认图形界面CRM的护城河正在被侵蚀,主动拥抱"无界面"未来。
- **教会智能体如何成功**:Notion的MCP设计是个正面教材——它在工具描述中明确要求智能体先读取Markdown规范再操作,确保格式准确。相比之下,Slack MCP让智能体"自己摸索"格式规则,结果用户反而要花更多时间修正。产品团队应该主动告诉调用方"你需要知道什么才能成功"。
- **用反馈循环驱动产品迭代**:Ramp通过三个机制解决智能体交互的可观测性难题:要求每次工具调用附带`rationale`参数解释意图、提供独立的反馈提交工具、在特定工具中预埋上下文种子。这些反馈比人类用户更具体、更一致,能直接转化为新功能需求。
- **填补上下文缺口是核心设计挑战**:在"用户智能体↔️软件智能体"的协作中,双方各自掌握对方没有的信息。优秀的设计不是让智能体去猜技术细节(如GL code),而是让它们交换语义上下文(如"这是客户晚餐还是团队建设"),由各自擅长的那一方完成最终决策。
- **敷衍智能体支持的产品会被淘汰**:仅仅发布一个MCP服务器、勾上"支持AI"的 checkbox 是不够的。客户最终会流向那些认真打磨智能体体验、真正理解"最后签支票的可能是AI"的产品。
文章URL:https://baoyu.io/blog/2026-04-24/teddy-riker-2047312986696454584
《AI编码代理生产级工程技能集》
标签:#AI辅助编程 #开发工具 #AI_Agent #工程规范 #ClaudeCode #Cursor #代码审查 #测试驱动开发 #CI_CD
总结:
这是一个为AI编码代理(如Claude Code、Cursor、GitHub Copilot等)设计的生产级工程技能仓库,由Addy Osmani维护。它将资深工程师在真实项目中的工作流、质量门禁和最佳实践编码为20个结构化技能,覆盖从需求定义到上线发布的完整开发生命周期,让AI代理在每次编码时都能保持一致的专业水准,避免走"最短路径"而跳过测试、审查等关键环节。
文章要点:
- 六阶段开发流水线:从Define(定义需求)→ Plan(拆解任务)→ Build(增量编码)→ Verify(验证测试)→ Review(质量门禁)→ Ship(安全发布),像工厂流水线一样规范AI的每一步动作
- 7个斜杠命令即开即用:
- 20个实战技能全覆盖:从API设计、前端工程、TDD测试驱动,到性能优化、安全加固、Git工作流、CI/CD自动化,每个技能都自带步骤清单、验证标准和"反找借口"表格(比如AI想跳过测试时,会被技能里的反驳论据怼回去😄)
- 多工具无缝兼容:Claude Code一键插件安装,Cursor复制到rules目录,Gemini CLI、Windsurf、GitHub Copilot、Kiro等主流AI编程工具都能直接用,技能就是纯Markdown,通吃所有支持系统提示词的代理
- Google工程文化落地:融入了Hyrum定律、Beyonce规则、测试金字塔、Chesterton围栏等Google实战智慧,不是泛泛而谈的理论,而是嵌入到每一步工作流中的可执行标准
文章URL:https://github.com/addyosmani/agent-skills
标签:#AI辅助编程 #开发工具 #AI_Agent #工程规范 #ClaudeCode #Cursor #代码审查 #测试驱动开发 #CI_CD
总结:
这是一个为AI编码代理(如Claude Code、Cursor、GitHub Copilot等)设计的生产级工程技能仓库,由Addy Osmani维护。它将资深工程师在真实项目中的工作流、质量门禁和最佳实践编码为20个结构化技能,覆盖从需求定义到上线发布的完整开发生命周期,让AI代理在每次编码时都能保持一致的专业水准,避免走"最短路径"而跳过测试、审查等关键环节。
文章要点:
- 六阶段开发流水线:从Define(定义需求)→ Plan(拆解任务)→ Build(增量编码)→ Verify(验证测试)→ Review(质量门禁)→ Ship(安全发布),像工厂流水线一样规范AI的每一步动作
- 7个斜杠命令即开即用:
/spec写需求文档、/build增量开发、/test跑测试、/review代码审查……输入命令就能自动激活对应的技能组合,非常顺手- 20个实战技能全覆盖:从API设计、前端工程、TDD测试驱动,到性能优化、安全加固、Git工作流、CI/CD自动化,每个技能都自带步骤清单、验证标准和"反找借口"表格(比如AI想跳过测试时,会被技能里的反驳论据怼回去😄)
- 多工具无缝兼容:Claude Code一键插件安装,Cursor复制到rules目录,Gemini CLI、Windsurf、GitHub Copilot、Kiro等主流AI编程工具都能直接用,技能就是纯Markdown,通吃所有支持系统提示词的代理
- Google工程文化落地:融入了Hyrum定律、Beyonce规则、测试金字塔、Chesterton围栏等Google实战智慧,不是泛泛而谈的理论,而是嵌入到每一步工作流中的可执行标准
文章URL:https://github.com/addyosmani/agent-skills
《用 React、GSAP 和 AI 打造 Maxima Therapy 网站》
标签:#前端 #React #GSAP #TailwindCSS #ReactRouter #AI辅助开发 #创意编程 #Lottie #MatterJS #ScrollTrigger
总结:
本文是 Codrops 上的一篇案例复盘,记录了团队为神经多样性支持机构 Maxima Therapy 打造高互动、高插画风格网站的全过程。文章详细介绍了技术栈选型(Sanity + React Router + GSAP + TailwindCSS)、多个核心交互模块的实现思路(可拖拽轮播、SVG 水波纹、物理绳索、形状变形、贴纸动效),以及 AI(Claude Code)在实际开发中的辅助作用与局限。对于想在前端项目中融合创意动画与 AI 提效的开发者来说,这是一份非常接地气的实战参考。
文章要点:
- 技术栈选型很务实:团队选了 React Router(而非 Next.js)做静态生成,搭配 Sanity 做 CMS、Cloudflare Pages 托管,理由是配置更轻量;GSAP + Lenis 负责动画和滚动平滑,TailwindCSS 负责样式,TypeScript 做类型检查
- 首页轮播的交互设计很巧妙:把四个节目板块拆成四个旋转的
- SVG 水波纹效果用 AI 辅助生成:Claude Code 帮忙把原始 SVG 路径转换成带 50 个控制点的系统,再结合 GSAP 实现鼠标触发的涟漪动画——AI 在创意编码这类"繁琐但规则明确"的任务上表现不错
- Lottie 动画与 Canvas 背景混合:通过离屏 Canvas 绘制固定图案,再用 Lottie 的 Canvas 渲染模式做遮罩,最后用
- 物理引擎让页面更有生命力:招聘页用 Matter.js 模拟"supports"单词被两根绳索悬挂的物理效果,绳索由复合体堆叠而成,SVG 文字根据物理模拟结果实时位移
- AI 是"得力助手"但不是"万能替身":Claude Code 在 SVG 优化、Sanity 数据模型扩展、TypeScript 类型生成上帮了大忙,但也会出现结果不一致、擅自改动数据获取模式、甚至"幻觉"出不存在 SVG 路径的情况;团队建议把 AI 用在范围明确的小任务上
- ScrollTrigger 让滚动交互管理很轻松:配合
文章URL:
https://tympanus.net/codrops/2026/04/06/building-the-maxima-therapy-website-react-gsap-and-dabbling-with-ai/
标签:#前端 #React #GSAP #TailwindCSS #ReactRouter #AI辅助开发 #创意编程 #Lottie #MatterJS #ScrollTrigger
总结:
本文是 Codrops 上的一篇案例复盘,记录了团队为神经多样性支持机构 Maxima Therapy 打造高互动、高插画风格网站的全过程。文章详细介绍了技术栈选型(Sanity + React Router + GSAP + TailwindCSS)、多个核心交互模块的实现思路(可拖拽轮播、SVG 水波纹、物理绳索、形状变形、贴纸动效),以及 AI(Claude Code)在实际开发中的辅助作用与局限。对于想在前端项目中融合创意动画与 AI 提效的开发者来说,这是一份非常接地气的实战参考。
文章要点:
- 技术栈选型很务实:团队选了 React Router(而非 Next.js)做静态生成,搭配 Sanity 做 CMS、Cloudflare Pages 托管,理由是配置更轻量;GSAP + Lenis 负责动画和滚动平滑,TailwindCSS 负责样式,TypeScript 做类型检查
- 首页轮播的交互设计很巧妙:把四个节目板块拆成四个旋转的
<div>,只有当前可见的板块才响应交互;切换时触发路由变化,但轮播组件通过布局隔离避免了不必要的重渲染- SVG 水波纹效果用 AI 辅助生成:Claude Code 帮忙把原始 SVG 路径转换成带 50 个控制点的系统,再结合 GSAP 实现鼠标触发的涟漪动画——AI 在创意编码这类"繁琐但规则明确"的任务上表现不错
- Lottie 动画与 Canvas 背景混合:通过离屏 Canvas 绘制固定图案,再用 Lottie 的 Canvas 渲染模式做遮罩,最后用
globalCompositeOperation 合成,实现了滚动联动的背景效果- 物理引擎让页面更有生命力:招聘页用 Matter.js 模拟"supports"单词被两根绳索悬挂的物理效果,绳索由复合体堆叠而成,SVG 文字根据物理模拟结果实时位移
- AI 是"得力助手"但不是"万能替身":Claude Code 在 SVG 优化、Sanity 数据模型扩展、TypeScript 类型生成上帮了大忙,但也会出现结果不一致、擅自改动数据获取模式、甚至"幻觉"出不存在 SVG 路径的情况;团队建议把 AI 用在范围明确的小任务上
- ScrollTrigger 让滚动交互管理很轻松:配合
useGSAP hook 自动清理,避免了手动写 Intersection Observer 的繁琐,实现了文字显现、图片揭示、SVG 播放等丰富的滚动动效文章URL:
https://tympanus.net/codrops/2026/04/06/building-the-maxima-therapy-website-react-gsap-and-dabbling-with-ai/
《从基础学科到通用人工智能:25学科知识地图》
标签:#AI教育 #知识图谱 #AGI #跨学科学习 #深度学习 #机器学习 #强化学习 #认知科学 #DataWhale
总结:
这是一份由DataWhale社区维护的AI跨学科知识导航页,将支撑通用人工智能的25门基础学科按数学、计算、认知、决策、物理哲学五大簇组织,并提供多条能力形成路径(表示训练、结构关系、智能体控制、自然智能与AGI),帮助学习者从"学科目录"走向"能力路径",降低跨学科学习成本,避免在庞杂专题中迷路。
文章要点:
- AI本质是跨学科汇流系统,从1943年McCulloch-Pitts神经元到2022年后大模型与Agent,历史脉络清晰展示了数学、工程、认知、哲学等学科的交汇
- 25门学科被系统分为五大簇:数学与形式基础(概率/线代/优化/信息论等)、计算与系统工程(数值分析/控制论/硬件并行等)、认知生物与语言(神经科学/心理学/语言学等)、决策交互与社会机制(运筹学/博弈论/经济学)、物理与哲学基础(统计物理/哲学)
- 提供了五条能力形成路径:表示与训练、结构与关系、不确定性与因果、控制与智能体、自然智能与AGI,让学习围绕"能力如何长出来"而非"学科如何分类"来组织
- 针对不同目标读者定制了四条入门路线:机器学习/深度学习、结构化AI/图学习、强化学习/智能体、推理/AGI,并精选10个优先专题作为"最短抓手"
- 核心定位是"导航页"而非"正文替代者",强调通过横向跳转、反向链接和跨学科汇流点来提升学习效率,避免线性单学科推进
文章URL:https://github.com/datawhalechina/Path2AGI
标签:#AI教育 #知识图谱 #AGI #跨学科学习 #深度学习 #机器学习 #强化学习 #认知科学 #DataWhale
总结:
这是一份由DataWhale社区维护的AI跨学科知识导航页,将支撑通用人工智能的25门基础学科按数学、计算、认知、决策、物理哲学五大簇组织,并提供多条能力形成路径(表示训练、结构关系、智能体控制、自然智能与AGI),帮助学习者从"学科目录"走向"能力路径",降低跨学科学习成本,避免在庞杂专题中迷路。
文章要点:
- AI本质是跨学科汇流系统,从1943年McCulloch-Pitts神经元到2022年后大模型与Agent,历史脉络清晰展示了数学、工程、认知、哲学等学科的交汇
- 25门学科被系统分为五大簇:数学与形式基础(概率/线代/优化/信息论等)、计算与系统工程(数值分析/控制论/硬件并行等)、认知生物与语言(神经科学/心理学/语言学等)、决策交互与社会机制(运筹学/博弈论/经济学)、物理与哲学基础(统计物理/哲学)
- 提供了五条能力形成路径:表示与训练、结构与关系、不确定性与因果、控制与智能体、自然智能与AGI,让学习围绕"能力如何长出来"而非"学科如何分类"来组织
- 针对不同目标读者定制了四条入门路线:机器学习/深度学习、结构化AI/图学习、强化学习/智能体、推理/AGI,并精选10个优先专题作为"最短抓手"
- 核心定位是"导航页"而非"正文替代者",强调通过横向跳转、反向链接和跨学科汇流点来提升学习效率,避免线性单学科推进
文章URL:https://github.com/datawhalechina/Path2AGI