锤子前端 - Now vibe coding, so learning hammer FE ?

Now vibe coding, so learning hammer FE ?

《CC-Connect：AI编程助手桥接工具》

标签：#AI编程工具 #即时通讯集成 #ClaudeCode #Cursor #GeminiCLI #Codex #飞书 #钉钉 #Slack #Telegram #Discord #LINE #企业微信 #远程开发

总结：

CC-Connect是一款开源桥接工具，它把本地AI编程助手（如Claude Code、Cursor、Gemini CLI、Codex）和主流即时通讯平台连接起来。开发者无需公网IP，就能在手机或任何设备上随时与AI助手对话，实现远程协作编程。

文章要点：

- **打破终端限制**：把Claude Code、Cursor等本地AI编程工具"搬"到飞书、钉钉、Slack、Telegram、Discord、LINE和企业微信里，随时随地都能聊代码
- **零公网IP方案**：不需要折腾内网穿透或买服务器，本地跑起来就能让远程设备连上你的AI开发助手
- **多平台全覆盖**：支持7大主流通讯平台，从国内办公的飞书钉钉到海外常用的Slack、Telegram都照顾到了
- **多模型兼容**：不只是 Claude，Cursor、Gemini CLI、Codex 这些热门AI编程工具统统能接入
- **开发场景友好**：特别适合需要移动办公、团队协作或者不想一直盯着终端窗口的开发者

文章URL：

https://github.com/chenhg5/cc-connect

GitHub

GitHub - chenhg5/cc-connect: Bridge local AI coding agents (Claude Code, Cursor, Gemini CLI, Codex) to messaging platforms (Feishu/Lark…

Bridge local AI coding agents (Claude Code, Cursor, Gemini CLI, Codex) to messaging platforms (Feishu/Lark, DingTalk, Slack, Telegram, Discord, LINE, WeChat Work). Chat with your AI dev assistant f...

AI编程工具即时通讯集成 ClaudeCode Cursor GeminiCLI Codex 飞书钉钉 Slack Telegram Discord LINE 企业微信远程开发

2 天前

《Agent Harness 的解剖学：将 LLM 转化为工作引擎的系统工程》

标签：#AI_Agent #LLM #LangChain #Harness_Engineering #Context_Management #Tool_Orchestration

总结：Agent Harness 是包裹在大模型之外的全套"脚手架"——包括系统提示词、工具调用、文件系统、沙盒环境、记忆管理和编排逻辑等。它把只能输入输出文本的"裸模型"，改造成能持久化状态、执行代码、自主规划并长期协作的合格智能体。文章从模型能力边界出发，逆向推导出每个 Harness 组件存在的必然性，并指出 Harness 工程与模型训练正在协同进化，优化 Harness 本身就能让同一模型在基准测试上从 Top 30 跃升至 Top 5。

文章要点：
- Agent = Model + Harness：如果你不是模型本身，那你就是 Harness。Harness 是除模型权重外的一切代码、配置与执行逻辑，负责把模型的"智商"转化为"产能"
- 模型天生会"健忘"：裸模型只能处理上下文窗口内的信息，无法跨会话记住状态、执行代码或获取实时知识，这些"超能力"全靠 Harness 赋予
- 文件系统是最底层的基础设施：给 Agent 一个工作目录，它就能读写数据、卸载超长上下文、还能让多个 Agent 像同事一样通过共享文件协作
- Bash + 代码执行是万能瑞士军刀：与其为每个场景预写工具，不如直接给 Agent 一个终端，让它现场写代码、装依赖、自己造工具解决问题
- 沙盒让 Agent 安全地"动手"：在隔离环境里跑代码、测效果、看日志，既防手滑删库，又能按需扩容、用完即焚
- 记忆靠"上下文注入"实现：通过 AGENTS.md 等记忆文件标准，把历史经验塞进新会话；再配合网络搜索和 MCP 工具，突破训练数据的时间 cutoff
- 上下文腐烂是隐形杀手：随着对话变长，模型性能会断崖下跌。Harness 通过 Compaction（智能摘要）、Tool 输出卸载和 Skills 渐进式加载来保护宝贵的上下文空间
- 长程任务需要"接力跑"：Ralph Loop 机制让 Agent 在上下文耗尽时，从文件系统读取进度、换一块"干净"上下文继续干；配合 git 记录和自验证循环，实现跨会话的复杂项目开发
- Harness 与模型在"共同进化"：Claude Code、Codex 等产品会把 Harness 逻辑也放进后训练环节，但有趣的是——换一套更优 Harness，同一模型排名能从 30 名外冲进前 5
- 未来 Harness 会"瘦身"但不会消失：随着模型原生规划、验证能力变强，部分 Harness 功能会被模型吸收；但就像提示工程至今仍有价值，Harness 工程作为"围绕模型智能设计系统"的学科，仍将持续发光

文章URL：https://www.langchain.com/blog/the-anatomy-of-an-agent-harness

Langchain

The Anatomy of an Agent Harness

Learn how agent harnesses transform AI models into autonomous work engines. Explore core components: filesystems, sandboxes, and memory.

AI_Agent LLM LangChain Harness_Engineering Context_Management Tool_Orchestration

6 天前

《OpenWolf：Claude Code 的开源"第二大脑"》

标签：#AI辅助编程 #Claude_Code #Token优化 #开发工具

总结：OpenWolf 是一款为 Claude Code CLI 设计的开源中间件，通过 6 个无感知的生命周期钩子脚本，为 AI 助手提供项目文件索引、学习记忆和 Token 追踪能力。实测在 20 个项目、132+ 会话中平均减少 65.8% 的 Token 消耗，最高可达 80%，同时拦截 71% 的重复文件读取，让 Claude Code 从"盲目工作"变成"有记忆地智能工作"。

文章要点：
- 解决 Claude Code 的"盲目"痛点：Claude 在读取文件前不知道文件内容，会重复读取同一文件、扫描整个目录找函数，导致 Token 消耗过快
- 6 个钩子脚本实现无感知增强：基于 SessionStart、PreToolUse、PostToolUse、Stop 三个生命周期事件，自动执行文件索引、重复读取拦截、偏好记忆和 Token 估算，无需改变任何工作习惯
- 核心文件系统构建"第二大脑"：anatomy.md 记录项目文件地图与 Token 估算，cerebrum.md 积累用户偏好与"不再重复"清单，buglog.json 归档历史 Bug 修复方案，token-ledger.json 追踪终身 Token 消耗
- 显著的 Token 节省效果：大型项目实测从 250 万 Token 降至 42.5 万（节省约 80%），20 个项目平均节省 65.8%，拦截 71% 的重复读取，累计节省超 200 万 Token
- 纯本地运行零额外成本：所有钩子均为纯 Node.js 文件 I/O，无网络请求、无外部 API 调用，仅依赖 Node.js 20+ 和 Claude Code CLI
- 额外实用功能：内置 Design QC 自动截图供 Claude 评估 UI，Reframe 功能提供 12 个 UI 框架的迁移知识库，支持实时 Web 仪表盘查看统计数据
- 诚实的局限性说明：Claude Code 钩子功能较新偶有可靠性问题，Token 追踪基于字符比例估算（误差约 15%），cerebrum.md 依赖 Claude 遵守指令更新（合规率 85-90%）

文章URL：https://github.com/cytostack/openwolf

GitHub

GitHub - cytostack/openwolf: Sharper context. Fewer tokens. Open-source middleware for Claude Code.

Sharper context. Fewer tokens. Open-source middleware for Claude Code. - cytostack/openwolf

AI辅助编程 Claude_Code Token优化开发工具

17:39 · 2026年4月26日 · 周日

《AI编码代理生产级工程技能集》

标签：#AI辅助编程 #开发工具 #AI_Agent #工程规范 #ClaudeCode #Cursor #代码审查 #测试驱动开发 #CI_CD

总结：
这是一个为AI编码代理（如Claude Code、Cursor、GitHub Copilot等）设计的生产级工程技能仓库，由Addy Osmani维护。它将资深工程师在真实项目中的工作流、质量门禁和最佳实践编码为20个结构化技能，覆盖从需求定义到上线发布的完整开发生命周期，让AI代理在每次编码时都能保持一致的专业水准，避免走"最短路径"而跳过测试、审查等关键环节。

文章要点：
- 六阶段开发流水线：从Define（定义需求）→ Plan（拆解任务）→ Build（增量编码）→ Verify（验证测试）→ Review（质量门禁）→ Ship（安全发布），像工厂流水线一样规范AI的每一步动作
- 7个斜杠命令即开即用：/spec写需求文档、/build增量开发、/test跑测试、/review代码审查……输入命令就能自动激活对应的技能组合，非常顺手
- 20个实战技能全覆盖：从API设计、前端工程、TDD测试驱动，到性能优化、安全加固、Git工作流、CI/CD自动化，每个技能都自带步骤清单、验证标准和"反找借口"表格（比如AI想跳过测试时，会被技能里的反驳论据怼回去😄）
- 多工具无缝兼容：Claude Code一键插件安装，Cursor复制到rules目录，Gemini CLI、Windsurf、GitHub Copilot、Kiro等主流AI编程工具都能直接用，技能就是纯Markdown，通吃所有支持系统提示词的代理
- Google工程文化落地：融入了Hyrum定律、Beyonce规则、测试金字塔、Chesterton围栏等Google实战智慧，不是泛泛而谈的理论，而是嵌入到每一步工作流中的可执行标准

文章URL：https://github.com/addyosmani/agent-skills

GitHub

GitHub - addyosmani/agent-skills: Production-grade engineering skills for AI coding agents.

Production-grade engineering skills for AI coding agents. - addyosmani/agent-skills

AI辅助编程开发工具 AI_Agent 工程规范 ClaudeCode Cursor 代码审查测试驱动开发 CI_CD

15:00 · 2026年3月30日 · 周一

《Vibe_Coding已死：Agent工程取而代之》

标签：#AI #Agent #软件工程 #VibeCoding #多Agent协作

总结：

本文作者Collin Wilkins指出，"Vibe Coding"（凭感觉编程）这一由Karpathy提出的概念已被其本人"杀死"——现在的开发者99%时间不是在写代码，而是在编排Agent。作者分享了自己工作方式的转变：从一年前80%代码手写，到现在主要分解问题、分配Agent并审核输出。文章强调，2026年2月的四大模型发布都将多Agent编排作为核心能力，真正的差距在于工作流而非工具。

文章要点：

- Vibe Coding的致命缺陷：它只优化了代码生成速度，却忽视了后续环节——SonarSource调查显示AI代码占提交量的42%，但96%的开发者不完全信任它，仅48%会在提交前验证，审查负担真实存在且大多数团队根本没做
- Agent工程的新范式：先规划和设计系统，定义边界和契约，再让Agent在约束内执行，像分布式系统工程一样处理Agent编排——同样的分解、组件间契约、可观测性
- 多Agent成为主流：Claude的Agent团队用2000次协调会话构建了10万行C编译器，Kimi K2.5单个任务可运行100个子Agent进行1500次工具调用
- 工作方式的彻底转变：作者现在每天的工作是分解问题、分配Agent、审核输出，"写代码"已不能描述他的日常工作
- AI是动力工具而非替代品：会用AI的工程师交付更快，但只会用AI的工程师交付垃圾，关键是知道何时该提示、何时该思考
- 瓶颈已转移：写代码不再是慢的部分，思考要构建什么、如何组合、什么会在规模下崩溃——这些才是耗时的地方
- 文档化决策：LLM不存储上下文，如果想让AI助手在现有代码库上快速移动，它需要加载已记录的决策

文章URL：

https://buttondown.com/collinwilkins/archive/vibe-coding-is-dead-heres-what-replaced-it/

Buttondown

Vibe coding is dead. Here's what replaced it

What I actually do now instead of writing code.

AI Agent 软件工程 VibeCoding 多Agent协作

19:23 · 2026年3月18日 · 周三

《编程 Agent 如何重塑工程、产品和设计》

标签：#AI #编程Agent #软件开发 #产品经理 #系统设计 #VibeCoding

总结：

编程 Agent 正在颠覆传统的 EPD（工程、产品、设计）协作模式。当代码生成变得轻而易举，团队的核心价值从"写代码"转向"评审代码"。PRD 不再是流程起点，而是与原型并行的意图说明文档。这场变革让通才价值飙升，也让角色边界变得模糊——你要么是能用 Agent 独立完成功能的建设者，要么是具备顶级系统思维的专业评审者。无论出身产品、设计还是工程，拥有跨领域认知和清晰心智模型的人，将在这个新时代占据绝对优势。

文章要点：

- **PRD 的角色正在蜕变**：传统的"PRD → 设计稿 → 代码"线性流程已终结，但描述产品意图的文档依然重要。未来的 PRD 可能是结构化的、带版本管理的 Prompt，与可运行的代码原型共同构成评审基础。

- **瓶颈从实现转向评审**：当任何人都能快速生成代码原型时，工程、产品和设计的核心价值转变为把关质量——评估架构合理性、用户价值与体验流畅度。评审能力成为新的稀缺资源。

- **通才迎来黄金时代**：能同时驾驭产品思维、设计直觉和工程实现的"多面手"比以往更有影响力，因为他们省去了跨部门沟通的成本，可以直接与 Agent 协作完成端到端的交付。

- **角色分化为建设者与评审者**：团队将呈现两极分化。建设者擅长用 Agent 快速落地想法；评审者则是各领域的系统思维专家，负责把关复杂项目的质量。中间地带的从业者面临最大挑战。

- **产品意识成为全员必修课**：无论是工程师还是设计师，都需要具备判断"该做什么"的能力，否则会产生大量需要他人评审的"垃圾原型"，拖累团队效率。

- **AI 放大 PM 的能力差距**：优秀的产品经理能借助 Agent 快速验证洞见，而思考不清晰的 PM 会产生更多低质量原型，造成资源浪费并增加"半成品上线"的风险。

文章URL：

https://baoyu.io/translations/2026-03-11/coding-agents-reshaping-epd

baoyu.io

编程 Agent 如何重塑工程、产品和设计

编程 Agent 让写代码变得异常简单，EPD 的角色定位会怎么变？PRD 已死、瓶颈从实现转向评审、通才比以往更有价值。

AI 编程Agent 软件开发产品经理系统设计 VibeCoding

16:48 · 2026年3月2日 · 周一

《从写代码到管 Agent：斯坦福首门 AI 软件开发课的启示》

标签：#AI #Agent #软件工程 #斯坦福 #职业发展 #人机协作 #代码质量

总结

本文是对斯坦福讲师 Mihail Eric 访谈的解读，他是全美首门 AI 原生软件开发课程 CS146S 的负责人。文章分析了初级开发者面临的"三重风暴"（裁员潮、毕业生激增、AI 替代压力），提出 AI 时代工程师的核心竞争力已从写代码转向"管理 Agent"——即编排多个 AI Agent 完成复杂任务的能力。同时强调 Agent 友好的代码库需要充分的测试覆盖、一致的文档和清晰的设计模式，这些本质上也是对人友好的工程实践。文章还指出资深开发者往往因路径依赖抗拒 AI 工具，而初级工程师的"无知无畏"反而成为快速适应新范式的优势。

文章要点：

- **初级开发者的三重困境**：COVID 后企业裁员 20-30%、CS 毕业生十年翻倍、雇主倾向"少招人+AI"策略，叠加导致新人求职难度激增
- **Agent 编排是顶级技能**：能同时管理多个 Agent 的工程师属于顶尖 0.1%，但应从单个 Agent 开始逐步增加，避免盲目追求数量
- **上下文切换是核心挑战**：管理多 Agent 需要频繁切换注意力并记住各任务进度，这与管理人类团队的能力高度相似
- **Agent 友好代码库三要素**：充分的测试覆盖（作为显式合约）、README 与代码一致性、统一的设计模式，Agent 会在错误基础上快速复合错误
- **品味决定软件质量**：功能性软件与卓越软件的分界在于"最后一公里"的打磨，顶尖工程师在发现可能性时加速而非完成任务即停止
- **初级工程师的独特优势**：没有历史包袱，学习 AI 工具更快；"无知无畏"的特质使其敢于挑战行业难题，这是创业所需的完美品质
- **避免过度工程化陷阱**：AI 让构建变得太容易，可能导致造出精美但无人需要的产品，需先验证需求再动手开发

文章URL：https://baoyu.io/blog/2026-02-27/from-writing-code-to-managing-agents

baoyu.io

从写代码到管 Agent：斯坦福首门 AI 软件开发课的讲师说，大多数工程师还没准备好

斯坦福首门 AI 软件开发课讲师 Mihail Eric 谈初级开发者的三重困境、多 Agent 编排的真正难点、Agent 友好代码库的标准，以及为什么初级工程师的'无知无畏'在 AI 时代反而是超能力。

AI Agent 软件工程斯坦福职业发展人机协作代码质量

08:51 · 2026年2月23日 · 周一

《Claude技能构建完整指南》

标签：#AI #Claude #MCP #Agent_Skills #Workflow_Automation #开发工具 #Anthropic

总结：Anthropic官方发布的Claude技能构建指南，系统介绍了如何通过SKILL.md文件创建可复用的AI工作流。技能采用渐进式披露架构（YAML前置元数据+Markdown指令+引用资源），可与MCP工具集成实现多步骤自动化。文档涵盖规划、测试、分发全流程，提供5种设计模式（顺序工作流、多MCP协调、迭代优化等），并给出量化评估指标（90%触发准确率、零API失败率），目标帮助开发者在15-30分钟内构建生产级AI技能。

文章要点：
- 技能定义：包含SKILL.md（必需）、scripts/、references/、assets/的文件夹结构，采用kebab-case命名规范，支持Claude.ai、Claude Code和API三端通用
- 渐进式披露设计：三级加载机制（YAML元数据→SKILL.md正文→链接资源），最小化token消耗同时保持专业性
- 三大应用场景：文档/资源创建（如前端设计）、工作流自动化（如项目管理）、MCP增强（如Sentry代码审查），后者将工具访问转化为可靠工作流
- 成功指标：技能应在90%相关查询中自动触发，单次工作流工具调用次数明确，零失败API调用，用户无需提示下一步操作
- 核心设计模式：顺序工作流编排、多MCP协调（跨Figma/Linear/Slack等）、迭代优化循环、上下文感知工具选择、领域特定智能（如合规检查）
- 测试策略：触发测试（ obvious/paraphrased/negative cases）、功能测试、性能对比（有无技能时的token消耗和交互轮次差异）
- 分发方式：GitHub托管+Claude.ai设置上传，支持组织级部署和API程序化调用，定位为MCP的"知识层"（厨房类比：MCP是厨房设备，技能是食谱）
- 常见陷阱：描述字段过于模糊导致触发失败、包含XML标签的安全限制、README.md与SKILL.md混淆、指令过于冗长导致模型"懒惰"

https://resources.anthropic.com/hubfs/The-Complete-Guide-to-Building-Skill-for-Claude.pdf

AI Claude MCP Agent_Skills Workflow_Automation 开发工具 Anthropic

22:10 · 2026年1月4日 · 周日

#AI 2025 年是 LLM 从“玩具”走向“工具”的转折年：推理模型+代码 Agent+异步任务+手机编程，构成了新的开发范式。中国模型崛起、Google 发力、OpenAI 失领先，格局已变。

https://simonwillison.net/2025/Dec/31/the-year-in-llms/

Simon Willison’s Weblog

2025: The year in LLMs

This is the third in my annual series reviewing everything that happened in the LLM space over the past 12 months. For previous years see Stuff we figured out about …

23:02 · 2025年9月30日 · 周二

#AI #文章直到现在，代理们都是“蒙着眼睛写代码”。他们虽然能快速生成代码，却看不到那个按钮是否真的可以点击，也无法了解你的 Lighthouse 评分到底是什么样的，更搞不清楚为什么你的 API 调用会失败。
这个新工具通过将 Chrome 开发者工具与基于 Puppeteer 的 MCP 服务器连接起来，解决了这一问题，任何人工智能都可以调用该服务器。这样一来，你的代理就有了“眼睛”，能够深入到沙盒化的 Chrome 配置文件中进行探索，并完成一些有趣的事情，例如：

1. 像开发者一样进行调试—通过 MCP 直接检查 DOM、查看控制台日志并审查网络请求，让您的代理能够真正排查运行时错误，而无需盲目猜测。

2. 自动化用户流程—通过模拟真实用户行为，点击按钮、填写表单、上传文件，并重现漏洞。

3. 运行性能审计—触发 Chrome 性能跟踪，并提取可操作的指标，例如 LCP 和 TBT。现在，你可以再次把糟糕的 Lighthouse 分数归咎于 React，而不是 AI 了。

https://developer.chrome.com/blog/chrome-devtools-mcp?hl=zh-cn

Chrome for Developers

适用于 AI 代理的 Chrome 开发者工具 (MCP) | Blog | Chrome for Developers

新 Chrome 开发者工具 MCP 服务器的公开预览版，可将 Chrome 开发者工具的强大功能引入 AI 编码助理。

AI 文章

23:02 · 2025年9月30日 · 周二

#AI #文章直到现在，代理们都是“蒙着眼睛写代码”。他们虽然能快速生成代码，却看不到那个按钮是否真的可以点击，也无法了解你的 Lighthouse 评分到底是什么样的，更搞不清楚为什么你的 API 调用会失败。
这个新工具通过将 Chrome 开发者工具与基于 Puppeteer 的 MCP 服务器连接起来，解决了这一问题，任何人工智能都可以调用该服务器。这样一来，你的代理就有了“眼睛”，能够深入到沙盒化的 Chrome 配置文件中进行探索，并完成一些有趣的事情，例如：
1. 像开发者一样进行调试—通过 MCP 直接检查 DOM、查看控制台日志并审查网络请求，让您的代理能够真正排查运行时错误，而无需盲目猜测。
2. 自动化用户流程—通过模拟真实用户行为，点击按钮、填写表单、上传文件，并重现漏洞。
3. 运行性能审计—触发 Chrome 性能跟踪，并提取可操作的指标，例如 LCP 和 TBT。现在，你可以再次把糟糕的 Lighthouse 分数归咎于 React，而不是 AI 了。

https://developer.chrome.com/blog/chrome-devtools-mcp?hl=zh-cn

Chrome for Developers