锤子前端 - Now vibe coding, so learning hammer FE ?

Now vibe coding, so learning hammer FE ?

09:36 · 2026年6月2日 · 周二

《如何构建你自己的Agent_Harness：从单体框架到可组合Worker架构》

标签：#AI工程 #Agent架构 #系统设计 #开源框架 #Worker模型

总结：
iii创始人Mike_Piccolo提出了一种全新的Agent_Harness构建理念——将传统单体框架拆分为15个独立的可替换Worker，通过统一的iii.trigger()原语和WebSocket协议进行通信。这种架构让团队不再需要Fork或绕过现有框架，而是通过"安装/替换Worker"来精确组装符合自身需求的Agent运行时，实现从极简到企业级的平滑伸缩。

文章要点：
1. 传统框架的痛点：LangChain、LangGraph等将循环、工具、记忆、编排等打包成单体，团队要么全盘接受，要么Fork或Hack，导致长期运行后不得不重写整个Harness
2. iii的核心理念：将15个Harness职责（凭证解析、模型目录、预算追踪、审批门、 durable_turn_loop等）拆分为独立Worker，每个Worker通过iii.trigger()触发，可独立版本化、用任意语言编写、随时替换
3. 实际生产栈示例：包括turn_orchestrator（11状态FSM）、approval_gate（审批路由）、llm_budget（预算管控）、hook_fanout（钩子发布）、provider_anthropic/openai/kimi（模型提供商）等11个Worker，全部通过同一引擎总线通信
4. 替换的便利性：想换动态模型目录？写一个注册models::list的新Worker即可；想从Slack审批？写一个监听slash命令并调用approval::resolve的Worker；整个堆栈其他部分完全无感知
5. 架构优势：单体框架的"薄vs厚"之争在这里变成配置问题——极简Harness只需4个Worker，企业级Harness安装全部13个+自定义策略引擎，距离只是config.yaml的条目增减，而非重写
6. 可观测性统一：每个Worker自动注入OpenTelemetry追踪，通过iii.session.id等标签实现跨Worker的完整调用链可视化

URL：https://iii.dev/blog/how-to-build-your-own-agent-harness/

iii.dev

How to Build Your Own Agent Harness

Most agent teams adopt a harness as one decision. iii decomposes it into eleven independently-replaceable workers on one engine bus. Build your own stops meaning fork a framework and starts meaning swap a few workers.

AI工程 Agent架构系统设计开源框架 Worker模型

14:02 · 2026年4月10日 · 周五

《Karpathy把私藏的知识管理方法开源了：让LLM帮你维护Wiki，自己只管提问》

标签：#AI #知识管理 #LLM_Knowledge_Base #Personal_Wiki #Obsidian #RAG #Agent

总结：

Andrej Karpathy 分享了他用 LLM 管理个人知识库的方法：将原始资料放入只读目录，由 LLM 自动生成和维护结构化的 Wiki，再通过 Obsidian 查看。这套"摄入-查询-检查"工作流让他在小规模数据下无需 RAG 也能高效检索，更重要的是体现了 AI 时代的新范式——分享想法而非代码，让每个人的 Agent 按需实现。这对知识工作者如何从"操纵代码"转向"操纵知识"具有启发意义。

文章要点：

- **三层架构设计超清晰**：原始资料放在 raw/ 目录保持只读，LLM 自动读取并编译成结构化的 Wiki 文档，最后用 Obsidian 当查看器来展示。整套系统就像"原料→加工厂→展示厅"一样分工明确！

- **四个核心操作好懂又实用**：Ingest（新资料进来时 LLM 自动更新相关页面）、Query（日常提问让 LLM 去 Wiki 里搜索综合回答）、Lint（定期检查知识库有没有矛盾或遗漏）、Extra Tools（比如 vibe coding 的小搜索引擎）。整个知识库会越用越丰富~

- **为什么不用 RAG？Karpathy 的回答很实在**：他的知识库大约 100 篇文章、40 万字，在这个量级下 LLM 自己维护的索引和摘要已经够用了，不需要复杂的向量检索。Wiki 本身就是一种"压缩过的知识表示"

- **从"分享代码"到"分享想法"**：他把这套方法写成"idea file"公开，认为在 Agent 时代，清晰的思路比具体代码更有价值。每个人把自己的 Agent 叫来，照着这个想法文件就能搭出适合自己的版本

- **工作重心正在悄悄转移**：Karpathy 说他最近的 token 消耗从"写代码"大幅转向"操纵知识"。这对咱们知识工作者也是个信号——让 LLM 当长期的知识管家，而不只是临时问答工具，效率会更高呢！

文章URL：https://mp.weixin.qq.com/s/EoGLi067d_3huZf-X0Q6Fg

AI 知识管理 LLM_Knowledge_Base Personal_Wiki Obsidian RAG Agent

08:52 · 2026年4月4日 · 周六

《OpenHarness：开源智能体基础设施框架》

标签：#AI #Agent #智能体 #开源 #Python #工具调用

总结：
OpenHarness是港大数据智能实验室（HKUDS）推出的轻量级开源智能体基础设施框架，仅用Python实现，代码量比Claude Code轻44倍（1.1万行vs 51万行），提供完整的工具调用、技能加载、记忆管理和多智能体协调功能，让开发者快速构建安全可靠的AI Agent应用。

文章要点：
- 极简架构设计：相比Claude Code的51万行TypeScript代码，OpenHarness仅用1.1万行Python实现，去除了企业级复杂依赖如遥测和OAuth，专注于核心Harness架构
- 五大核心模块：包含Agent循环（支持流式工具调用、并行执行、成本追踪）、工具套件（43种工具覆盖文件/Shell/搜索/Web/MCP）、上下文记忆（CLAUDE.md自动注入、MEMORY.md持久化）、权限治理（多级权限模式、交互式审批）、Swarm多智能体协调（子智能体委派、任务管理）
- 生态兼容性：完全兼容anthropics/skills技能格式和claude-code/plugins插件生态，支持OpenClaw、nanobot、Cursor等CLI工具集成
- 开箱即用：一条命令oh即可启动，内置114个单元测试和6个E2E测试套件，提供稳定可靠的基础能力

文章URL：
https://github.com/HKUDS/OpenHarness

GitHub

GitHub - HKUDS/OpenHarness: "OpenHarness: Open Agent Harness with a Built-in Personal Agent--Ohmo!"

"OpenHarness: Open Agent Harness with a Built-in Personal Agent--Ohmo!" - HKUDS/OpenHarness

AI Agent 智能体开源 Python 工具调用

08:51 · 2026年2月23日 · 周一

《Claude技能构建完整指南》

标签：#AI #Claude #MCP #Agent_Skills #Workflow_Automation #开发工具 #Anthropic

总结：Anthropic官方发布的Claude技能构建指南，系统介绍了如何通过SKILL.md文件创建可复用的AI工作流。技能采用渐进式披露架构（YAML前置元数据+Markdown指令+引用资源），可与MCP工具集成实现多步骤自动化。文档涵盖规划、测试、分发全流程，提供5种设计模式（顺序工作流、多MCP协调、迭代优化等），并给出量化评估指标（90%触发准确率、零API失败率），目标帮助开发者在15-30分钟内构建生产级AI技能。

文章要点：
- 技能定义：包含SKILL.md（必需）、scripts/、references/、assets/的文件夹结构，采用kebab-case命名规范，支持Claude.ai、Claude Code和API三端通用
- 渐进式披露设计：三级加载机制（YAML元数据→SKILL.md正文→链接资源），最小化token消耗同时保持专业性
- 三大应用场景：文档/资源创建（如前端设计）、工作流自动化（如项目管理）、MCP增强（如Sentry代码审查），后者将工具访问转化为可靠工作流
- 成功指标：技能应在90%相关查询中自动触发，单次工作流工具调用次数明确，零失败API调用，用户无需提示下一步操作
- 核心设计模式：顺序工作流编排、多MCP协调（跨Figma/Linear/Slack等）、迭代优化循环、上下文感知工具选择、领域特定智能（如合规检查）
- 测试策略：触发测试（ obvious/paraphrased/negative cases）、功能测试、性能对比（有无技能时的token消耗和交互轮次差异）
- 分发方式：GitHub托管+Claude.ai设置上传，支持组织级部署和API程序化调用，定位为MCP的"知识层"（厨房类比：MCP是厨房设备，技能是食谱）
- 常见陷阱：描述字段过于模糊导致触发失败、包含XML标签的安全限制、README.md与SKILL.md混淆、指令过于冗长导致模型"懒惰"

https://resources.anthropic.com/hubfs/The-Complete-Guide-to-Building-Skill-for-Claude.pdf

AI Claude MCP Agent_Skills Workflow_Automation 开发工具 Anthropic