易迟的博客 | Bryan Blog

大型代码库开发的全新解法（二） - Graphify

A New Solution for Large Codebases (2) — Graphify

背景介绍在上周梳理了基于 RAG 的大型代码库解决方案 claude-context 后，本周继续探索另一种方案——基于图谱（Graph）的大型代码库解决方案 Graphify。历史似乎总在惊人地重复：几年前 RAG 遭遇规模瓶颈时，微软推出了 GraphRAG，将传统的向量检索升级为知识图谱检索。如今在 AI 编程领域，同样的模式再度上演——为了解决大型代码库中的上下文记忆问题，R...

Posted by Bryan on May 12, 2026

大型代码库开发的全新解法 - Claude-context

A New Solution for Large Codebases — Claude-context

背景介绍自 2025 年下半年以来，AI 编程技术迎来了爆发式发展， AI 编程也逐渐从编程的补全演进化自主 Agent 编程。然而尽管大模型在代码生成能力上突飞猛进，它们在实际应用中依然呈现出一种现象：在小型项目或从零开始的新项目中表现优异，但在面对历史包袱重、逻辑复杂的大型代码库时，往往显得有些力不从心。这一困境的核心原因在于：大型项目通常存在庞大而复杂的上下文依赖。实际开发中需...

Posted by Bryan on May 5, 2026

可控可信的工业界 Agent 方案研究 - parlant

Controllable and Trustworthy Industrial Agent Solutions - Parlant

背景介绍在过去将大模型 Agent 技术落地到医疗等严肃场景时，一直面临着极高的可靠性与合规性要求。为了提升 Agent 的可控性，需要大量算法 + 工程技术的叠加，比如之前分享过的基于 BAML 的结构化解析方案。近期，关注到Emcie公司开源的高可靠性Agent框架 Parlant，该框架以强化指令遵循为核心能力，其核心技术 Attentive Reasoning Queries (...

Posted by Bryan on September 29, 2025

迈出解决 Agent 不确定性的第一步：结构化解析

Taking the First Step to Solving Agent Uncertainty: Structured Parsing

背景介绍在之前的文章 Agent 落地分享一和 Agent 落地分享二中，深入探讨了 Agent 无法落地的诸多问题以及相应的解决方案。其中反复强调的核心问题是如何提升大模型产品的确定性——毕竟，没有人会为一个偶尔超常发挥但时不时”抽风”的产品买单。如何提升大模型产品的确定性，是每一个大模型产品研发团队都需要面对的核心挑战。提升大模型产品的确定性涉及多个维度，本文将从结构化解析这...

Posted by Bryan on September 17, 2025

为什么大模型 Agent 产品总是无法落地？来自实战派的经验分享（二）

Why do large-scale agent products always fail to land? Experience sharing from practical people（2）

背景介绍在之前的文章 Agent 落地经验分享（一）中，介绍了 Agent 落地中存在的问题，并给出了一些初步的解决方案。在这篇文章中，针对 Agent 落地中的关键问题，给出更进一步的实战经验，希望对大家的 Agent 产品落地有所帮助。本文主要参考自 12-factor-agents。方案选择在构建 Agent 的路径上，存在两种差异明显的方案：Agentic 方案与 ...

Posted by Bryan on September 9, 2025

为什么大模型 Agent 产品总是无法落地？来自实战派的经验分享（一）

Why do large-scale agent products always fail to land? Experience sharing from practical people（1）

背景介绍自 2024 年底以来，行业不断有人喊出”2025 年 Agent 元年”的口号，不少大模型公司也开始调整战略方向，纷纷布局 Agent 领域。然而，大半年过去了，Agent 仅在有限领域实现了落地，在更多严肃的应用场景下，Agent 产品的落地效果并不理想。在新项目中持续进行 Agent 相关产品的开发落地，在探索过程中发现了 Agent 落地的一些关键障碍。结合最近解决问...

Posted by Bryan on September 8, 2025

来自工业界的多 Agent 框架最全细节对比

The most complete comparison of multi-agent frameworks from the industry

背景介绍过去的项目涉及 RAG 比较多，在 2024 年整理过来自工业界的开源知识库 RAG 项目最全细节对比，得到了不少工程师比较好的反馈。最近新项目使用的多 Agent 的技术方案，实际对多 Agent 框架进行了详细了调研，结合最近的项目的具体实践，整理相关内容分享在这边，期望对其他人的框架选型有一些帮助。在这篇文章中主要对比目前相对成熟或好评较多的多 Agent 框架，主要对...

Posted by Bryan on August 28, 2025

从医学视角深度解析微软医学 Agent 服务 MAI-DxO

In-depth analysis of Microsoft Medical Agent service MAI-DxO from a medical perspective

背景介绍作为医学大模型应用领域的从业者，我持续关注行业最新进展。近期，微软发布的一篇论文 Sequential Diagnosis with Language Models 在医学大模型领域引起了广泛关注。微软在该论文中构建了一个名为 MAI-DxO 的 Agent 应用，在复杂病例诊断方面取得了显著突破。根据论文数据，MAI-DxO 的诊断准确性达到 85.5%，而人类全科医生的诊...

Posted by Bryan on August 2, 2025

大模型应用落地反思：突破RAG幻想，以场景为锚，用评估导航

Reflections on the application of LLM: Break through RAG fantasy, anchor with scenarios, and navigate with evaluation

背景介绍过去几年，持续在医疗领域的大模型应用进行实践探索，个人在大模型技术专栏中持续积累了近 60 篇相关技术博客。过往的实践中，尝试了RAG、Agent、模型微调、知识图谱等多种技术路线，医学通用场景下 RAG 的准确率已由最初的不足 50% 提升至 90% 左右。然而，医学作为高度严谨的应用场景，90% 的准确性依旧无法完全满足生产需求。 2025 年以来，进一步聚焦医学细分场景...

Posted by Bryan on July 12, 2025

跟着企业 RAG 竞赛冠军学习 RAG 最佳实践

Learn RAG best practices from the enterprise RAG competition champion

背景介绍我一直认为，大模型竞赛是检验方案有效性的宝贵试验场。以 RAG 实践为例，相关论文层出不穷，但真正落地且有效的策略却相对有限。竞赛则为各类方案提供了客观、公正的比拼环境，在合适的验证集下，方案优劣一目了然。在之前的文章 RAG 最佳实践中，我结合过往实践与相关研究，总结了经过实际验证的最佳策略组合。近期注意到 Ilya Rice 分享了其在企业 RAG 竞赛中获奖的方案，本文...

Posted by Bryan on July 3, 2025

Bryan Blog