Bryan Blog

个人分享 但愿各位看官喜欢

大模型应用落地反思:突破RAG幻想,以场景为锚,用评估导航

Reflections on the application of LLM: Break through RAG fantasy, anchor with scenarios, and navigate with evaluation

背景介绍 过去几年,持续在医疗领域的大模型应用进行实践探索,个人在大模型技术专栏 中持续积累了近 60 篇相关技术博客。过往的实践中,尝试了RAG、Agent、模型微调、知识图谱等多种技术路线,医学通用场景下 RAG 的准确率已由最初的不足 50% 提升至 90% 左右。然而,医学作为高度严谨的应用场景,90% 的准确性依旧无法完全满足生产需求。 2025 年以来,进一步聚焦医学细分场景...

跟着企业 RAG 竞赛冠军学习 RAG 最佳实践

Learn RAG best practices from the enterprise RAG competition champion

背景介绍 我一直认为,大模型竞赛是检验方案有效性的宝贵试验场。以 RAG 实践为例,相关论文层出不穷,但真正落地且有效的策略却相对有限。竞赛则为各类方案提供了客观、公正的比拼环境,在合适的验证集下,方案优劣一目了然。 在之前的文章 RAG 最佳实践 中,我结合过往实践与相关研究,总结了经过实际验证的最佳策略组合。近期注意到 Ilya Rice 分享了其在企业 RAG 竞赛中获奖的方案,本文...

Vibe Coding 真能干掉程序员吗?一个父亲节特别项目

Can Vibe Coding really replace programmers? A special project for Father's Day

背景介绍 今年以来,关于 Vibe Coding 的内容就持续出现,甚至经常会还有程序员会被完全替代的说法。从我之前的经验来看,出现的这种新现象主要来自于两种情况: 大模型的特定领域的能力逐渐成熟,考虑到大模型一次性解决所有行业变得不那么现实的情况下,当前的大模型会有意识在特定领域进行明显的强化,比如编程,数学等。 行业工具的成熟,随着 Cursor,W...

求职季,用大模型给 HR 减减负

In the job hunting season, use llm to reduce the burden on HR

背景介绍 最近因为岗位扩张,经历了密集的简历轰炸。在短短一周内抽空筛查了接近 100+ 的前后端的简历筛选,和 HR 沟通之后,她反馈她那边已经做过一轮简历筛选,过滤掉接近 90% 的简历了,预期 HR 在短期内需要处理 1000+ 的简历筛选。考虑到这个工作的重复性,而且简历内容的筛查还存在一些明显的技术门槛,没有相关的技术背景容易误判,似乎有自动化的必要性。 我们当前有一台测试服务器,...

RAG 远远不够,外部数据增强的多维策略探索

RAG is far from enough, exploring different solutions for external data augmentation

背景介绍 随着大模型技术的发展,RAG(检索增强生成)已成为提升AI应用能力的标配方案。在过去两年中,我从最初的 langchain Demo 实践,到 langchain chatchat、QAnything 和 RagFlow 等项目的探索,见证了检索技术从简单的向量检索发展到知识图谱和 Agentic RAG 的过程。 然而随着实践深入,RAG 方案的局限性逐渐显现。在处理复杂的现...

来自工业界的知识库 RAG 服务(七),RagFlow 知识图谱实践与优化方案探索

RAG service from the industry (7), RagFlow knowledge graph practice and optimization solution exploration

背景介绍 在2024年,我曾撰写过 RagFlow 源码全流程深度解析,对 RagFlow 的完整 RAG 流程进行了深入剖析。自那时起,RagFlow 经历了多轮迭代演进,不仅增强了 Agent 能力,更是在知识图谱支持方面取得了显著进展。 最近,RagFlow 公众号发布了 RAGFlow 0.16.0 特性总览,详细介绍了 RagFlow 对知识图谱机制的优化。本文将对 RagFlo...

为 AI 应用打造安全屏障:基于 Dify 的完整实践

Building a security barrier for AI applications: a complete practice based on Dify

背景介绍 2025 年是大模型应用爆发的一年。从年初的 DeepSeek 吸引大量开发者部署大模型产品,到 Manus 和 MCP 等 Agent 方案持续引发关注,行业内掀起了一股打造爆款大模型应用的热潮。 然而,在这股热潮中,大模型的安全性问题往往被忽视。事实上,AI 应用的安全性是实现完整大模型应用的关键环节。2024 年的一篇文章 Building A Generative AI ...

祛魅 Manus ,从 0 到 1 开源实现

Demystify Manus, from 0 to 1 open source implementation

背景介绍 Manus 是最近一个现象级的大模型 Agent 工具,自从发布以来,被传出各种神乎其神的故事,自媒体又开始炒作人类大量失业的鬼故事,Manus 体验码也被炒作为 10w 的高价。 之后又出现反转,被爆出实际体验效果不佳,存在造假的问题,Manus在X平台的账号被冻结。沟通之后,3月8日,Manus官方X账号又被解冻。 Manus 的故事一波三折,开源社区也没有闲着,MetaG...

$200 劝退,无缘 Deep Research,可以试试 AutoSurvey

Because $200 is too expensive to use Deep Research, you can try AutoSurvey

背景介绍 最近各种新的大模型辅助科研工具持续出现,在之前的文章中就介绍过 NVIDIA 的结构化报告生成方案,最近 OpenAI 也推出了类似的产品,叫做 Deep Research。Deep Research 可以根据需要进行深度的调研与信息整理,但是只有 Pro 用户才能享受到,$200 的价格直接劝退。在调研后发现了开源项目 AutoSurvey,相对之前的 NVIDIA 的方案更加...

NVIDIA 结构化报告生成方案详解

Detailed explanation of NVIDIA's structured report generation solution

背景介绍 最近被 2024 年底的大量 RAG 总结的论文列表轰炸了一番,密集阅读大量论文时,真切感受到深入了解一个领域论文对精力的消耗是巨大的。 刚好注意到来自 NVIDIA 的结构化报告生成方案,如果真的可行,是否可以使用大模型一次性阅读大量的论文,并生成脉络清晰的报告,基于报告选择合适的论文进行阅读,是否可以大大减少阅读论文的时间。 因此深入研究了 NVIDIA 的方案,希望后续在...