🤖 AI总结
主题
RAGFlow v0.26.0版本发布,涵盖模型接入、企业数据连接、GraphRAG、Go API迁移等多项重大升级。
摘要
RAGFlow v0.26.0版本发布,带来模型接入、企业数据连接、GraphRAG、Go API迁移等系统性增强,显著提升可用性和稳定性。
关键信息
- 1 模型接入支持远程自动发现和多个API Key
- 2 新增7大数据源连接器
- 3 GraphRAG支持断点续跑
![]()
![]()
![]()
2026年6月11日,RAGFlow 正式发布v0.26.0。从这次更新内容来看,这不是一次普通的小版本迭代,而是一次覆盖模型接入、企业数据连接、GraphRAG 索引能力、Go API 迁移、检索与重排、流式推理、权限与稳定性、CLI、国际化与前端体验的系统性增强版本。
如果你正在使用 RAGFlow 构建知识库问答、企业检索增强生成、工作流 Agent、GraphRAG、SearchBot 或多模型统一接入平台,那么v0.26.0 几乎每个模块都有值得关注的变化。这一版本最大的关键词可以概括为:
•模型提供商能力全面增强
•模型列表可远程自动发现
•同一提供商支持多个 API Key
•企业级数据连接器持续扩容
•GraphRAG 最耗时流程支持断点与恢复
•推理模型输出流更快、更实时、更透明
•Go API 与 CLI 能力继续大规模补齐
•稳定性与兼容性修复数量极多
下面我们按照模块进行详细拆解。
一、版本概览:RAGFlow v0.26.0 到底升级了什么?
官方给出的 v0.26.0 内容可以分为四大部分:
1.新特性
2.改进项
3.模型支持扩展
4.Bug 修复与大量工程级完善
这次更新里最核心的新特性有四项:
1)模型提供商支持“自动填充模型列表”
RAGFlow 在 v0.26.0 中实现了多个模型提供商的自动模型列表填充能力,不再需要手动输入模型名称。
当前支持的提供商包括:
• Ollama
• OpenRouter
• vLLM
• OpenAI-API-Compatible
• LM-Studio
• VolcEngine
• Xinference
• LocalAI
• BaiduYiyan
• GPUStack
• Fish Audio
这意味着用户在接入这些模型提供商时,系统可以直接拉取远端当前可用模型,并在界面中动态展示,大幅降低模型接入门槛。
2)支持同一模型提供商配置多个 API Key
这一点对于企业、多租户、多环境以及多账号配额管理来说非常关键。
v0.26.0 允许对同一模型提供商配置多个 API Key,显著提升了灵活性与可运维性。
3)UI 模型下拉框支持动态拉取远程模型
除了底层支持模型列表获取之外,前端也打通了完整链路:
模型选择下拉框会通过远程提供商接口动态获取当前可用模型。
这解决了两个实际问题:
• 不再依赖静态维护模型名
• 新模型上线后可以更快在界面中出现
4)新增 7 大数据源连接器
RAGFlow 在数据接入侧继续强化企业场景能力,新增以下连接器:
• Outlook
• OneDrive
• Microsoft Teams
• Slack
• SharePoint
• Salesforce
• Azure Blob Storage
对于企业知识库建设来说,这意味着 RAGFlow 正进一步打通邮件、云盘、协同办公、CRM、对象存储等关键数据源。
5)GraphRAG 支持社区抽取与实体消解的断点续跑
在 GraphRAG 索引流程中,community extraction(社区抽取)和entity resolution(实体消解)往往是最耗时、成本最高的步骤。
v0.26.0 为这两个关键阶段引入了checkpoint 和 resume能力,也就是断点与恢复机制。
这项能力对于大规模知识图谱构建尤其重要,因为它能显著减少中断后全量重跑带来的资源浪费。
二、核心改进:推理输出更快、更透明 移除文本缓冲
本次更新中非常值得关注的一项改进是:
移除了文本缓冲机制。
它带来的直接效果是:
• 推理模型在交互时会显得更快
• 输出过程更透明
• 流式体验更贴近用户预期
对于依赖 reasoning-capable 模型的场景,这一改动会直接改善交互体感。
MySQL migration 标记为已应用
v0.26.0 对 MySQL 迁移状态处理做了完善,支持将相关 migration 标记为已应用,并进一步优化了 MySQL migration 版本工作流。
同时还修复了与 tenant_model 相关的迁移问题,包括:
• SQL 创建语句中尾逗号问题
• tenant_model migrate 修复
• 去除 Peewee 自动命名的唯一索引
• 参数化 tenant_model_provider 插入语句
这些修复整体上提升了数据库迁移的稳定性与一致性。
三、模型支持继续扩容:更多主流模型可直接使用
本次版本新增和更新了多类模型支持:
新增模型与模型家族
• SiliconFlow 新增 4 个模型
• 新增 MiniMax-M3 模型
• 更新支持最新 Anthropic 模型
• 更新支持 Voyage 4 模型家族
• 更新 Cohere 模型列表
• 新增 DeepSeek 模型
• 更新全部 Qwen 模型清单
• 增加 bge 作为 embedding
• 支持多类型 factory models
新增或增强的提供商能力
• Qiniu 模型提供商
• GiteeAI 提供商支持
• Xiaomi chat provider
• Xiaomi 的 ASR 与 TTS
• X.AI 的 TTS 与 ASR
• GPUStack 的 Embed
• Bedrock embeddings
• Replicate 的 Rerank
• Dify-compatible retrieval API
• RAGFlow server API 的 Go 实现
此外,还补齐了多个提供商的模型元数据实现,包括:
• Xinference
• LocalAI
• BaiduYiyan
• Tencent Cloud
四、模型提供商能力大升级:不仅能列模型,还能更稳定、更易用
v0.26.0 在模型提供商侧的更新量非常大,几乎贯穿了模型列表、验证、请求稳定性、base_url、驱动兼容性、推理家族识别、UI 交互、别名查找等多个层面。
1)模型列表能力增强
围绕模型列表,版本中完成了以下增强和修复:
• 从远程模型提供商获取模型列表
• 新增 OpenRouter OpenAI API compatible 的 list models
• 支持自定义编辑模型列表
• 新增 placeholder model metas
• 修复新添加模型未出现在下拉菜单
• 修复多个 provider 的 model list 问题
• 更新 Cohere、Qwen、DeepSeek 等模型清单
• 删除不支持的模型提供商列表
• 支持展示 SiliconFlow 国际站 URL
• 支持列出 Tongyi-Qianwen 国际站 base_url
• 修复默认 embedding 模型在 provider 未注册时的展示问题
• 修复不需要将 inactive models 放到底部的问题
• 支持 provider 数量在不同模型类型筛选标签中展示
2)同一 Provider 多模型与多 Key 能力
• 支持 tenant 级 LLM provider 配置
• 支持同一提供商多个 API Key
• 支持 add multi_models
• 支持 embedding 维度 metadata 和校验
• 支持可选 embedding dimension
3)模型验证与接入体验优化
• 校验自定义模型输入
• 支持无 llms 的 provider 也可 verify
• 修复 provider add verify 问题
• 修复 model instance verify 的问题
• 修复在 UI 中必须选择至少一个模型才能校验 OpenRouter 的问题
• await lmstudio embedding verification
• 修复 BaiduYiyan API key 验证失败
• 修复 VLLM 未带 /v1 时无法添加
• 修复 MinerU 无法添加
• 修复 paddle ocr 无法添加
• 修复无法添加 bedrock
• 修复无法添加 fish audio
• 修复 volc engine 等 json key 工厂问题
• 将 volcengine provider 配置中的 ark_api_key 重命名为 api_key
4)base_url、驱动与请求稳健性
多个模型驱动的 default transport、URL 后缀、base_url、自定义区域与请求处理都得到了强化,涉及:
• VolcEngine 模型列表后缀
• 自定义 base_url 在默认 region 为空时的处理
• Google 自定义 base URLs
• LongCat、Voyage、ModelScope、Novita、N1N 等默认 transport 处理强化
• JieKouAI 驱动请求强化与 SSE scanner buffer 提升
• Moonshot model 和 balance 请求修复
• MiniMax driver requests 修复
• validate URL suffix config keys
• guard unsafe index access in Google 和 Ollama drivers
• DeepSeek 与 VolcEngine streaming 中 nil pointer 防护
• case-insensitive model alias lookup
• strip Ollama-style tag suffix from LocalAI model names
5)推理家族与 thinking 模式修复
与 reasoning 模型相关的修复是本次版本重点之一:
• 修复 MiniMax 模型 thinking mode 未正确启用
• 禁用 Qwen3.5、Qwen3.6 thinking 以避免潜在无限循环
• 规范 reasoning model families
• 规范 Qwen reasoning families
• 修复 think stream tail handling
• 修复 think stream parsing
• 防止 post-think 文本重复
• 移除 think 文本缓冲,实现实时 reasoning stream
• 修复 Agent chat 中 MiniMax 在 thinking 时的内容问题
五、企业级数据连接器继续扩张:7大新连接器上线
v0.26.0 对企业数据源生态进行了明显补强,新增连接器包括:
• Outlook
• OneDrive
• Microsoft Teams
• Slack
• SharePoint
• Salesforce CRM
• Azure Blob Storage
同时,围绕连接器体系,Go API 侧也补齐了大量管理能力:
• create_connector API
• connector get API
• connector 管理 endpoints
• delete / rebuild / listlog API
• PATCH 更新 connector
• check connection,支持 apikey 与 region
• Google OAuth connector 接口
此外还有若干连接器相关修复:
• OneDrive 的 folder_path 在 Graph delta URL 中做规范化
• WebDAV 数字字符串 size limit 校验
• Discord server_ids / channels 支持 list 输入容错
这些更新说明 RAGFlow 已逐步形成更完整的企业数据接入层。
六、GraphRAG 与知识图谱:这次是真的往“可生产化”推进了一大步
GraphRAG 是 v0.26.0 的另一大亮点。
1)断点续跑能力上线
在社区抽取和实体消解这两个高成本阶段,引入 checkpoint/resume 支持,这是本次版本中最重要的 GraphRAG 能力升级之一。
2)实体抽取与排名修复
• 修复 spacy 实体抽取
• 修复 GraphRAG entity ranking 失效问题
• 通过 pagerank 与 n-hop paths 恢复实体排名
• 添加 KG scoring utilities
• 添加 KG entity / relation / community search functions
• 支持 KG-specific 查询中的 SelectFields override
• 新增 QueryRewrite prompt builder 和 response parser
• 新增完整 KGSearchRetrieval 流程,覆盖 N-hop、scoring、query_rewrite、community
• 添加 EnrichChunksWithDocMetadata,用于将文档 metadata 附加到 chunks
• 添加 ResolveReferenceMetadata 工具函数
从这些变化看,RAGFlow 不只是修了一些小 bug,而是在持续增强 GraphRAG 的完整检索链路能力。
七、检索、Rerank 与搜索结果质量:RAG 体验进一步增强
v0.26.0 在检索层面的变化也非常多,涉及传统检索、混合检索、深分页、重排、SearchBot 等多个方向。
1)检索与分页优化
• 最大 page size 被限制,防止大查询导致系统崩溃或严重卡顿
• page_size 最大值设为 100
• 修复 chunk 页面切换 page_size 后当前页未重置
• 修复 agent launch 页面出现 “pagesize exceeds maximum value”
• 移除 search 和 retrieval 页面中的分页
• 修复 dataset retrieval test 返回的 total 数量错误
• 深分页下保持 rerank window 与 page_size 对齐
2)Rerank 与混合检索改进
• 实现 Replicate driver 的 Rerank
• 修复 Qwen rerank 错误响应处理
• 将 reranker scores 标准化到统一尺度后再进行 hybrid blend
• 在 OpenSearch hybrid search 中保留 BM25 分支
• 在 KNN second-pass scoring 中实现 get_scores
3)SearchBot 与检索 API 增强
• 支持 searchbots ask 传递 search id
• 新增 POST /api/v1/searchbots/related_questions
• 新增 POST /api/v1/searchbots/retrieval_test
• 新增 POST /api/v1/searchbots/ask,支持带引用和 think-tag 处理的流式 RAG
• 支持 Dify-compatible retrieval API endpoint
• 在 go-api 中为 chat completions 增加 RAG retrieval
4)元数据过滤与查询修复
• 修复 metadata filtering 中空 AND 结果被错误丢弃
• 修复大小写不敏感的 contains / not contains / not in
• consolidate metadata filter pipeline
• 修复 auto metadata type 问题
• 防止 auto-metadata 中 None 导致 KeyError
• migrate meta_filter 和 convert_conditions 到 Go
八、文档解析、知识库与多格式处理:大量稳定性修复落地
如果你把 RAGFlow 用在文档入库、知识解析、文档预览、切块与多模态抽取上,这个版本同样有很多实用修复。
1)文档解析与抽取修复
• MinerU 解析器不再把页眉页脚等 page chrome 错误抽成正文
• DeepDoc 补充英文 caption 模式,修复英文图表标题缺失
• TitleChunker 恢复 json 和 chunks upstream 格式输出
• Docling native chunks 为空时回退处理
• markdown fenced code block extraction 修复
• 保留 markdown tables 的 delimiter extraction
• naive 模式中强制合并过短 markdown headers,避免独立切块
• Excel parser 修复在 chunk_rows 精确倍数时产生多余 header-only chunk
• image parser 强制输出 json
• table parser 文档 metadata 聚合支持 auto mode
• image_base64 在写入 doc-store 前进行校验
• 英文语言检测中 list 参数导致 is_english() 恒 False 的问题修复
• FulltextQueryer.paragraph 中按空白符对 content_tks 分词
• 修复 pipeline parsing result 检查报错
2)知识库与文档管理修复
• 上传 .tsv 文件失败时现在会返回错误消息
• 修复无法创建 dataset
• 新增 Bulk action:支持将多个文件批量关联到 datasets
• 修复 linked file row 缺失时 document rename 保护
• 修复 dataset delete 时 File2Document row 缺失保护
• POST /documents/stop 时移除部分 chunks 并重置计数器
• parse 和 stop_parsing 中增加 docStoreConn.delete 的 index_exist 防护
• duplicate document ingest guard 调整
• guard async_ask() against empty or invalid kb_ids
• memory tenant id 在 task collect 中传递修复
• memory empty issue 修复
• empty response set not take effect 修复
• Search mindmap not working 修复
3)预览、图片与下载接口修复
• 缺失文件下载返回 4xx,而不是 500
• document image endpoint 自动推断 Content-Type
• SDK document download 的 Content-Type 根据文件名设置
• document preview 恢复 accessible 检查
• 去除重复 document preview access check
• markdown document preview 请求增加鉴权
• 预览和图片接口对 storage blob 缺失增加保护
• image_id 与 id2image 对带连字符的存储 key 解析修复
• 文件名过长时删除确认框溢出问题修复
九、OpenAI-Compatible API 与聊天链路:兼容性和正确性大幅提升
这一部分更新非常密集,尤其适合依赖 OpenAI-compatible 接口的用户关注。
1)chat completions 关键修复
• streamed answers 在 OpenAI-compatible chat completions 中重复的问题已修复
• OpenAI-compatible chat completions API 默认不再是 streamed responses
• 修复客户端因默认流式导致的错误
• chat completions 在 LiteLLM providers 上失败的问题已修复,内部配置参数会先被过滤
• 序列化时 NaN、Inf 等非法数值导致 JSON 编码错误的问题修复
• 支持 array message content
• 聊天生成参数覆盖逻辑修复
• 空 chat model fallback 修复
• Creativity 参数未保存问题修复
• generation parameter overrides 修复
• max_tokens 从模型配置向下游传播修复
• embed completion request 增加 model_name
• 支持 chat 中 waiting 状态展示
• 修复 answer 重复、think 解析、post-think 重复等流式链路细节问题
2)Agent、Workflow 与视觉能力修复
• visual agent 调用路由到 image model
• agent launch 页面 pagesize 警告修复
• embedded website floating component 不显示 citations 的问题修复
• Visual Input File 中变量不显示的问题修复
• workflow 运行日志输入中显示解析后的变量
• switch conditions 为空时跳过
• regular expression 配置在 pipeline header-based chunking 中被重置的问题修复
• multiple tags 修复
• get is_tools from model record 修复
十、Go API 大规模迁移与补齐:后端能力继续成型
从“What’s Changed”来看,Go API 已经在 v0.26.0 中承担了越来越多的核心能力。新增或迁移的接口覆盖范围非常广,主要包括以下模块:
1)系统与用户
• PATCH /api/v1/users/me
• system healthz API
• /api/v1/system/status GET
• /system/stats
• /system/config/log 重构
• user registration initialization 修复
• /user/me 返回中包含 user model settings
• logout access token invalidation 持久化
• post /api/v1/system/tokens 修复
• no more @token_required
• consolidate beta auth
• password-reset flow
• forgot-password flow 迁移到 Go
2)Agent 与 Workflow
• GET /api/v1/agents list
• GET /api/v1/agents/ /versions
• GET /api/v1/agents/ /versions/
• POST /api/v1/agents/ /upload
• GET /agents/templates
• GET /api/v1/agents/prompts
• /api/v1/agents/
• /api/v1/agents/ /sessions
• PUT /api/v1/agents/ /tags
3)连接器与 MCP Server
• create_connector
• connector get API
• connector 管理 endpoints
• connector delete / rebuild / listlog
• connector PATCH
• check connection
• MCP server create / delete / list / update
• MCP server management endpoints
4)数据集与文档
• dataset ingestion log APIs
• /api/v1/datasets/ /metadata/config
• GET dataset metadata summary API
• DELETE /api/v1/datasets/:dataset_id/documents 迁移到 Go
• POST /api/v1/datasets/ /documents/stop 迁移到 Go
• datasets/ /documents/ /metadata 相关 API
• POST /api/v1/files/link-to-datasets
• thumbnails API
5)检索与搜索
• SearchBot ask
• SearchBot related_questions
• SearchBot retrieval_test
• RAG retrieval to chat completions
• RAGFlow server API in Go
• Elasticsearch result functions 补全
十一、CLI 也在持续增强:模型、解析、切块都能更方便管理
Go CLI 在本版本中同样收获了大量更新:
• 检查 provider region
• 支持批量 model add/remove
• 支持可选 embedding dimension
• 新命令:list all models / show model
• 更新 supported models 列表
• 切换到 admin/api server
• CLI 文件系统清理
• parse 和 chunk 命令
• CLI 重构与测试修复
• list-models 函数重构
对于自动化部署和运维来说,这些增强非常实用。
十二、安全性、稳定性与运行时防护:这次修复量非常大
v0.26.0 中还包含大量底层稳定性与安全修复,值得重点关注。
1)安全修复
• 修复 OIDC ID token verification 中的 JWT algorithm-confusion 问题
• 升级 crawl4ai 到 0.8.0 以修复相关 CVE
2)运行时与 panic 防护
• 修复多个 nil-pointer dereference 导致的 runtime panics
• 增加 missing row、missing blob、missing linked row 等各类 guard
• Go 1.25 下 http.DefaultTransport 类型断言保护
• storage blob 缺失时预览、图片、下载接口保护
• SearchService.get_detail 缺失行保护
• verify_api_key embedding 分支 await asyncio.wait_for 修复
• DeepSeek、VolcEngine streaming nil pointer 防护
3)Docker 与部署修复
• Dockerfile 与发布流程切换到 GitHub mirror
• slim Docker image
• 增加 .dockerignore
• 修复 Go binary shipping
• es01 /tmp 使用 tmpfs 解决 entrypoint 权限问题
• Tigris 作为 S3-compatible 存储后端文档支持
• 修复 s3 region 字段名
• OceanBase tenant startup drift 和文档修复
十三、国际化:韩语、意大利语翻译完成
v0.26.0 在 i18n 上也有进展:
•韩语翻译完成
•意大利语翻译完成
此外,UI 层还有若干小修复,例如:
• 个人资料页时区显示修复
• 主界面新增 chat 时自动弹出 warning 的问题修复
• x-spreadsheet 组件添加细滚动条样式
• 删除文件确认弹窗超长文件名溢出修复
十四、文档更新同步到位
本次版本还同步更新了多项文档:
• converse with agent API reference 更新
• RSS feed ingest 指南新增
• Tigris 存储后端文档新增
• supported model providers and URLs 更新
• README 与文档中的版本引用更新到 v0.26.0
• v0.26.0 release notes 初稿与最终整理同步完成
十五、RAGFlow v0.26.0 最值得关注的升级总结
如果只看这次版本最有价值的升级,我认为重点有以下几项:
第一,模型接入体验完成了一次质变
从“手动输入模型名”,升级到“远程拉取可用模型列表并动态下拉展示”,这对多模型平台来说非常关键。再叠加同一 provider 多 API Key、自定义编辑模型列表、多 provider 验证修复,RAGFlow 的模型管理能力明显成熟了。
第二,企业数据接入能力继续强化
Outlook、OneDrive、Teams、Slack、SharePoint、Salesforce、Azure Blob Storage 七大连接器加入后,RAGFlow 在企业知识接入上的覆盖面更广了。
第三,GraphRAG 进入更实用阶段
社区抽取与实体消解支持断点恢复,实体排名、KG 检索、N-hop、Query Rewrite、community 搜索等能力同步完善,这对复杂知识图谱检索是实打实的增强。
第四,推理模型流式体验提升明显
移除文本缓冲后,reasoning 模型的实时反馈感更强;同时 MiniMax、Qwen 系列 thinking 相关问题得到大量修复。
第五,稳定性修复覆盖面极广
从 OpenAI-compatible 聊天接口,到文档预览、下载、切块、embedding、rerank、metadata filter、provider 驱动、Go API、CLI、Docker、数据库迁移,本次版本几乎在所有核心路径上都做了补强。
十六、结语
代码地址:github.com/infiniflow/ragflow
总体来看,RAGFlow v0.26.0 是一个“功能扩展 + 架构补齐 + 稳定性修复”三线并进的大版本。
我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。 欢迎关注“福大大架构师每日一题”,发消息可获得面试资料,让AI助力您的未来发展。