RAGFlow v0.26.0发布:模型自动发现、多密钥管理、7大企业连接器、GraphRAG断点续跑、推理流更快更透明,超全升级解读

🤖 AI总结

主题

RAGFlow v0.26.0版本发布,涵盖模型接入、企业数据连接、GraphRAG、Go API迁移等多项重大升级。

摘要

RAGFlow v0.26.0版本发布,带来模型接入、企业数据连接、GraphRAG、Go API迁移等系统性增强,显著提升可用性和稳定性。

关键信息

  • 1 模型接入支持远程自动发现和多个API Key
  • 2 新增7大数据源连接器
  • 3 GraphRAG支持断点续跑

RAGFlow v0.26.0发布:模型自动发现、多密钥管理、7大企业连接器、GraphRAG断点续跑、推理流更快更透明,超全升级解读

RAGFlow v0.26.0发布:模型自动发现、多密钥管理、7大企业连接器、GraphRAG断点续跑、推理流更快更透明,超全升级解读

RAGFlow v0.26.0发布:模型自动发现、多密钥管理、7大企业连接器、GraphRAG断点续跑、推理流更快更透明,超全升级解读

2026年6月11日,RAGFlow 正式发布v0.26.0。从这次更新内容来看,这不是一次普通的小版本迭代,而是一次覆盖模型接入、企业数据连接、GraphRAG 索引能力、Go API 迁移、检索与重排、流式推理、权限与稳定性、CLI、国际化与前端体验的系统性增强版本。

如果你正在使用 RAGFlow 构建知识库问答、企业检索增强生成、工作流 Agent、GraphRAG、SearchBot 或多模型统一接入平台,那么v0.26.0 几乎每个模块都有值得关注的变化。这一版本最大的关键词可以概括为:

模型提供商能力全面增强

  • 模型列表可远程自动发现

  • 同一提供商支持多个 API Key

  • 企业级数据连接器持续扩容

  • GraphRAG 最耗时流程支持断点与恢复

  • 推理模型输出流更快、更实时、更透明

  • Go API 与 CLI 能力继续大规模补齐

  • 稳定性与兼容性修复数量极多

    下面我们按照模块进行详细拆解。

    一、版本概览:RAGFlow v0.26.0 到底升级了什么?

    官方给出的 v0.26.0 内容可以分为四大部分:

    1.新特性

  • 2.改进项

  • 3.模型支持扩展

  • 4.Bug 修复与大量工程级完善

    这次更新里最核心的新特性有四项:

    1)模型提供商支持“自动填充模型列表”

    RAGFlow 在 v0.26.0 中实现了多个模型提供商的自动模型列表填充能力,不再需要手动输入模型名称。
    当前支持的提供商包括:

    • Ollama

  • • OpenRouter

  • • vLLM

  • • OpenAI-API-Compatible

  • • LM-Studio

  • • VolcEngine

  • • Xinference

  • • LocalAI

  • • BaiduYiyan

  • • GPUStack

  • • Fish Audio

    这意味着用户在接入这些模型提供商时,系统可以直接拉取远端当前可用模型,并在界面中动态展示,大幅降低模型接入门槛。

    2)支持同一模型提供商配置多个 API Key

    这一点对于企业、多租户、多环境以及多账号配额管理来说非常关键。
    v0.26.0 允许对同一模型提供商配置多个 API Key,显著提升了灵活性与可运维性。

    3)UI 模型下拉框支持动态拉取远程模型

    除了底层支持模型列表获取之外,前端也打通了完整链路:
    模型选择下拉框会通过远程提供商接口动态获取当前可用模型。

    这解决了两个实际问题:

    • 不再依赖静态维护模型名

  • • 新模型上线后可以更快在界面中出现

    4)新增 7 大数据源连接器

    RAGFlow 在数据接入侧继续强化企业场景能力,新增以下连接器:

    • Outlook

  • • OneDrive

  • • Microsoft Teams

  • • Slack

  • • SharePoint

  • • Salesforce

  • • Azure Blob Storage

    对于企业知识库建设来说,这意味着 RAGFlow 正进一步打通邮件、云盘、协同办公、CRM、对象存储等关键数据源。

    5)GraphRAG 支持社区抽取与实体消解的断点续跑

    在 GraphRAG 索引流程中,community extraction(社区抽取)和entity resolution(实体消解)往往是最耗时、成本最高的步骤。
    v0.26.0 为这两个关键阶段引入了
    checkpoint 和 resume能力,也就是断点与恢复机制。

    这项能力对于大规模知识图谱构建尤其重要,因为它能显著减少中断后全量重跑带来的资源浪费。

    二、核心改进:推理输出更快、更透明 移除
    文本缓冲

    本次更新中非常值得关注的一项改进是:

    移除了
    文本缓冲机制。

    它带来的直接效果是:

    • 推理模型在交互时会显得更快

  • • 输出过程更透明

  • • 流式体验更贴近用户预期

    对于依赖 reasoning-capable 模型的场景,这一改动会直接改善交互体感。

    MySQL migration 标记为已应用

    v0.26.0 对 MySQL 迁移状态处理做了完善,支持将相关 migration 标记为已应用,并进一步优化了 MySQL migration 版本工作流。
    同时还修复了与 tenant_model 相关的迁移问题,包括:

    • SQL 创建语句中尾逗号问题

  • • tenant_model migrate 修复

  • • 去除 Peewee 自动命名的唯一索引

  • • 参数化 tenant_model_provider 插入语句

    这些修复整体上提升了数据库迁移的稳定性与一致性。

    三、模型支持继续扩容:更多主流模型可直接使用

    本次版本新增和更新了多类模型支持:

    新增模型与模型家族

    • SiliconFlow 新增 4 个模型

  • • 新增 MiniMax-M3 模型

  • • 更新支持最新 Anthropic 模型

  • • 更新支持 Voyage 4 模型家族

  • • 更新 Cohere 模型列表

  • • 新增 DeepSeek 模型

  • • 更新全部 Qwen 模型清单

  • • 增加 bge 作为 embedding

  • • 支持多类型 factory models

    新增或增强的提供商能力

    • Qiniu 模型提供商

  • • GiteeAI 提供商支持

  • • Xiaomi chat provider

  • • Xiaomi 的 ASR 与 TTS

  • • X.AI 的 TTS 与 ASR

  • • GPUStack 的 Embed

  • • Bedrock embeddings

  • • Replicate 的 Rerank

  • • Dify-compatible retrieval API

  • • RAGFlow server API 的 Go 实现

    此外,还补齐了多个提供商的模型元数据实现,包括:

    • Xinference

  • • LocalAI

  • • BaiduYiyan

  • • Tencent Cloud

    四、模型提供商能力大升级:不仅能列模型,还能更稳定、更易用

    v0.26.0 在模型提供商侧的更新量非常大,几乎贯穿了模型列表、验证、请求稳定性、base_url、驱动兼容性、推理家族识别、UI 交互、别名查找等多个层面。

    1)模型列表能力增强

    围绕模型列表,版本中完成了以下增强和修复:

    • 从远程模型提供商获取模型列表

  • • 新增 OpenRouter OpenAI API compatible 的 list models

  • • 支持自定义编辑模型列表

  • • 新增 placeholder model metas

  • • 修复新添加模型未出现在下拉菜单

  • • 修复多个 provider 的 model list 问题

  • • 更新 Cohere、Qwen、DeepSeek 等模型清单

  • • 删除不支持的模型提供商列表

  • • 支持展示 SiliconFlow 国际站 URL

  • • 支持列出 Tongyi-Qianwen 国际站 base_url

  • • 修复默认 embedding 模型在 provider 未注册时的展示问题

  • • 修复不需要将 inactive models 放到底部的问题

  • • 支持 provider 数量在不同模型类型筛选标签中展示

    2)同一 Provider 多模型与多 Key 能力

    • 支持 tenant 级 LLM provider 配置

  • • 支持同一提供商多个 API Key

  • • 支持 add multi_models

  • • 支持 embedding 维度 metadata 和校验

  • • 支持可选 embedding dimension

    3)模型验证与接入体验优化

    • 校验自定义模型输入

  • • 支持无 llms 的 provider 也可 verify

  • • 修复 provider add verify 问题

  • • 修复 model instance verify 的问题

  • • 修复在 UI 中必须选择至少一个模型才能校验 OpenRouter 的问题

  • • await lmstudio embedding verification

  • • 修复 BaiduYiyan API key 验证失败

  • • 修复 VLLM 未带 /v1 时无法添加

  • • 修复 MinerU 无法添加

  • • 修复 paddle ocr 无法添加

  • • 修复无法添加 bedrock

  • • 修复无法添加 fish audio

  • • 修复 volc engine 等 json key 工厂问题

  • • 将 volcengine provider 配置中的 ark_api_key 重命名为 api_key

    4)base_url、驱动与请求稳健性

    多个模型驱动的 default transport、URL 后缀、base_url、自定义区域与请求处理都得到了强化,涉及:

    • VolcEngine 模型列表后缀

  • • 自定义 base_url 在默认 region 为空时的处理

  • • Google 自定义 base URLs

  • • LongCat、Voyage、ModelScope、Novita、N1N 等默认 transport 处理强化

  • • JieKouAI 驱动请求强化与 SSE scanner buffer 提升

  • • Moonshot model 和 balance 请求修复

  • • MiniMax driver requests 修复

  • • validate URL suffix config keys

  • • guard unsafe index access in Google 和 Ollama drivers

  • • DeepSeek 与 VolcEngine streaming 中 nil pointer 防护

  • • case-insensitive model alias lookup

  • • strip Ollama-style tag suffix from LocalAI model names

    5)推理家族与 thinking 模式修复

    与 reasoning 模型相关的修复是本次版本重点之一:

    • 修复 MiniMax 模型 thinking mode 未正确启用

  • • 禁用 Qwen3.5、Qwen3.6 thinking 以避免潜在无限循环

  • • 规范 reasoning model families

  • • 规范 Qwen reasoning families

  • • 修复 think stream tail handling

  • • 修复 think stream parsing

  • • 防止 post-think 文本重复

  • • 移除 think 文本缓冲,实现实时 reasoning stream

  • • 修复 Agent chat 中 MiniMax 在 thinking 时的内容问题

    五、企业级数据连接器继续扩张:7大新连接器上线

    v0.26.0 对企业数据源生态进行了明显补强,新增连接器包括:

    • Outlook

  • • OneDrive

  • • Microsoft Teams

  • • Slack

  • • SharePoint

  • • Salesforce CRM

  • • Azure Blob Storage

    同时,围绕连接器体系,Go API 侧也补齐了大量管理能力:

    • create_connector API

  • • connector get API

  • • connector 管理 endpoints

  • • delete / rebuild / listlog API

  • • PATCH 更新 connector

  • • check connection,支持 apikey 与 region

  • • Google OAuth connector 接口

    此外还有若干连接器相关修复:

    • OneDrive 的 folder_path 在 Graph delta URL 中做规范化

  • • WebDAV 数字字符串 size limit 校验

  • • Discord server_ids / channels 支持 list 输入容错

    这些更新说明 RAGFlow 已逐步形成更完整的企业数据接入层。

    六、GraphRAG 与知识图谱:这次是真的往“可生产化”推进了一大步

    GraphRAG 是 v0.26.0 的另一大亮点。

    1)断点续跑能力上线

    在社区抽取和实体消解这两个高成本阶段,引入 checkpoint/resume 支持,这是本次版本中最重要的 GraphRAG 能力升级之一。

    2)实体抽取与排名修复

    • 修复 spacy 实体抽取

  • • 修复 GraphRAG entity ranking 失效问题

  • • 通过 pagerank 与 n-hop paths 恢复实体排名

  • • 添加 KG scoring utilities

  • • 添加 KG entity / relation / community search functions

  • • 支持 KG-specific 查询中的 SelectFields override

  • • 新增 QueryRewrite prompt builder 和 response parser

  • • 新增完整 KGSearchRetrieval 流程,覆盖 N-hop、scoring、query_rewrite、community

  • • 添加 EnrichChunksWithDocMetadata,用于将文档 metadata 附加到 chunks

  • • 添加 ResolveReferenceMetadata 工具函数

    从这些变化看,RAGFlow 不只是修了一些小 bug,而是在持续增强 GraphRAG 的完整检索链路能力。

    七、检索、Rerank 与搜索结果质量:RAG 体验进一步增强

    v0.26.0 在检索层面的变化也非常多,涉及传统检索、混合检索、深分页、重排、SearchBot 等多个方向。

    1)检索与分页优化

    • 最大 page size 被限制,防止大查询导致系统崩溃或严重卡顿

  • • page_size 最大值设为 100

  • • 修复 chunk 页面切换 page_size 后当前页未重置

  • • 修复 agent launch 页面出现 “pagesize exceeds maximum value”

  • • 移除 search 和 retrieval 页面中的分页

  • • 修复 dataset retrieval test 返回的 total 数量错误

  • • 深分页下保持 rerank window 与 page_size 对齐

    2)Rerank 与混合检索改进

    • 实现 Replicate driver 的 Rerank

  • • 修复 Qwen rerank 错误响应处理

  • • 将 reranker scores 标准化到统一尺度后再进行 hybrid blend

  • • 在 OpenSearch hybrid search 中保留 BM25 分支

  • • 在 KNN second-pass scoring 中实现 get_scores

    3)SearchBot 与检索 API 增强

    • 支持 searchbots ask 传递 search id

  • • 新增 POST /api/v1/searchbots/related_questions

  • • 新增 POST /api/v1/searchbots/retrieval_test

  • • 新增 POST /api/v1/searchbots/ask,支持带引用和 think-tag 处理的流式 RAG

  • • 支持 Dify-compatible retrieval API endpoint

  • • 在 go-api 中为 chat completions 增加 RAG retrieval

    4)元数据过滤与查询修复

    • 修复 metadata filtering 中空 AND 结果被错误丢弃

  • • 修复大小写不敏感的 contains / not contains / not in

  • • consolidate metadata filter pipeline

  • • 修复 auto metadata type 问题

  • • 防止 auto-metadata 中 None 导致 KeyError

  • • migrate meta_filter 和 convert_conditions 到 Go

    八、文档解析、知识库与多格式处理:大量稳定性修复落地

    如果你把 RAGFlow 用在文档入库、知识解析、文档预览、切块与多模态抽取上,这个版本同样有很多实用修复。

    1)文档解析与抽取修复

    • MinerU 解析器不再把页眉页脚等 page chrome 错误抽成正文

  • • DeepDoc 补充英文 caption 模式,修复英文图表标题缺失

  • • TitleChunker 恢复 json 和 chunks upstream 格式输出

  • • Docling native chunks 为空时回退处理

  • • markdown fenced code block extraction 修复

  • • 保留 markdown tables 的 delimiter extraction

  • • naive 模式中强制合并过短 markdown headers,避免独立切块

  • • Excel parser 修复在 chunk_rows 精确倍数时产生多余 header-only chunk

  • • image parser 强制输出 json

  • • table parser 文档 metadata 聚合支持 auto mode

  • • image_base64 在写入 doc-store 前进行校验

  • • 英文语言检测中 list 参数导致 is_english() 恒 False 的问题修复

  • • FulltextQueryer.paragraph 中按空白符对 content_tks 分词

  • • 修复 pipeline parsing result 检查报错

    2)知识库与文档管理修复

    • 上传 .tsv 文件失败时现在会返回错误消息

  • • 修复无法创建 dataset

  • • 新增 Bulk action:支持将多个文件批量关联到 datasets

  • • 修复 linked file row 缺失时 document rename 保护

  • • 修复 dataset delete 时 File2Document row 缺失保护

  • • POST /documents/stop 时移除部分 chunks 并重置计数器

  • • parse 和 stop_parsing 中增加 docStoreConn.delete 的 index_exist 防护

  • • duplicate document ingest guard 调整

  • • guard async_ask() against empty or invalid kb_ids

  • • memory tenant id 在 task collect 中传递修复

  • • memory empty issue 修复

  • • empty response set not take effect 修复

  • • Search mindmap not working 修复

    3)预览、图片与下载接口修复

    • 缺失文件下载返回 4xx,而不是 500

  • • document image endpoint 自动推断 Content-Type

  • • SDK document download 的 Content-Type 根据文件名设置

  • • document preview 恢复 accessible 检查

  • • 去除重复 document preview access check

  • • markdown document preview 请求增加鉴权

  • • 预览和图片接口对 storage blob 缺失增加保护

  • • image_id 与 id2image 对带连字符的存储 key 解析修复

  • • 文件名过长时删除确认框溢出问题修复

    九、OpenAI-Compatible API 与聊天链路:兼容性和正确性大幅提升

    这一部分更新非常密集,尤其适合依赖 OpenAI-compatible 接口的用户关注。

    1)chat completions 关键修复

    • streamed answers 在 OpenAI-compatible chat completions 中重复的问题已修复

  • • OpenAI-compatible chat completions API 默认不再是 streamed responses

  • • 修复客户端因默认流式导致的错误

  • • chat completions 在 LiteLLM providers 上失败的问题已修复,内部配置参数会先被过滤

  • • 序列化时 NaN、Inf 等非法数值导致 JSON 编码错误的问题修复

  • • 支持 array message content

  • • 聊天生成参数覆盖逻辑修复

  • • 空 chat model fallback 修复

  • • Creativity 参数未保存问题修复

  • • generation parameter overrides 修复

  • • max_tokens 从模型配置向下游传播修复

  • • embed completion request 增加 model_name

  • • 支持 chat 中 waiting 状态展示

  • • 修复 answer 重复、think 解析、post-think 重复等流式链路细节问题

    2)Agent、Workflow 与视觉能力修复

    • visual agent 调用路由到 image model

  • • agent launch 页面 pagesize 警告修复

  • • embedded website floating component 不显示 citations 的问题修复

  • • Visual Input File 中变量不显示的问题修复

  • • workflow 运行日志输入中显示解析后的变量

  • • switch conditions 为空时跳过

  • • regular expression 配置在 pipeline header-based chunking 中被重置的问题修复

  • • multiple tags 修复

  • • get is_tools from model record 修复

    十、Go API 大规模迁移与补齐:后端能力继续成型

    从“What’s Changed”来看,Go API 已经在 v0.26.0 中承担了越来越多的核心能力。新增或迁移的接口覆盖范围非常广,主要包括以下模块:

    1)系统与用户

    • PATCH /api/v1/users/me

  • • system healthz API

  • • /api/v1/system/status GET

  • • /system/stats

  • • /system/config/log 重构

  • • user registration initialization 修复

  • • /user/me 返回中包含 user model settings

  • • logout access token invalidation 持久化

  • • post /api/v1/system/tokens 修复

  • • no more @token_required

  • • consolidate beta auth

  • • password-reset flow

  • • forgot-password flow 迁移到 Go

    2)Agent 与 Workflow

    • GET /api/v1/agents list

  • • GET /api/v1/agents/ /versions

  • • GET /api/v1/agents/ /versions/

  • • POST /api/v1/agents/ /upload

  • • GET /agents/templates

  • • GET /api/v1/agents/prompts

  • • /api/v1/agents/

  • • /api/v1/agents/ /sessions

  • • PUT /api/v1/agents/ /tags

    3)连接器与 MCP Server

    • create_connector

  • • connector get API

  • • connector 管理 endpoints

  • • connector delete / rebuild / listlog

  • • connector PATCH

  • • check connection

  • • MCP server create / delete / list / update

  • • MCP server management endpoints

    4)数据集与文档

    • dataset ingestion log APIs

  • • /api/v1/datasets/ /metadata/config

  • • GET dataset metadata summary API

  • • DELETE /api/v1/datasets/:dataset_id/documents 迁移到 Go

  • • POST /api/v1/datasets/ /documents/stop 迁移到 Go

  • • datasets/ /documents/ /metadata 相关 API

  • • POST /api/v1/files/link-to-datasets

  • • thumbnails API

    5)检索与搜索

    • SearchBot ask

  • • SearchBot related_questions

  • • SearchBot retrieval_test

  • • RAG retrieval to chat completions

  • • RAGFlow server API in Go

  • • Elasticsearch result functions 补全

    十一、CLI 也在持续增强:模型、解析、切块都能更方便管理

    Go CLI 在本版本中同样收获了大量更新:

    • 检查 provider region

  • • 支持批量 model add/remove

  • • 支持可选 embedding dimension

  • • 新命令:list all models / show model

  • • 更新 supported models 列表

  • • 切换到 admin/api server

  • • CLI 文件系统清理

  • • parse 和 chunk 命令

  • • CLI 重构与测试修复

  • • list-models 函数重构

    对于自动化部署和运维来说,这些增强非常实用。

    十二、安全性、稳定性与运行时防护:这次修复量非常大

    v0.26.0 中还包含大量底层稳定性与安全修复,值得重点关注。

    1)安全修复

    • 修复 OIDC ID token verification 中的 JWT algorithm-confusion 问题

  • • 升级 crawl4ai 到 0.8.0 以修复相关 CVE

    2)运行时与 panic 防护

    • 修复多个 nil-pointer dereference 导致的 runtime panics

  • • 增加 missing row、missing blob、missing linked row 等各类 guard

  • • Go 1.25 下 http.DefaultTransport 类型断言保护

  • • storage blob 缺失时预览、图片、下载接口保护

  • • SearchService.get_detail 缺失行保护

  • • verify_api_key embedding 分支 await asyncio.wait_for 修复

  • • DeepSeek、VolcEngine streaming nil pointer 防护

    3)Docker 与部署修复

    • Dockerfile 与发布流程切换到 GitHub mirror

  • • slim Docker image

  • • 增加 .dockerignore

  • • 修复 Go binary shipping

  • • es01 /tmp 使用 tmpfs 解决 entrypoint 权限问题

  • • Tigris 作为 S3-compatible 存储后端文档支持

  • • 修复 s3 region 字段名

  • • OceanBase tenant startup drift 和文档修复

    十三、国际化:韩语、意大利语翻译完成

    v0.26.0 在 i18n 上也有进展:

    韩语翻译完成

  • 意大利语翻译完成

    此外,UI 层还有若干小修复,例如:

    • 个人资料页时区显示修复

  • • 主界面新增 chat 时自动弹出 warning 的问题修复

  • • x-spreadsheet 组件添加细滚动条样式

  • • 删除文件确认弹窗超长文件名溢出修复

    十四、文档更新同步到位

    本次版本还同步更新了多项文档:

    • converse with agent API reference 更新

  • • RSS feed ingest 指南新增

  • • Tigris 存储后端文档新增

  • • supported model providers and URLs 更新

  • • README 与文档中的版本引用更新到 v0.26.0

  • • v0.26.0 release notes 初稿与最终整理同步完成

    十五、RAGFlow v0.26.0 最值得关注的升级总结

    如果只看这次版本最有价值的升级,我认为重点有以下几项:

    第一,模型接入体验完成了一次质变

    从“手动输入模型名”,升级到“远程拉取可用模型列表并动态下拉展示”,这对多模型平台来说非常关键。再叠加同一 provider 多 API Key自定义编辑模型列表多 provider 验证修复,RAGFlow 的模型管理能力明显成熟了。

    第二,企业数据接入能力继续强化

    Outlook、OneDrive、Teams、Slack、SharePoint、Salesforce、Azure Blob Storage 七大连接器加入后,RAGFlow 在企业知识接入上的覆盖面更广了。

    第三,GraphRAG 进入更实用阶段

    社区抽取与实体消解支持断点恢复,实体排名、KG 检索、N-hop、Query Rewrite、community 搜索等能力同步完善,这对复杂知识图谱检索是实打实的增强。

    第四,推理模型流式体验提升明显

    移除
    文本缓冲后,reasoning 模型的实时反馈感更强;同时 MiniMax、Qwen 系列 thinking 相关问题得到大量修复。

    第五,稳定性修复覆盖面极广

    从 OpenAI-compatible 聊天接口,到文档预览、下载、切块、embedding、rerank、metadata filter、provider 驱动、Go API、CLI、Docker、数据库迁移,本次版本几乎在所有核心路径上都做了补强。

    十六、结语

    代码地址:github.com/infiniflow/ragflow

    总体来看,RAGFlow v0.26.0 是一个“功能扩展 + 架构补齐 + 稳定性修复”三线并进的大版本

    我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。 欢迎关注“福大大架构师每日一题”,发消息可获得面试资料,让AI助力您的未来发展。

    © 版权声明

    相关文章