From 633e03e88b00f93785e81c0c3dfda16517a2c728 Mon Sep 17 00:00:00 2001 From: xixirangrang Date: Tue, 27 Jan 2026 10:20:53 +0800 Subject: [PATCH 1/5] Translate Hybrid Search document to Chinese Translate the title and content of the Hybrid Search document to Chinese. --- ai/vector-search-hybrid-search.md | 12 ++++++------ 1 file changed, 6 insertions(+), 6 deletions(-) diff --git a/ai/vector-search-hybrid-search.md b/ai/vector-search-hybrid-search.md index 3995ac9e8531..dcb0a75534af 100644 --- a/ai/vector-search-hybrid-search.md +++ b/ai/vector-search-hybrid-search.md @@ -1,21 +1,21 @@ --- -title: Hybrid Search +title: 混合检索 summary: 同时使用全文检索和向量检索以提升检索质量。 aliases: ['/tidb/stable/vector-search-hybrid-search'] --- -# Hybrid Search +# 混合检索 -通过使用全文检索,你可以基于精确关键词检索文档。通过使用向量检索,你可以基于语义相似度检索文档。那么,我们能否将这两种检索方式结合起来,以提升检索质量并覆盖更多场景?答案是可以,这种方法被称为混合检索(hybrid search),并且在 AI 应用中被广泛使用。 +通过使用全文检索,你可以基于精确关键词检索文档。通过使用向量检索,你可以基于语义相似度检索文档。那么,我们能否将这两种检索方式结合起来,以提升检索质量并覆盖更多场景?答案是可以,这种方法被称为混合检索 (Hybrid Search),并且在 AI 应用中被广泛使用。 在 TiDB 中,混合检索的一般流程如下: -1. 使用 TiDB 进行 **全文检索** 和 **向量检索**。 +1. 使用 TiDB 进行**全文检索**和**向量检索**。 2. 使用 **reranker**(重排序器)对两种检索结果进行融合。 ![Hybrid Search](/media/vector-search/hybrid-search-overview.svg) -本教程演示了如何在 TiDB 中使用 [pytidb](https://github.com/pingcap/pytidb) Python SDK 实现混合检索,该 SDK 内置了 embedding 和 reranking 支持。使用 pytidb 并非强制要求 —— 你也可以直接使用 SQL 进行检索,并根据需要使用自定义的 reranking 模型。 +本教程演示了如何在 TiDB 中使用 [pytidb](https://github.com/pingcap/pytidb) Python SDK 实现混合检索,该 SDK 内置了 embedding 和 reranking 支持。使用 pytidb 并非强制要求,你也可以直接使用 SQL 进行检索,并根据需要使用自定义的 reranking 模型。 ## 前置条件 @@ -164,4 +164,4 @@ df = ( - [加入我们的 Discord](https://discord.gg/zcqexutz2R) - [访问我们的支持门户](https://tidb.support.pingcap.com/) - \ No newline at end of file + From 18572e719ab90ac6dc5920ebb912d66743a33482 Mon Sep 17 00:00:00 2001 From: houfaxin Date: Tue, 27 Jan 2026 11:05:18 +0800 Subject: [PATCH 2/5] Update vector-search-hybrid-search.md --- ai/vector-search-hybrid-search.md | 4 ++-- 1 file changed, 2 insertions(+), 2 deletions(-) diff --git a/ai/vector-search-hybrid-search.md b/ai/vector-search-hybrid-search.md index dcb0a75534af..2168cc031b0c 100644 --- a/ai/vector-search-hybrid-search.md +++ b/ai/vector-search-hybrid-search.md @@ -23,7 +23,7 @@ aliases: ['/tidb/stable/vector-search-hybrid-search'] - AWS: `Frankfurt (eu-central-1)` 和 `Singapore (ap-southeast-1)` -要完成本教程,请确保你在支持的区域拥有一个 TiDB Cloud Starter 集群。如果还没有,请参考 [创建 TiDB Cloud Starter 集群](/develop/dev-guide-build-cluster-in-cloud.md) 进行创建。 +要完成本教程,请确保你在支持的区域拥有一个 TiDB Cloud Starter 集群。如果还没有,请参考[创建 TiDB Cloud Starter 集群](/develop/dev-guide-build-cluster-in-cloud.md)进行创建。 ## 快速开始 @@ -53,7 +53,7 @@ db = TiDBClient.connect( ) ``` -你可以在 [TiDB Cloud 控制台](https://tidbcloud.com) 获取这些连接参数: +你可以在 [TiDB Cloud 控制台](https://tidbcloud.com)获取这些连接参数: 1. 进入 [**Clusters**](https://tidbcloud.com/project/clusters) 页面,点击目标集群名称进入集群概览页。 From 2347f0ed8a092a2e60d8ef94ae7279c98f9b21a8 Mon Sep 17 00:00:00 2001 From: houfaxin Date: Tue, 27 Jan 2026 11:11:31 +0800 Subject: [PATCH 3/5] Update vector search docs for terminology and clarity Revised references from 'Serverless' to 'Starter' for TiDB Cloud clusters, improved translation consistency, and clarified region names in both Python and SQL full-text search guides. Also adjusted formatting and link spacing for better readability. --- ai/vector-search-changelogs.md | 8 +-- ai/vector-search-full-text-search-python.md | 64 ++++++++++----------- ai/vector-search-full-text-search-sql.md | 14 ++--- 3 files changed, 43 insertions(+), 43 deletions(-) diff --git a/ai/vector-search-changelogs.md b/ai/vector-search-changelogs.md index 2bed2eedf8a0..8c5da41a1902 100644 --- a/ai/vector-search-changelogs.md +++ b/ai/vector-search-changelogs.md @@ -3,16 +3,16 @@ title: Vector Search Changelogs summary: 了解 TiDB 向量检索功能的新特性、兼容性变更、改进和缺陷修复。 --- -# Vector Search Changelogs +# Vector Search Changelogs ## 2025 年 7 月 15 日 -- TiDB Vector Search(测试版)现已支持 TiDB Cloud Dedicated(TiDB >= v8.4)集群。 +- TiDB Vector Search(测试版)现已支持 TiDB Cloud Dedicated (TiDB >= v8.4) 集群。 ## 2024 年 6 月 25 日 -- TiDB Vector Search(测试版)现已在所有区域的 TiDB Cloud Serverless 集群对所有用户开放。 +- TiDB Vector Search(测试版)现已在所有区域的 TiDB Cloud Starter 集群对所有用户开放。 ## 2024 年 4 月 1 日 -- TiDB Vector Search(测试版)现已在欧盟区域的 TiDB Cloud Serverless 集群对受邀用户开放。 \ No newline at end of file +- TiDB Vector Search(测试版)现已在欧盟区域的 TiDB Cloud Starter 集群对受邀用户开放。 \ No newline at end of file diff --git a/ai/vector-search-full-text-search-python.md b/ai/vector-search-full-text-search-python.md index 976935470f6f..24a9550c75f5 100644 --- a/ai/vector-search-full-text-search-python.md +++ b/ai/vector-search-full-text-search-python.md @@ -4,9 +4,9 @@ summary: 全文检索允许你根据精确的关键词检索文档。在 RAG( aliases: ['/tidb/stable/vector-search-full-text-search-python'] --- -# 使用 Python 进行全文检索 +# 使用 Python 进行全文检索 -与关注语义相似度的 [向量检索](/vector-search/vector-search-overview.md) 不同,全文检索允许你根据精确的关键词检索文档。在 RAG(检索增强生成)场景中,你可以将全文检索与向量检索结合使用,以提升检索质量。 +与关注语义相似度的[向量检索](/vector-search/vector-search-overview.md)不同,全文检索允许你根据精确的关键词检索文档。在 RAG(检索增强生成)场景中,你可以将全文检索与向量检索结合使用,以提升检索质量。 TiDB 的全文检索功能提供以下能力: @@ -14,23 +14,23 @@ TiDB 的全文检索功能提供以下能力: - **多语言支持**:无需指定语言即可获得高质量检索。TiDB 支持在同一张表中存储多种语言的文档,并会为每个文档自动选择最佳的文本分析器。 -- **按相关性排序**:检索结果可以使用被广泛采用的 [BM25 排序](https://en.wikipedia.org/wiki/Okapi_BM25) 算法按相关性排序。 +- **按相关性排序**:检索结果可以使用被广泛采用的 [BM25 排序](https://en.wikipedia.org/wiki/Okapi_BM25)算法按相关性排序。 - **完全兼容 SQL**:所有 SQL 功能,如预过滤、后过滤、分组和关联查询,都可以与全文检索结合使用。 > **提示:** > -> 有关 SQL 用法,参见 [使用 SQL 进行全文检索](/ai/vector-search-full-text-search-sql.md)。 +> 有关 SQL 用法,参见[使用 SQL 进行全文检索](/ai/vector-search-full-text-search-sql.md)。 > -> 如需在 AI 应用中同时使用全文检索和向量检索,参见 [混合检索](/ai/vector-search-hybrid-search.md)。 +> 如需在 AI 应用中同时使用全文检索和向量检索,参见[混合检索](/ai/vector-search-hybrid-search.md)。 ## 前提条件 全文检索目前仍处于早期阶段,我们正在持续向更多用户开放。目前,全文检索仅在以下区域的 TiDB Cloud Starter 和 TiDB Cloud Essential 上可用: -- AWS:`法兰克福 (eu-central-1)` 和 `新加坡 (ap-southeast-1)` +- AWS:`Frankfurt (eu-central-1)` 和 `Singapore (ap-southeast-1)` -要完成本教程,请确保你在支持的区域拥有一个 TiDB Cloud Starter 集群。如果还没有,请按照 [创建 TiDB Cloud Starter 集群](/develop/dev-guide-build-cluster-in-cloud.md) 创建。 +要完成本教程,请确保你在支持的区域拥有一个 TiDB Cloud Starter 集群。如果还没有,请按照[创建 TiDB Cloud Starter 集群](/develop/dev-guide-build-cluster-in-cloud.md)创建。 ## 快速开始 @@ -64,36 +64,36 @@ db = TiDBClient.connect( ) ``` -你可以在 [TiDB Cloud 控制台](https://tidbcloud.com) 获取这些连接参数: +你可以在 [TiDB Cloud 控制台](https://tidbcloud.com)获取这些连接参数: 1. 进入 [**Clusters**](https://tidbcloud.com/project/clusters) 页面,点击目标集群名称进入集群概览页。 2. 点击右上角的 **Connect**。此时会弹出连接对话框,显示连接参数。 - 例如,连接参数如下所示: - - ```text - HOST: gateway01.us-east-1.prod.shared.aws.tidbcloud.com - PORT: 4000 - USERNAME: 4EfqPF23YKBxaQb.root - PASSWORD: abcd1234 - DATABASE: test - CA: /etc/ssl/cert.pem - ``` - - 对应的 Python 代码如下: - - ```python - db = TiDBClient.connect( - host="gateway01.us-east-1.prod.shared.aws.tidbcloud.com", - port=4000, - username="4EfqPF23YKBxaQb.root", - password="abcd1234", - database="test", - ) - ``` - - 注意,上述示例仅用于演示。你需要使用自己的参数,并妥善保管。 + 例如,连接参数如下所示: + + ```text + HOST: gateway01.us-east-1.prod.shared.aws.tidbcloud.com + PORT: 4000 + USERNAME: 4EfqPF23YKBxaQb.root + PASSWORD: abcd1234 + DATABASE: test + CA: /etc/ssl/cert.pem + ``` + + 对应的 Python 代码如下: + + ```python + db = TiDBClient.connect( + host="gateway01.us-east-1.prod.shared.aws.tidbcloud.com", + port=4000, + username="4EfqPF23YKBxaQb.root", + password="abcd1234", + database="test", + ) + ``` + + 注意,上述示例仅用于演示。你需要使用自己的参数,并妥善保管。 ### 步骤 3. 创建表和全文索引 diff --git a/ai/vector-search-full-text-search-sql.md b/ai/vector-search-full-text-search-sql.md index f611ec2a1332..a8af1f6f7282 100644 --- a/ai/vector-search-full-text-search-sql.md +++ b/ai/vector-search-full-text-search-sql.md @@ -4,9 +4,9 @@ summary: 全文检索允许你根据精确关键词检索文档。在 RAG(检 aliases: ['/tidb/stable/vector-search-full-text-search-sql'] --- -# 使用 SQL 进行全文检索 +# 使用 SQL 进行全文检索 -与 [向量检索](/vector-search/vector-search-overview.md) 侧重于语义相似性不同,全文检索允许你根据精确关键词检索文档。在 RAG(检索增强生成)场景中,你可以将全文检索与向量检索结合使用,以提升检索质量。 +与[向量检索](/vector-search/vector-search-overview.md)侧重于语义相似性不同,全文检索允许你根据精确关键词检索文档。在检索增强生成 (Retrieval-Augmented Generation, RAG) 场景中,你可以将全文检索与向量检索结合使用,以提升检索质量。 TiDB 的全文检索功能提供以下能力: @@ -14,23 +14,23 @@ TiDB 的全文检索功能提供以下能力: - **支持多语言**:无需指定语言即可获得高质量检索。TiDB 的文本分析器支持同一张表中多种语言混合的文档,并会自动为每个文档选择最佳分析器。 -- **按相关性排序**:检索结果可以通过广泛采用的 [BM25 排序](https://en.wikipedia.org/wiki/Okapi_BM25) 算法按相关性排序。 +- **按相关性排序**:检索结果可以通过广泛采用的 [BM25 排序](https://en.wikipedia.org/wiki/Okapi_BM25)算法按相关性排序。 - **与 SQL 完全兼容**:所有 SQL 特性,如预过滤、后过滤、分组和关联查询等,都可以与全文检索结合使用。 > **提示:** > -> 关于 Python 的用法,请参见 [使用 Python 进行全文检索](/ai/vector-search-full-text-search-python.md)。 +> 关于 Python 的用法,请参见[使用 Python 进行全文检索](/ai/vector-search-full-text-search-python.md)。 > -> 如需在 AI 应用中同时使用全文检索和向量检索,请参见 [混合检索](/ai/vector-search-hybrid-search.md)。 +> 如需在 AI 应用中同时使用全文检索和向量检索,请参见[混合检索](/ai/vector-search-hybrid-search.md)。 ## 快速开始 全文检索目前仍处于早期阶段,我们正在持续向更多用户开放。目前,全文检索仅在以下区域的 TiDB Cloud Starter 和 TiDB Cloud Essential 上可用: -- AWS:`法兰克福 (eu-central-1)` 和 `新加坡 (ap-southeast-1)` +- AWS:`Frankfurt (eu-central-1)` 和 `Singapore (ap-southeast-1)` -在使用全文检索前,请确保你的 TiDB Cloud Starter 集群已创建在支持的区域。如果还没有,请按照 [创建 TiDB Cloud Starter 集群](/develop/dev-guide-build-cluster-in-cloud.md) 进行创建。 +在使用全文检索前,请确保你的 TiDB Cloud Starter 集群已创建在支持的区域。如果还没有,请按照[创建 TiDB Cloud Starter 集群](/develop/dev-guide-build-cluster-in-cloud.md)进行创建。 要执行全文检索,请按照以下步骤操作: From 7f18bcb1115d439146f186fcf19b5570668accc5 Mon Sep 17 00:00:00 2001 From: houfaxin Date: Tue, 27 Jan 2026 11:16:51 +0800 Subject: [PATCH 4/5] Update vector-search-changelogs.md --- ai/vector-search-changelogs.md | 10 +++++----- 1 file changed, 5 insertions(+), 5 deletions(-) diff --git a/ai/vector-search-changelogs.md b/ai/vector-search-changelogs.md index 8c5da41a1902..45a44da2b706 100644 --- a/ai/vector-search-changelogs.md +++ b/ai/vector-search-changelogs.md @@ -1,18 +1,18 @@ --- -title: Vector Search Changelogs +title: 向量检索变更日志 summary: 了解 TiDB 向量检索功能的新特性、兼容性变更、改进和缺陷修复。 --- -# Vector Search Changelogs +# 向量检索变更日志 ## 2025 年 7 月 15 日 -- TiDB Vector Search(测试版)现已支持 TiDB Cloud Dedicated (TiDB >= v8.4) 集群。 +- TiDB 向量检索 (Vector Search)(测试版)现已支持 TiDB Cloud Dedicated (TiDB >= v8.4) 集群。 ## 2024 年 6 月 25 日 -- TiDB Vector Search(测试版)现已在所有区域的 TiDB Cloud Starter 集群对所有用户开放。 +- TiDB 向量检索 (Vector Search)(测试版)现已在所有区域的 TiDB Cloud Starter 集群对所有用户开放。 ## 2024 年 4 月 1 日 -- TiDB Vector Search(测试版)现已在欧盟区域的 TiDB Cloud Starter 集群对受邀用户开放。 \ No newline at end of file +- TiDB 向量检索 (Vector Search)(测试版)现已在欧盟区域的 TiDB Cloud Starter 集群对受邀用户开放。 \ No newline at end of file From fd307610bffa18704e9b225d4eae7c68a1e8f9e1 Mon Sep 17 00:00:00 2001 From: houfaxin Date: Tue, 27 Jan 2026 11:57:08 +0800 Subject: [PATCH 5/5] update contact info --- ai/vector-search-full-text-search-python.md | 14 ++------------ ai/vector-search-full-text-search-sql.md | 14 ++------------ ai/vector-search-hybrid-search.md | 14 ++------------ 3 files changed, 6 insertions(+), 36 deletions(-) diff --git a/ai/vector-search-full-text-search-python.md b/ai/vector-search-full-text-search-python.md index 24a9550c75f5..31dd4ae624d6 100644 --- a/ai/vector-search-full-text-search-python.md +++ b/ai/vector-search-full-text-search-python.md @@ -159,15 +159,5 @@ df = ( 全文检索目前仍处于早期阶段,开放范围有限。如果你希望在尚未开放的区域体验全文检索,或有任何反馈和帮助需求,欢迎联系我们: - - -- [加入我们的 Discord](https://discord.gg/zcqexutz2R) - - - - - -- [加入我们的 Discord](https://discord.gg/zcqexutz2R) -- [访问我们的支持门户](https://tidb.support.pingcap.com/) - - +- 在 [AskTUG](https://asktug.com/?utm_source=docs-cn-dev-guide) 上进行提问 +- [提交 TiDB Cloud 工单](https://tidb.support.pingcap.com/servicedesk/customer/portals) diff --git a/ai/vector-search-full-text-search-sql.md b/ai/vector-search-full-text-search-sql.md index a8af1f6f7282..65a3078bbcff 100644 --- a/ai/vector-search-full-text-search-sql.md +++ b/ai/vector-search-full-text-search-sql.md @@ -206,15 +206,5 @@ WHERE t.author_id IN 全文检索目前仍处于早期阶段,开放范围有限。如果你希望在尚未开放的区域体验全文检索,或有任何反馈与帮助需求,欢迎联系我们: - - -- [加入我们的 Discord](https://discord.gg/zcqexutz2R) - - - - - -- [加入我们的 Discord](https://discord.gg/zcqexutz2R) -- [访问我们的支持门户](https://tidb.support.pingcap.com/) - - \ No newline at end of file +- 在 [AskTUG](https://asktug.com/?utm_source=docs-cn-dev-guide) 上进行提问 +- [提交 TiDB Cloud 工单](https://tidb.support.pingcap.com/servicedesk/customer/portals) diff --git a/ai/vector-search-hybrid-search.md b/ai/vector-search-hybrid-search.md index 2168cc031b0c..661a2cadb1d9 100644 --- a/ai/vector-search-hybrid-search.md +++ b/ai/vector-search-hybrid-search.md @@ -153,15 +153,5 @@ df = ( 全文检索目前仍处于早期阶段,开放范围有限。如果你希望在尚未开放的区域体验全文检索,或有任何反馈与帮助需求,欢迎联系我们: - - -- [加入我们的 Discord](https://discord.gg/zcqexutz2R) - - - - - -- [加入我们的 Discord](https://discord.gg/zcqexutz2R) -- [访问我们的支持门户](https://tidb.support.pingcap.com/) - - +- 在 [AskTUG](https://asktug.com/?utm_source=docs-cn-dev-guide) 上进行提问 +- [提交 TiDB Cloud 工单](https://tidb.support.pingcap.com/servicedesk/customer/portals)