From ac0db1f42f92d520af9ed00e4051fc2ae5ed5bbf Mon Sep 17 00:00:00 2001 From: TomShawn <41534398+TomShawn@users.noreply.github.com> Date: Tue, 6 Sep 2022 17:59:26 +0800 Subject: [PATCH 1/9] glossary: add some terms to glossary --- glossary.md | 46 ++++++++++++++++++++++++++++++++++++++++++++++ 1 file changed, 46 insertions(+) diff --git a/glossary.md b/glossary.md index 6751867e38f5..1843e45259c7 100644 --- a/glossary.md +++ b/glossary.md @@ -27,6 +27,10 @@ ACID 是指数据库管理系统在写入或更新资料的过程中,为保证 自动捕获绑定 (Baseline Capturing) 会对符合捕获条件的查询进行捕获,为符合条件的查询生成相应的绑定。通常用于升级时的[计划回退防护](/sql-plan-management.md#升级时的计划回退防护)。 +### Binlog + +在 TiDB 中,Binlog 指由 TiDB、MySQL 或 MariaDB 生成的一种二进制日志 (binary log),用于记录 TiDB 或上下游的数据库表结构变更(例如 `CREATE`、`ALTER TABLE` 语句等)和表数据修改(例如 `INSERT`、`DELETE`、`UPDATE` 语句等)。 + ### Bucket 一个 [Region](#regionpeerraft-group) 在逻辑上划分为多个小范围,称为 bucket。TiKV 按 bucket 收集查询统计数据,并将 bucket 的情况报告给 PD。详情参见 [Bucket 设计文档](https://github.com/tikv/rfcs/blob/master/text/0082-dynamic-size-region.md#bucket)。 @@ -37,6 +41,14 @@ ACID 是指数据库管理系统在写入或更新资料的过程中,为保证 缓存表 (Cached Table) 是指 TiDB 把整张表的数据加载到服务器的内存中,直接从内存中获取表数据,避免从 TiKV 获取表数据,从而提升读性能。详情参见[缓存表](/cached-tables.md)。 +### Cluster + +TiDB 数据库以及各组件的集合,部署在多节点服务器上,每个节点上运行实例,向客户端提供服务。 + +### Coprocessor + +一种替 TiDB 分担计算的协处理机制。位于存储层(TiKV 或 TiFlash),以 Region 为单位协同处理从 TiDB 下推的计算。 + ### Continuous Profiling 持续性能分析 (Continuous Profiling) 是从 TiDB v5.3 起引入的一种从系统调用层面解读资源开销的方法。引入该方法后,TiDB 可提供数据库源码级性能观测,通过火焰图的形式帮助研发、运维人员定位性能问题的根因。详情参见 [TiDB Dashboard 实例性能分析 - 持续分析页面](/dashboard/continuous-profiling.md)。 @@ -47,6 +59,16 @@ ACID 是指数据库管理系统在写入或更新资料的过程中,为保证 动态裁剪 (Dynamic Pruning) 是 TiDB 访问分区表的两种模式之一。在动态裁剪模式下,TiDB 的每个算子都支持直接访问多个分区,省略 Union 操作,提高执行效率,还避免了 Union 并发管理的问题。 +## G + +### GC (Garbage Collection) + +垃圾回收(GC 或 Garbage collection)是 TiDB 中的内存资源管理机制。当动态内存里的旧数据不再需要时,便予以清理,让出内存。详情参见 [GC 机制](/garbage-collection-overview.md)。 + +### Hotspot + +热点 (Hotspot) 指 TiKV 的读写负载集中于某一个或几个 Region 或节点的现象,此时可能会造成性能瓶颈,使性能无法达到最佳。要解决热点问题,可参考 [TiDB 热点问题处理](/troubleshoot-hot-spot-issues.md)。 + ## I ### Index Merge @@ -63,12 +85,22 @@ ACID 是指数据库管理系统在写入或更新资料的过程中,为保证 它们分别对应 [Peer](#regionpeerraft-group) 的三种角色。其中 Leader 负责响应客户端的读写请求;Follower 被动地从 Leader 同步数据,当 Leader 失效时会进行选举产生新的 Leader;Learner 是一种特殊的角色,它只参与同步 raft log 而不参与投票,在目前的实现中只短暂存在于添加副本的中间步骤。 +## M + +### Multi-version concurrency control (MVCC) + +TiDB 中的并发控制机制,对事务内读取到的内存做处理,实现对 TiDB 的并发访问,避免并发读写冲突造成的阻塞。 + ## O ### Old value Old value 特指在 TiCDC 输出的增量变更日志中的“原始值”。可以通过配置来指定 TiCDC 输出的增量变更日志是否包含“原始值”。 +### Online transactional processing (OLTP) + +全称为在线事务处理,即使用计算机系统来处理事务数据。 + ### Operator Operator 是应用于一个 Region 的,服务于某个调度目的的一系列操作的集合。例如“将 Region 2 的 Leader 迁移至 Store 5”,“将 Region 2 的副本迁移到 Store 1, 4, 5”等。 @@ -88,8 +120,18 @@ Operator Step 是 Operator 执行过程的一个步骤,一个 Operator 常常 - `PromoteLearner`:将指定 Learner 提升为 Follower - `SplitRegion`:将指定 Region 一分为二 +### Optimistic transaction + +使用乐观并发控制的事务,在并发环境中,外界对数据的操作一般不会造成冲突。开启乐观事务后,TiDB 只在事务最终提交时才会检测冲突。乐观事务模式适合读多写少的并发场景,能提高 TiDB 性能。 + +自 v3.0.8 开始,TiDB 集群默认使用悲观事务模式。但如果从 3.0.7 及之前版本创建的集群升级到 3.0.8 及之后的版本,不会改变默认事务模式,即只有新创建的集群才会默认使用悲观事务模式。详情参见 [TiDB 乐观事务模型](/optimistic-transaction.md)。 + ## P +### Partition table + +将 TiDB 中的一张表根据某些条件在物理上拆分为若干张表存放,以提高查询的效率。详情参考[分区表](/partitioned-table.md)文档。 + ### Pending/Down Pending 和 Down 是 Peer 可能出现的两种特殊状态。其中 Pending 表示 Follower 或 Learner 的 raft log 与 Leader 有较大差距,Pending 状态的 Follower 无法被选举成 Leader。Down 是指 Leader 长时间没有收到对应 Peer 的消息,通常意味着对应节点发生了宕机或者网络隔离。 @@ -124,6 +166,10 @@ TiKV 集群中的 Region 不是一开始就划分好的,而是随着数据写 备份操作的逆过程,即利用保存的备份数据还原出原始数据的过程。 +### RocksDB + +一款提供键值存储与读写功能的 LSM-tree 架构引擎,由 Facebook 基于 LevelDB 开发。RocksDB 是 TiKV 的核心存储引擎,用于存储 Raft 日志以及用户数据。 + ## S ### Scheduler From ac0a5b153cefc409de0ca151f1027f615a6823e9 Mon Sep 17 00:00:00 2001 From: TomShawn <41534398+TomShawn@users.noreply.github.com> Date: Tue, 6 Sep 2022 19:22:32 +0800 Subject: [PATCH 2/9] add another 16 terms --- glossary.md | 93 +++++++++++++++++++++++++++++++++++++++++++++++++++++ 1 file changed, 93 insertions(+) diff --git a/glossary.md b/glossary.md index 1843e45259c7..fc2e3977eaae 100644 --- a/glossary.md +++ b/glossary.md @@ -41,6 +41,12 @@ ACID 是指数据库管理系统在写入或更新资料的过程中,为保证 缓存表 (Cached Table) 是指 TiDB 把整张表的数据加载到服务器的内存中,直接从内存中获取表数据,避免从 TiKV 获取表数据,从而提升读性能。详情参见[缓存表](/cached-tables.md)。 +### Common table expression (CTE) + +公共表表达式 (CTE) 是一个临时的中间结果集,能够在 SQL 语句中引用多次,提高 SQL 语句的可读性与执行效率。在 TiDB 中可以通过 `WITH` 语句使用公共表表达式。公共表表达式可以分为非递归和递归两种类型。 + +详情参见[公共表表达式 (CTE)](/develop/dev-guide-use-common-table-expression.md)。 + ### Cluster TiDB 数据库以及各组件的集合,部署在多节点服务器上,每个节点上运行实例,向客户端提供服务。 @@ -55,10 +61,22 @@ TiDB 数据库以及各组件的集合,部署在多节点服务器上,每个 ## D +### Dumpling + +Dumpling 是一款数据导出工具,用于将存储在 TiDB 或 MySQL 中的数据导出为 SQL 或 CSV 格式,用于逻辑全量备份。Dumpling 也支持将数据导出到 Amazon S3 中。详情参见使用 [Dumpling 导出数据](/dumpling-overview.md)。 + ### Dynamic Pruning 动态裁剪 (Dynamic Pruning) 是 TiDB 访问分区表的两种模式之一。在动态裁剪模式下,TiDB 的每个算子都支持直接访问多个分区,省略 Union 操作,提高执行效率,还避免了 Union 并发管理的问题。 +## E + +### Expression index + +表达式索引 (expression index) 是一种特殊的索引,能将索引建立于表达式上。在创建了表达式索引后,基于表达式的查询便可以使用上索引,极大提升查询的性能。 + +详情参见 [CREATE INDEX - 表达式索引](/sql-statements/sql-statement-create-index.md#表达式索引)。 + ## G ### GC (Garbage Collection) @@ -69,12 +87,19 @@ TiDB 数据库以及各组件的集合,部署在多节点服务器上,每个 热点 (Hotspot) 指 TiKV 的读写负载集中于某一个或几个 Region 或节点的现象,此时可能会造成性能瓶颈,使性能无法达到最佳。要解决热点问题,可参考 [TiDB 热点问题处理](/troubleshoot-hot-spot-issues.md)。 +### HTAP + +全称为 "Hybrid Transactional and Analytical Processing",即在线事务与在线分析处理。TiDB HTAP 可以满足企业海量数据的增长需求、降低运维的风险成本、与现有的大数据栈无缝缝合,从而实现数据资产价值的实时变现。在 TiDB 中,面向在线事务处理的行存储引擎 TiKV 与面向实时分析场景的列存储引擎 TiFlash 同时存在,自动同步,保持强一致性。 + +详情参见 [HTAP 快速上手指南](/quick-start-with-htap.md)和 [HTAP 深入探索指南](/explore-htap.md) + ## I ### Index Merge 索引合并 (Index Merge) 是在 TiDB v4.0 版本中作为实验特性引入的一种查询执行方式的优化,可以大幅提高查询在扫描多列数据时条件过滤的效率。自 v5.4 版本起,Index Merge 成为正式功能,详情参见[用 EXPLAIN 查看索引合并的 SQL 执行计划](/explain-index-merge.md)。 + ### In-Memory Pessimistic Lock 内存悲观锁 (In-Memory Pessimistic Lock) 是在 TiDB v6.0.0 中引入的新功能。开启内存悲观锁功能后,悲观锁通常只会被存储在 Region leader 的内存中,而不会将锁持久化到磁盘,也不会通过 Raft 协议将锁同步到其他副本,因此可以大大降低悲观事务加锁的开销,提升悲观事务的吞吐并降低延迟。 @@ -85,8 +110,20 @@ TiDB 数据库以及各组件的集合,部署在多节点服务器上,每个 它们分别对应 [Peer](#regionpeerraft-group) 的三种角色。其中 Leader 负责响应客户端的读写请求;Follower 被动地从 Leader 同步数据,当 Leader 失效时会进行选举产生新的 Leader;Learner 是一种特殊的角色,它只参与同步 raft log 而不参与投票,在目前的实现中只短暂存在于添加副本的中间步骤。 +### Lock View + +Lock View 特性用于提供关于悲观锁的锁冲突和锁等待的更多信息,方便 DBA 通过锁视图功能来观察事务加锁情况以及排查死锁问题。 + +详情参见系统表文档 [TIDB_TRX](/information-schema/information-schema-tidb-trx.md)、[DATA_LOCK_WAITS](/information-schema/information-schema-data-lock-waits.md) 和 [DEADLOCKS](/information-schema/information-schema-deadlocks.md)。 + ## M +### MPP + +TiDB 在 v5.0 版本引入的计算架构,即在计算中引入跨节点的数据交换(data shuffle 过程),使得大型表连接类查询可以由不同 TiFlash 节点分担来共同完成,从而加速计算过程,提升查询性能。 + +详情参见[使用 MPP 模式](/tiflash/use-tiflash-mpp-mode.md)。 + ### Multi-version concurrency control (MVCC) TiDB 中的并发控制机制,对事务内读取到的内存做处理,实现对 TiDB 的并发访问,避免并发读写冲突造成的阻塞。 @@ -136,6 +173,16 @@ Operator Step 是 Operator 执行过程的一个步骤,一个 Operator 常常 Pending 和 Down 是 Peer 可能出现的两种特殊状态。其中 Pending 表示 Follower 或 Learner 的 raft log 与 Leader 有较大差距,Pending 状态的 Follower 无法被选举成 Leader。Down 是指 Leader 长时间没有收到对应 Peer 的消息,通常意味着对应节点发生了宕机或者网络隔离。 +### PD Control (pd-ctl) + +PD Control(或 pd-ctl)是 PD 的命令行工具,用于获取集群状态信息和调整集群。详情参见 [PD Control 使用说明](/pd-control.md)。 + +### Placement Rules + +Placement Rules 特性用于通过 SQL 接口配置数据在 TiKV 集群中的放置位置。通过该功能,用户可以将表和分区指定部署至不同的地域、机房、机柜、主机。适用场景包括低成本优化数据高可用策略、保证本地的数据副本可用于本地 Stale Read 读取、遵守数据本地要求等。 + +详情参见 [Placement Rules in SQL](/placement-rules-in-sql.md)。 + ### Predicate columns 执行 SQL 语句时,优化器在大多数情况下只会用到部分列(例如, `WHERE`、`JOIN`、`ORDER BY`、`GROUP BY` 子句中出现的列)的统计信息,这些用到的列称为 `PREDICATE COLUMNS`。详情参见[收集部分列的统计信息](/statistics.md#收集部分列的统计信息)。 @@ -172,6 +219,18 @@ TiKV 集群中的 Region 不是一开始就划分好的,而是随着数据写 ## S +### Stale Read + +Stale Read 是一种读取历史数据版本的机制,读取 TiDB 中存储的历史数据版本。通过 Stale Read 功能,你能从指定时间点或时间范围内读取对应的历史数据,从而避免数据同步带来延迟。当使用 Stale Read 时,TiDB 默认会随机选择一个副本来读取数据,因此能利用所有副本。 + +详情参见 [Stale Read](/stale-read.md)。 + +### Security Enhanced Mode + +即安全增强模式,用于对 TiDB 管理员进行更细粒度的权限划分。安全增强模式受[安全增强式 Linux](https://zh.wikipedia.org/wiki/安全增强式Linux) 等系统设计的启发,削减拥有 MySQL `SUPER` 权限的用户能力,转而使用细粒度的 `RESTRICTED` 权限作为替代。 + +详情参见[系统变量文档 - `tidb_enable_enhanced_security`](/system-variables.md#tidb_enable_enhanced_security)。 + ### Scheduler Scheduler(调度器)是 PD 中生成调度的组件。PD 中每个调度器是独立运行的,分别服务于不同的调度目的。常用的调度器及其调用目标有: @@ -187,6 +246,40 @@ PD 中的 Store 指的是集群中的存储节点,也就是 tikv-server 实例 ## T +### Temporary table + +临时表 (temporary table) 解决了业务中间计算结果的临时存储问题,让用户免于频繁地建表和删表等操作。用户可将业务上的中间计算数据存入临时表,用完数据后 TiDB 自动清理回收临时表。这避免了用户业务过于复杂,减少了表管理开销,并提升了性能。 + +详情参见[临时表](/temporary-tables.md)。 + +### TiDB Data Migration (DM) + +TiDB Data Migration (DM) 是一款便捷的数据迁移工具,支持从与 MySQL 协议兼容的数据库(MySQL、MariaDB、Aurora MySQL)到 TiDB 的全量数据迁移和增量数据同步。使用 DM 工具有利于简化数据迁移过程,降低数据迁移运维成本。 + +更多关于 DM 的概念和术语,参见 [TiDB Data Migration 术语表](/dm/dm-glossary.md)。 + +### TiDB Lightning + +TiDB Lightning 是一款数据导入工具,用于从静态文件导入 TB 级数据到 TiDB 集群,常用于 TiDB 集群的初始化数据导入。 + +更多关于 TiDB Lightning 的概念和术语,参见 [TiDB Lightning 术语表](/tidb-lightning/tidb-lightning-glossary.md)。 + +### TiCDC + +TiCDC 是一款 TiDB 增量数据同步工具,通过拉取上游 TiKV 的数据变更日志,TiCDC 可以将数据解析为有序的行级变更数据输出到下游。更多关于 TiCDC 的概念和术语,参见 [TiCDC 术语表](/ticdc/ticdc-glossary.md)。 + +### TiFlash + +TiFlash 是 TiDB HTAP 形态的关键组件,它是 TiKV 的列存扩展,在提供良好隔离性的同时,也兼顾了强一致性。列存副本通过 Raft Learner 协议异步复制,但是在读取的时候通过 Raft 校对索引配合 MVCC 的方式获得 Snapshot Isolation 的一致性隔离级别。这个架构很好地解决了 HTAP 场景的隔离性以及列存同步的问题。 + +更多详情参见 [TiFlash 简介](/tiflash/tiflash-overview.md)。 + +### TiUP + +TiDB 于 v4.0 版本引入的包管理工具,用于 TiDB 集群的部署、升级、管理,管理着 TiDB 生态下众多的组件,如 TiDB、PD、TiKV 等。用户想要运行 TiDB 生态中任何组件时,只需要执行 TiUP 一行命令即可,相比以前,大大降低了管理难度。 + +详情参见 [TiUP 简介](/tiup/tiup-overview.md)。 + ### Top SQL Top SQL 用于找到一段时间内对某个 TiDB 或 TiKV 节点消耗负载较大的 SQL 查询。详情参见 [Top SQL 用户文档](/dashboard/top-sql.md)。 From a9ef0825472b4361703f098a20c62d4bd13e9284 Mon Sep 17 00:00:00 2001 From: TomShawn <41534398+TomShawn@users.noreply.github.com> Date: Wed, 7 Sep 2022 10:17:16 +0800 Subject: [PATCH 3/9] Update glossary.md --- glossary.md | 1 - 1 file changed, 1 deletion(-) diff --git a/glossary.md b/glossary.md index fc2e3977eaae..bbd764b36ae7 100644 --- a/glossary.md +++ b/glossary.md @@ -99,7 +99,6 @@ Dumpling 是一款数据导出工具,用于将存储在 TiDB 或 MySQL 中的 索引合并 (Index Merge) 是在 TiDB v4.0 版本中作为实验特性引入的一种查询执行方式的优化,可以大幅提高查询在扫描多列数据时条件过滤的效率。自 v5.4 版本起,Index Merge 成为正式功能,详情参见[用 EXPLAIN 查看索引合并的 SQL 执行计划](/explain-index-merge.md)。 - ### In-Memory Pessimistic Lock 内存悲观锁 (In-Memory Pessimistic Lock) 是在 TiDB v6.0.0 中引入的新功能。开启内存悲观锁功能后,悲观锁通常只会被存储在 Region leader 的内存中,而不会将锁持久化到磁盘,也不会通过 Raft 协议将锁同步到其他副本,因此可以大大降低悲观事务加锁的开销,提升悲观事务的吞吐并降低延迟。 From 683bcc9a7c2e4e2fd4d9e26972d4ac0d482c106b Mon Sep 17 00:00:00 2001 From: TomShawn <41534398+TomShawn@users.noreply.github.com> Date: Tue, 13 Sep 2022 15:43:50 +0800 Subject: [PATCH 4/9] Apply suggestions from code review Co-authored-by: Lilian Lee --- glossary.md | 24 ++++++++++-------------- 1 file changed, 10 insertions(+), 14 deletions(-) diff --git a/glossary.md b/glossary.md index bbd764b36ae7..446f1c0a2db9 100644 --- a/glossary.md +++ b/glossary.md @@ -43,7 +43,7 @@ ACID 是指数据库管理系统在写入或更新资料的过程中,为保证 ### Common table expression (CTE) -公共表表达式 (CTE) 是一个临时的中间结果集,能够在 SQL 语句中引用多次,提高 SQL 语句的可读性与执行效率。在 TiDB 中可以通过 `WITH` 语句使用公共表表达式。公共表表达式可以分为非递归和递归两种类型。 +公共表表达式 (CTE) 是一个临时的中间结果集,能够在 SQL 语句中引用多次,提高 SQL 语句的可读性与执行效率。在 TiDB 中可以通过 `WITH` 语句使用公共表表达式。公共表表达式分为非递归和递归两种类型。 详情参见[公共表表达式 (CTE)](/develop/dev-guide-use-common-table-expression.md)。 @@ -63,7 +63,7 @@ TiDB 数据库以及各组件的集合,部署在多节点服务器上,每个 ### Dumpling -Dumpling 是一款数据导出工具,用于将存储在 TiDB 或 MySQL 中的数据导出为 SQL 或 CSV 格式,用于逻辑全量备份。Dumpling 也支持将数据导出到 Amazon S3 中。详情参见使用 [Dumpling 导出数据](/dumpling-overview.md)。 +Dumpling 是一款数据导出工具,用于将存储在 TiDB 或 MySQL 中的数据导出为 SQL 或 CSV 格式,用于逻辑全量备份。Dumpling 也支持将数据导出到 Amazon S3 中。详情参见[使用 Dumpling 导出数据](/dumpling-overview.md)。 ### Dynamic Pruning @@ -81,7 +81,7 @@ Dumpling 是一款数据导出工具,用于将存储在 TiDB 或 MySQL 中的 ### GC (Garbage Collection) -垃圾回收(GC 或 Garbage collection)是 TiDB 中的内存资源管理机制。当动态内存里的旧数据不再需要时,便予以清理,让出内存。详情参见 [GC 机制](/garbage-collection-overview.md)。 +垃圾回收(GC 或 Garbage collection)是 TiDB 中的内存资源管理机制。当不再需要动态内存里的旧数据时,便予以清理,让出内存。详情参见 [GC 机制](/garbage-collection-overview.md)。 ### Hotspot @@ -91,7 +91,7 @@ Dumpling 是一款数据导出工具,用于将存储在 TiDB 或 MySQL 中的 全称为 "Hybrid Transactional and Analytical Processing",即在线事务与在线分析处理。TiDB HTAP 可以满足企业海量数据的增长需求、降低运维的风险成本、与现有的大数据栈无缝缝合,从而实现数据资产价值的实时变现。在 TiDB 中,面向在线事务处理的行存储引擎 TiKV 与面向实时分析场景的列存储引擎 TiFlash 同时存在,自动同步,保持强一致性。 -详情参见 [HTAP 快速上手指南](/quick-start-with-htap.md)和 [HTAP 深入探索指南](/explore-htap.md) +详情参见 [HTAP 快速上手指南](/quick-start-with-htap.md)和 [HTAP 深入探索指南](/explore-htap.md)。 ## I @@ -164,7 +164,7 @@ Operator Step 是 Operator 执行过程的一个步骤,一个 Operator 常常 ## P -### Partition table +### Partitioned table 将 TiDB 中的一张表根据某些条件在物理上拆分为若干张表存放,以提高查询的效率。详情参考[分区表](/partitioned-table.md)文档。 @@ -253,31 +253,27 @@ PD 中的 Store 指的是集群中的存储节点,也就是 tikv-server 实例 ### TiDB Data Migration (DM) -TiDB Data Migration (DM) 是一款便捷的数据迁移工具,支持从与 MySQL 协议兼容的数据库(MySQL、MariaDB、Aurora MySQL)到 TiDB 的全量数据迁移和增量数据同步。使用 DM 工具有利于简化数据迁移过程,降低数据迁移运维成本。 +[TiDB Data Migration (DM)](/dm/dm-overview.md) 是一款便捷的数据迁移工具,支持从与 MySQL 协议兼容的数据库(MySQL、MariaDB、Aurora MySQL)到 TiDB 的全量数据迁移和增量数据同步。使用 DM 工具有利于简化数据迁移过程,降低数据迁移运维成本。 更多关于 DM 的概念和术语,参见 [TiDB Data Migration 术语表](/dm/dm-glossary.md)。 ### TiDB Lightning -TiDB Lightning 是一款数据导入工具,用于从静态文件导入 TB 级数据到 TiDB 集群,常用于 TiDB 集群的初始化数据导入。 +[TiDB Lightning](/tidb-lightning/tidb-lightning-overview.md) 是一款数据导入工具,用于从静态文件导入 TB 级数据到 TiDB 集群,常用于 TiDB 集群的初始化数据导入。 更多关于 TiDB Lightning 的概念和术语,参见 [TiDB Lightning 术语表](/tidb-lightning/tidb-lightning-glossary.md)。 ### TiCDC -TiCDC 是一款 TiDB 增量数据同步工具,通过拉取上游 TiKV 的数据变更日志,TiCDC 可以将数据解析为有序的行级变更数据输出到下游。更多关于 TiCDC 的概念和术语,参见 [TiCDC 术语表](/ticdc/ticdc-glossary.md)。 +[TiCDC](/ticdc/ticdc-overview.md) 是一款 TiDB 增量数据同步工具,通过拉取上游 TiKV 的数据变更日志,TiCDC 可以将数据解析为有序的行级变更数据输出到下游。更多关于 TiCDC 的概念和术语,参见 [TiCDC 术语表](/ticdc/ticdc-glossary.md)。 ### TiFlash -TiFlash 是 TiDB HTAP 形态的关键组件,它是 TiKV 的列存扩展,在提供良好隔离性的同时,也兼顾了强一致性。列存副本通过 Raft Learner 协议异步复制,但是在读取的时候通过 Raft 校对索引配合 MVCC 的方式获得 Snapshot Isolation 的一致性隔离级别。这个架构很好地解决了 HTAP 场景的隔离性以及列存同步的问题。 - -更多详情参见 [TiFlash 简介](/tiflash/tiflash-overview.md)。 +[TiFlash](/tiflash/tiflash-overview.md) 是 TiDB HTAP 形态的关键组件,它是 TiKV 的列存扩展,在提供良好隔离性的同时,也兼顾了强一致性。列存副本通过 Raft Learner 协议异步复制,但是在读取的时候通过 Raft 校对索引配合 MVCC 的方式获得 Snapshot Isolation 的一致性隔离级别。这个架构很好地解决了 HTAP 场景的隔离性以及列存同步的问题。 ### TiUP -TiDB 于 v4.0 版本引入的包管理工具,用于 TiDB 集群的部署、升级、管理,管理着 TiDB 生态下众多的组件,如 TiDB、PD、TiKV 等。用户想要运行 TiDB 生态中任何组件时,只需要执行 TiUP 一行命令即可,相比以前,大大降低了管理难度。 - -详情参见 [TiUP 简介](/tiup/tiup-overview.md)。 +[TiUP](/tiup/tiup-overview.md) 是 TiDB 于 v4.0 版本引入的包管理工具,用于 TiDB 集群的部署、升级、管理,管理着 TiDB 生态下众多的组件,如 TiDB、PD、TiKV 等。用户想要运行 TiDB 生态中任何组件时,只需要执行 TiUP 一行命令即可,相比以前,大大降低了管理难度。 ### Top SQL From 2361cefedb757b49d6827160f4a5820cc40e4db3 Mon Sep 17 00:00:00 2001 From: Ran Date: Fri, 8 Dec 2023 14:21:41 +0800 Subject: [PATCH 5/9] sort in alphebetical order --- glossary.md | 48 +++++++++++++++++++++++++----------------------- 1 file changed, 25 insertions(+), 23 deletions(-) diff --git a/glossary.md b/glossary.md index b121196734be..7aefd0bc2ac5 100644 --- a/glossary.md +++ b/glossary.md @@ -50,6 +50,10 @@ ACID 是指数据库管理系统在写入或更新资料的过程中,为保证 缓存表 (Cached Table) 是指 TiDB 把整张表的数据加载到服务器的内存中,直接从内存中获取表数据,避免从 TiKV 获取表数据,从而提升读性能。详情参见[缓存表](/cached-tables.md)。 +### Cluster + +TiDB 数据库以及各组件的集合,部署在多节点服务器上,每个节点上运行实例,向客户端提供服务。 + ### Coalesce Partition Coalesce Partition 是一种减少 Hash 分区表或 Key 分区表中分区数量的方法。详情参见[管理 Hash 分区和 Key 分区](/partitioned-table.md#管理-hash-分区和-key-分区)。 @@ -60,18 +64,14 @@ Coalesce Partition 是一种减少 Hash 分区表或 Key 分区表中分区数 详情参见[公共表表达式 (CTE)](/develop/dev-guide-use-common-table-expression.md)。 -### Cluster +### Continuous Profiling -TiDB 数据库以及各组件的集合,部署在多节点服务器上,每个节点上运行实例,向客户端提供服务。 +持续性能分析 (Continuous Profiling) 是从 TiDB v5.3 起引入的一种从系统调用层面解读资源开销的方法。引入该方法后,TiDB 可提供数据库源码级性能观测,通过火焰图的形式帮助研发、运维人员定位性能问题的根因。详情参见 [TiDB Dashboard 实例性能分析 - 持续分析页面](/dashboard/continuous-profiling.md)。 ### Coprocessor 一种替 TiDB 分担计算的协处理机制。位于存储层(TiKV 或 TiFlash),以 Region 为单位协同处理从 TiDB 下推的计算。 -### Continuous Profiling - -持续性能分析 (Continuous Profiling) 是从 TiDB v5.3 起引入的一种从系统调用层面解读资源开销的方法。引入该方法后,TiDB 可提供数据库源码级性能观测,通过火焰图的形式帮助研发、运维人员定位性能问题的根因。详情参见 [TiDB Dashboard 实例性能分析 - 持续分析页面](/dashboard/continuous-profiling.md)。 - ## D ### Dumpling @@ -96,6 +96,8 @@ Dumpling 是一款数据导出工具,用于将存储在 TiDB 或 MySQL 中的 垃圾回收(GC 或 Garbage collection)是 TiDB 中的内存资源管理机制。当不再需要动态内存里的旧数据时,便予以清理,让出内存。详情参见 [GC 机制](/garbage-collection-overview.md)。 +## H + ### Hotspot 热点 (Hotspot) 指 TiKV 的读写负载集中于某一个或几个 Region 或节点的现象,此时可能会造成性能瓶颈,使性能无法达到最佳。要解决热点问题,可参考 [TiDB 热点问题处理](/troubleshoot-hot-spot-issues.md)。 @@ -181,14 +183,14 @@ Operator Step 是 Operator 执行过程的一个步骤,一个 Operator 常常 [Partitioning](/partitioned-table.md)(分区)指通过 `RANGE`、`LIST`、`HASH` 和 `KEY` 等分区方法在物理上将一张表划分为较小的分区。这些较小的分区为分区表 (Partitioned Table)。 -### Pending/Down - -Pending 和 Down 是 Peer 可能出现的两种特殊状态。其中 Pending 表示 Follower 或 Learner 的 raft log 与 Leader 有较大差距,Pending 状态的 Follower 无法被选举成 Leader。Down 是指 Leader 长时间没有收到对应 Peer 的消息,通常意味着对应节点发生了宕机或者网络隔离。 - ### PD Control (pd-ctl) PD Control(或 pd-ctl)是 PD 的命令行工具,用于获取集群状态信息和调整集群。详情参见 [PD Control 使用说明](/pd-control.md)。 +### Pending/Down + +Pending 和 Down 是 Peer 可能出现的两种特殊状态。其中 Pending 表示 Follower 或 Learner 的 raft log 与 Leader 有较大差距,Pending 状态的 Follower 无法被选举成 Leader。Down 是指 Leader 长时间没有收到对应 Peer 的消息,通常意味着对应节点发生了宕机或者网络隔离。 + ### Placement Rules Placement Rules 特性用于通过 SQL 接口配置数据在 TiKV 集群中的放置位置。通过该功能,用户可以将表和分区指定部署至不同的地域、机房、机柜、主机。适用场景包括低成本优化数据高可用策略、保证本地的数据副本可用于本地 Stale Read 读取、遵守数据本地要求等。 @@ -235,11 +237,14 @@ TiKV 集群中的 Region 不是一开始就划分好的,而是随着数据写 ## S -### Stale Read +### Scheduler -Stale Read 是一种读取历史数据版本的机制,读取 TiDB 中存储的历史数据版本。通过 Stale Read 功能,你能从指定时间点或时间范围内读取对应的历史数据,从而避免数据同步带来延迟。当使用 Stale Read 时,TiDB 默认会随机选择一个副本来读取数据,因此能利用所有副本。 +Scheduler(调度器)是 PD 中生成调度的组件。PD 中每个调度器是独立运行的,分别服务于不同的调度目的。常用的调度器及其调用目标有: -详情参见 [Stale Read](/stale-read.md)。 +- `balance-leader-scheduler`:保持不同节点的 Leader 均衡。 +- `balance-region-scheduler`:保持不同节点的 Peer 均衡。 +- `hot-region-scheduler`:保持不同节点的读写热点 Region 均衡。 +- `evict-leader-{store-id}`:驱逐某个节点的所有 Leader。(常用于滚动升级) ### Security Enhanced Mode @@ -247,14 +252,11 @@ Stale Read 是一种读取历史数据版本的机制,读取 TiDB 中存储的 详情参见[系统变量文档 - `tidb_enable_enhanced_security`](/system-variables.md#tidb_enable_enhanced_security)。 -### Scheduler +### Stale Read -Scheduler(调度器)是 PD 中生成调度的组件。PD 中每个调度器是独立运行的,分别服务于不同的调度目的。常用的调度器及其调用目标有: +Stale Read 是一种读取历史数据版本的机制,读取 TiDB 中存储的历史数据版本。通过 Stale Read 功能,你能从指定时间点或时间范围内读取对应的历史数据,从而避免数据同步带来延迟。当使用 Stale Read 时,TiDB 默认会随机选择一个副本来读取数据,因此能利用所有副本。 -- `balance-leader-scheduler`:保持不同节点的 Leader 均衡。 -- `balance-region-scheduler`:保持不同节点的 Peer 均衡。 -- `hot-region-scheduler`:保持不同节点的读写热点 Region 均衡。 -- `evict-leader-{store-id}`:驱逐某个节点的所有 Leader。(常用于滚动升级) +详情参见 [Stale Read](/stale-read.md)。 ### Store @@ -268,6 +270,10 @@ PD 中的 Store 指的是集群中的存储节点,也就是 tikv-server 实例 详情参见[临时表](/temporary-tables.md)。 +### TiCDC + +[TiCDC](/ticdc/ticdc-overview.md) 是一款 TiDB 增量数据同步工具,通过拉取上游 TiKV 的数据变更日志,TiCDC 可以将数据解析为有序的行级变更数据输出到下游。更多关于 TiCDC 的概念和术语,参见 [TiCDC 术语表](/ticdc/ticdc-glossary.md)。 + ### TiDB Data Migration (DM) [TiDB Data Migration (DM)](/dm/dm-overview.md) 是一款便捷的数据迁移工具,支持从与 MySQL 协议兼容的数据库(MySQL、MariaDB、Aurora MySQL)到 TiDB 的全量数据迁移和增量数据同步。使用 DM 工具有利于简化数据迁移过程,降低数据迁移运维成本。 @@ -280,10 +286,6 @@ PD 中的 Store 指的是集群中的存储节点,也就是 tikv-server 实例 更多关于 TiDB Lightning 的概念和术语,参见 [TiDB Lightning 术语表](/tidb-lightning/tidb-lightning-glossary.md)。 -### TiCDC - -[TiCDC](/ticdc/ticdc-overview.md) 是一款 TiDB 增量数据同步工具,通过拉取上游 TiKV 的数据变更日志,TiCDC 可以将数据解析为有序的行级变更数据输出到下游。更多关于 TiCDC 的概念和术语,参见 [TiCDC 术语表](/ticdc/ticdc-glossary.md)。 - ### TiFlash [TiFlash](/tiflash/tiflash-overview.md) 是 TiDB HTAP 形态的关键组件,它是 TiKV 的列存扩展,在提供良好隔离性的同时,也兼顾了强一致性。列存副本通过 Raft Learner 协议异步复制,但是在读取的时候通过 Raft 校对索引配合 MVCC 的方式获得 Snapshot Isolation 的一致性隔离级别。这个架构很好地解决了 HTAP 场景的隔离性以及列存同步的问题。 From c07ed6041a122ae82221368f217628a9d1bb9556 Mon Sep 17 00:00:00 2001 From: qiancai Date: Thu, 23 Jan 2025 16:48:42 +0800 Subject: [PATCH 6/9] Update glossary.md --- glossary.md | 13 ------------- 1 file changed, 13 deletions(-) diff --git a/glossary.md b/glossary.md index 12385d5212c8..8b162b6c27b9 100644 --- a/glossary.md +++ b/glossary.md @@ -41,10 +41,6 @@ ACID 是指数据库管理系统在写入或更新资料的过程中,为保证 自动捕获绑定 (Baseline Capturing) 会对符合捕获条件的查询进行捕获,为符合条件的查询生成相应的绑定。通常用于升级时的[计划回退防护](/sql-plan-management.md#升级时的计划回退防护)。 -### Binlog - -在 TiDB 中,Binlog 指由 TiDB、MySQL 或 MariaDB 生成的一种二进制日志 (binary log),用于记录 TiDB 或上下游的数据库表结构变更(例如 `CREATE`、`ALTER TABLE` 语句等)和表数据修改(例如 `INSERT`、`DELETE`、`UPDATE` 语句等)。 - ### Bucket 一个 [Region](#regionpeerraft-group) 在逻辑上划分为多个小范围,称为 bucket。TiKV 按 bucket 收集查询统计数据,并将 bucket 的情况报告给 PD。详情参见 [Bucket 设计文档](https://github.com/tikv/rfcs/blob/master/text/0082-dynamic-size-region.md#bucket)。 @@ -127,7 +123,6 @@ Dumpling 是一款数据导出工具,用于将存储在 TiDB 或 MySQL 中的 垃圾回收 (Garbage Collection, GC) 指清理不再需要的旧数据以释放资源的过程。关于 TiKV 垃圾回收过程的详情,请参见[垃圾回收概述](/garbage-collection-overview.md)。 - ### General Availability (GA) 一个功能 GA (General Availability) 意味着该功能已进行充分测试并可在生产环境中使用。根据每个功能的开发情况不同,TiDB 中的新功能可能会在[开发里程碑版本 (DMR)](#development-milestone-release-dmr) 中 GA,也可能会在[长期支持版本 (LTS)](#long-term-support-lts) 中 GA 。由于 TiDB 不提供基于 DMR 的补丁版本,在生产环境中建议使用 LTS 版本。 @@ -192,8 +187,6 @@ Lock View 特性用于提供关于悲观锁的锁冲突和锁等待的更多信 从 v5.0 起,TiDB 通过 TiFlash 节点引入了 Massively Parallel Processing (MPP) 架构。这使得大型表连接类查询可以由不同 TiFlash 节点共同分担完成。当 MPP 模式开启后,TiDB 将会根据代价决定是否应该交由 MPP 框架进行计算。MPP 模式下,表连接将通过对 JOIN Key 进行数据计算时重分布(Exchange 操作)的方式把计算压力分摊到各个 TiFlash 执行节点,从而达到加速计算的目的。更多信息请参见[使用 MPP 模式](/tiflash/use-tiflash-mpp-mode.md)。 -详情参见[使用 MPP 模式](/tiflash/use-tiflash-mpp-mode.md)。 - ### Multi-version concurrency control (MVCC) [MVCC](https://zh.wikipedia.org/wiki/多版本并发控制)(多版本并发控制)是 TiDB 和其他数据库中的一种并发控制机制。它处理事务的内存读取,以实现对 TiDB 的并发访问,从而避免由并发读写冲突引起的阻塞。 @@ -362,12 +355,6 @@ PD 中的 Store 指的是集群中的存储节点,也就是 tikv-server 实例 [TiCDC](/ticdc/ticdc-overview.md) 是一款 TiDB 增量数据同步工具,通过拉取上游 TiKV 的数据变更日志,TiCDC 可以将数据解析为有序的行级变更数据输出到下游。更多关于 TiCDC 的概念和术语,参见 [TiCDC 术语表](/ticdc/ticdc-glossary.md)。 -### TiDB Data Migration (DM) - -[TiDB Data Migration (DM)](/dm/dm-overview.md) 是一款便捷的数据迁移工具,支持从与 MySQL 协议兼容的数据库(MySQL、MariaDB、Aurora MySQL)到 TiDB 的全量数据迁移和增量数据同步。使用 DM 工具有利于简化数据迁移过程,降低数据迁移运维成本。 - -更多关于 DM 的概念和术语,参见 [TiDB Data Migration 术语表](/dm/dm-glossary.md)。 - ### TiDB Lightning [TiDB Lightning](/tidb-lightning/tidb-lightning-overview.md) 是一款数据导入工具,用于从静态文件导入 TB 级数据到 TiDB 集群,常用于 TiDB 集群的初始化数据导入。 From 0d57b87c14627c18f21f964aef73ce89eb50468f Mon Sep 17 00:00:00 2001 From: qiancai Date: Fri, 24 Jan 2025 17:35:58 +0800 Subject: [PATCH 7/9] sync from English changes --- glossary.md | 38 ++++++++++++++++++++++---------------- 1 file changed, 22 insertions(+), 16 deletions(-) diff --git a/glossary.md b/glossary.md index 8b162b6c27b9..2a790f096927 100644 --- a/glossary.md +++ b/glossary.md @@ -35,7 +35,7 @@ ACID 是指数据库管理系统在写入或更新资料的过程中,为保证 ### Batch Create Table -批量建表 (Batch Create Table) 是在 TiDB v6.0.0 中引入的新功能,此功能默认开启。当需要恢复的数据中带有大量的表(约 50000 张)时,批量建表功能显著提升数据恢复的速度。详情参见[批量建表](/br/br-batch-create-table.md)。 +批量建表功能 (Batch Create Table) 可以通过批量创建表的方式显著提升多表同时创建的速度。例如,当使用[备份与恢复 (BR)](/br/backup-and-restore-overview.md) 工具恢复数千张表时,该功能有助于缩短整体恢复的整体时长。详情参见[批量建表](/br/br-batch-create-table.md)。 ### Baseline Capturing @@ -53,7 +53,13 @@ ACID 是指数据库管理系统在写入或更新资料的过程中,为保证 ### Cluster -TiDB 数据库以及各组件的集合,部署在多节点服务器上,每个节点上运行实例,向客户端提供服务。 +集群由一组协同工作以提供服务的节点组成。与单节点架构相比,TiDB 采用分布式集群架构,实现了更高的可用性和更强的可扩展性 +在 TiDB 的分布式架构中: +- TiDB 节点提供可扩展的 SQL 层以供客户端交互。 +- PD 节点提供弹性的元数据层以支持 TiDB。 +- TiKV 节点使用 Raft 协议,为 TiDB 提供高可用、可扩展和有弹性的存储服务。 + +详情参见 [TiDB 架构](/tidb-architecture.md)。 ### Coalesce Partition @@ -69,11 +75,11 @@ Coalesce Partition 是一种减少 Hash 分区表或 Key 分区表中分区数 ### Continuous Profiling -持续性能分析 (Continuous Profiling) 是从 TiDB v5.3 起引入的一种从系统调用层面解读资源开销的方法。引入该方法后,TiDB 可提供数据库源码级性能观测,通过火焰图的形式帮助研发、运维人员定位性能问题的根因。详情参见 [TiDB Dashboard 实例性能分析 - 持续分析页面](/dashboard/continuous-profiling.md)。 +持续性能分析 (Continuous Profiling) 是一种从系统调用层面解读资源开销的方法。通过持续性能分析,TiDB 可提供对性能问题的细粒度观测,帮助运维团队使用火焰图定位性能问题的根本原因。详情参见 [TiDB Dashboard 实例性能分析 - 持续分析页面](/dashboard/continuous-profiling.md)。 ### Coprocessor -一种替 TiDB 分担计算的协处理机制。位于存储层(TiKV 或 TiFlash),以 Region 为单位协同处理从 TiDB 下推的计算。 +Coprocessor 是一种替 TiDB 分担计算工作负载的协处理机制。它位于存储层(TiKV 或 TiFlash),以 Region 为单位协同处理从 TiDB 下推的计算。更多信息,请参见[下推到 TiKV 的表达式列表](/functions-and-operators/expressions-pushed-down.md)。 ## D @@ -99,7 +105,7 @@ TiDB 会在开发里程碑版本 (Development Milestone Release, DMR) 中引入 ### Dumpling -Dumpling 是一款数据导出工具,用于将存储在 TiDB 或 MySQL 中的数据导出为 SQL 或 CSV 格式,用于逻辑全量备份。Dumpling 也支持将数据导出到 Amazon S3 中。详情参见[使用 Dumpling 导出数据](/dumpling-overview.md)。 +Dumpling 是一款数据导出工具,用于将存储在 TiDB、MySQL 或 MariaDB 中的数据导出为 SQL 或 CSV 数据文件,也可用于逻辑全量备份或导出。Dumpling 也支持将数据导出到 Amazon S3 中。详情参见[使用 Dumpling 导出数据](/dumpling-overview.md)。 ### 分布式执行框架 (DXF) @@ -230,9 +236,9 @@ Operator Step 是 Operator 执行过程的一个步骤,一个 Operator 常常 ### Optimistic transaction -使用乐观并发控制的事务,在并发环境中,外界对数据的操作一般不会造成冲突。开启乐观事务后,TiDB 只在事务最终提交时才会检测冲突。乐观事务模式适合读多写少的并发场景,能提高 TiDB 性能。 +乐观事务是使用乐观并发控制的事务。在并发环境中,外界对数据的操作一般不会造成冲突。开启乐观事务后,TiDB 仅在事务最终提交时才会进行冲突检测。乐观事务模式适合读多写少的并发场景,能提高 TiDB 性能。 -自 v3.0.8 开始,TiDB 集群默认使用悲观事务模式。但如果从 3.0.7 及之前版本创建的集群升级到 3.0.8 及之后的版本,不会改变默认事务模式,即只有新创建的集群才会默认使用悲观事务模式。详情参见 [TiDB 乐观事务模型](/optimistic-transaction.md)。 +更多信息,请参见 [TiDB 乐观事务模型](/optimistic-transaction.md)。 ## P @@ -242,7 +248,7 @@ Operator Step 是 Operator 执行过程的一个步骤,一个 Operator 常常 ### PD Control (pd-ctl) -PD Control(或 pd-ctl)是 PD 的命令行工具,用于获取集群状态信息和调整集群。详情参见 [PD Control 使用说明](/pd-control.md)。 +PD Control (pd-ctl) 是一个命令行工具,用于与集群中的 PD (placement driver) 进行交互。你可以使用它获取集群状态信息以及修改集群。更多信息,请参见 [PD Control 使用说明](/pd-control.md)。 ### Pending/Down @@ -254,7 +260,7 @@ PD 是 [TiDB 架构](/tidb-architecture.md) 中的核心组件之一,负责存 ### Placement Rules -Placement Rules 特性用于通过 SQL 接口配置数据在 TiKV 集群中的放置位置。通过该功能,用户可以将表和分区指定部署至不同的地域、机房、机柜、主机。适用场景包括低成本优化数据高可用策略、保证本地的数据副本可用于本地 Stale Read 读取、遵守数据本地要求等。 +Placement Rules 特性用于配置数据在 TiKV 集群中的放置位置。通过该功能,用户可以将表和分区指定部署至不同的地域、机房、机柜、主机。适用场景包括低成本优化数据高可用策略、保证本地的数据副本可用于本地 Stale Read 读取、遵守数据本地要求。 详情参见 [Placement Rules in SQL](/placement-rules-in-sql.md)。 @@ -310,7 +316,7 @@ RU 是 TiDB 中资源使用的统一抽象单位,用于在[资源管控](/tidb ### RocksDB -一款提供键值存储与读写功能的 LSM-tree 架构引擎,由 Facebook 基于 LevelDB 开发。RocksDB 是 TiKV 的核心存储引擎,用于存储 Raft 日志以及用户数据。 +[RocksDB](https://rocksdb.org/) 是一款提供键值存储与读写功能的 LSM-tree 架构引擎,由 Facebook 基于 LevelDB 开发。RocksDB 是 TiKV 的核心存储引擎。 ## S @@ -325,13 +331,13 @@ Scheduler(调度器)是 PD 中生成调度的组件。PD 中每个调度器 ### Security Enhanced Mode - Security Enhanced Mode(安全增强模式)用于对 TiDB 管理员进行更细粒度的权限划分。安全增强模式受[安全增强式 Linux](https://zh.wikipedia.org/wiki/安全增强式Linux) 等系统设计的启发,削减拥有 MySQL `SUPER` 权限的用户能力,转而使用细粒度的 `RESTRICTED` 权限作为替代。 + Security Enhanced Mode(安全增强模式)用于对 TiDB 管理员进行更细粒度的权限划分。受[安全增强式 Linux](https://en.wikipedia.org/wiki/Security-Enhanced_Linux) 等系统设计的启发,SEM 削减了拥有 `SUPER` 权限的用户的能力,转而使用 `RESTRICTED` 细粒度权限作为替代,这些权限必须被显式授予以控制特定的管理操作。 详情参见[系统变量文档 - `tidb_enable_enhanced_security`](/system-variables.md#tidb_enable_enhanced_security)。 ### Stale Read -Stale Read 是一种读取历史数据版本的机制,读取 TiDB 中存储的历史数据版本。通过 Stale Read 功能,你能从指定时间点或时间范围内读取对应的历史数据,从而避免数据同步带来延迟。当使用 Stale Read 时,TiDB 默认会随机选择一个副本来读取数据,因此能利用所有副本。 +Stale Read 是 TiDB 中一种读取机制,用于读取 TiDB 中存储的历史数据版本。通过 Stale Read 功能,你可以从指定时间点或时间范围内读取对应的历史数据,从而缩短存储节点之间数据同步带来的延迟。当使用 Stale Read 时,TiDB 会随机选择一个副本来读取数据,这意味着所有副本都可用于数据读取。 详情参见 [Stale Read](/stale-read.md)。 @@ -347,13 +353,13 @@ PD 中的 Store 指的是集群中的存储节点,也就是 tikv-server 实例 ### Temporary table -临时表 (temporary table) 解决了业务中间计算结果的临时存储问题,让用户免于频繁地建表和删表等操作。用户可将业务上的中间计算数据存入临时表,用完数据后 TiDB 自动清理回收临时表。这避免了用户业务过于复杂,减少了表管理开销,并提升了性能。 +临时表 (temporary table) 用于存储业务上的中间计算结果,让用户免于频繁地建表和删表等操作。数据用完后,TiDB 会自动清理并回收临时表。这种方式可以帮助你简化应用程序逻辑,减少表管理开销,并提升性能。 详情参见[临时表](/temporary-tables.md)。 ### TiCDC -[TiCDC](/ticdc/ticdc-overview.md) 是一款 TiDB 增量数据同步工具,通过拉取上游 TiKV 的数据变更日志,TiCDC 可以将数据解析为有序的行级变更数据输出到下游。更多关于 TiCDC 的概念和术语,参见 [TiCDC 术语表](/ticdc/ticdc-glossary.md)。 +[TiCDC](/ticdc/ticdc-overview.md) 是一款数据同步工具,支持将增量数据从 TiDB 复制到各种不同的下游目标系统。目前支持的下游包括 TiDB 实例、MySQL 兼容数据库、对象存储位置和流处理器(如 Kafka 和 Pulsar)。TiCDC 会拉取上游 TiKV 的数据变更日志,将其解析为有序的行级变更数据,然后输出到下游。更多关于 TiCDC 的概念和术语,参见 [TiCDC 术语表](/ticdc/ticdc-glossary.md)。 ### TiDB Lightning @@ -363,7 +369,7 @@ PD 中的 Store 指的是集群中的存储节点,也就是 tikv-server 实例 ### TiFlash -[TiFlash](/tiflash/tiflash-overview.md) 是 TiDB HTAP 形态的关键组件,它是 TiKV 的列存扩展,在提供良好隔离性的同时,也兼顾了强一致性。列存副本通过 Raft Learner 协议异步复制,但是在读取的时候通过 Raft 校对索引配合 MVCC 的方式获得 Snapshot Isolation 的一致性隔离级别。这个架构很好地解决了 HTAP 场景的隔离性以及列存同步的问题。 +[TiFlash](/tiflash/tiflash-overview.md) 是 TiDB HTAP 形态的关键组件,它是 TiKV 的列存扩展,在提供良好隔离性的同时,也兼顾了强一致性。列存副本通过 Raft Learner 协议异步复制 TiKV 的数据。在读取时,它通过 Raft 校对索引配合 MVCC(多版本并发控制) 的方式获得 Snapshot Isolation 的一致性隔离级别。这个架构很好地解决了 HTAP 场景的隔离性以及列存同步的问题,在进行高效分析查询的同时保持实时数据的一致性。 ### Timestamp Oracle (TSO) @@ -371,7 +377,7 @@ PD 中的 Store 指的是集群中的存储节点,也就是 tikv-server 实例 ### TiUP -[TiUP](/tiup/tiup-overview.md) 是 TiDB 于 v4.0 版本引入的包管理工具,用于 TiDB 集群的部署、升级、管理,管理着 TiDB 生态下众多的组件,如 TiDB、PD、TiKV 等。用户想要运行 TiDB 生态中任何组件时,只需要执行 TiUP 一行命令即可,相比以前,大大降低了管理难度。 +[TiUP](/tiup/tiup-overview.md) 是一款包管理工具,用于部署、升级和管理 TiDB 集群,以及管理 TiDB 集群中的各种组件,如 TiDB、PD、TiKV 等。通过使用 TiUP,你可以执行一行命令轻松运行 TiDB 中的任何组件,让管理过程更加简单。 ### Top SQL From 2c75f13442c6458a753e1a18ef59daad60f996ab Mon Sep 17 00:00:00 2001 From: qiancai Date: Fri, 24 Jan 2025 17:36:15 +0800 Subject: [PATCH 8/9] Update glossary.md --- glossary.md | 1 + 1 file changed, 1 insertion(+) diff --git a/glossary.md b/glossary.md index 2a790f096927..45a3a5a78d12 100644 --- a/glossary.md +++ b/glossary.md @@ -54,6 +54,7 @@ ACID 是指数据库管理系统在写入或更新资料的过程中,为保证 ### Cluster 集群由一组协同工作以提供服务的节点组成。与单节点架构相比,TiDB 采用分布式集群架构,实现了更高的可用性和更强的可扩展性 + 在 TiDB 的分布式架构中: - TiDB 节点提供可扩展的 SQL 层以供客户端交互。 - PD 节点提供弹性的元数据层以支持 TiDB。 From e6d33fb3aa18ec3547efc0e859c3e75275a40c8c Mon Sep 17 00:00:00 2001 From: Grace Cai Date: Fri, 24 Jan 2025 17:49:14 +0800 Subject: [PATCH 9/9] Apply suggestions from code review --- glossary.md | 8 ++++---- 1 file changed, 4 insertions(+), 4 deletions(-) diff --git a/glossary.md b/glossary.md index 45a3a5a78d12..99db48d7f9b9 100644 --- a/glossary.md +++ b/glossary.md @@ -53,7 +53,7 @@ ACID 是指数据库管理系统在写入或更新资料的过程中,为保证 ### Cluster -集群由一组协同工作以提供服务的节点组成。与单节点架构相比,TiDB 采用分布式集群架构,实现了更高的可用性和更强的可扩展性 +集群由一组协同工作以提供服务的节点组成。与单节点架构相比,TiDB 采用分布式集群架构,实现了更高的可用性和更强的可扩展性。 在 TiDB 的分布式架构中: - TiDB 节点提供可扩展的 SQL 层以供客户端交互。 @@ -332,7 +332,7 @@ Scheduler(调度器)是 PD 中生成调度的组件。PD 中每个调度器 ### Security Enhanced Mode - Security Enhanced Mode(安全增强模式)用于对 TiDB 管理员进行更细粒度的权限划分。受[安全增强式 Linux](https://en.wikipedia.org/wiki/Security-Enhanced_Linux) 等系统设计的启发,SEM 削减了拥有 `SUPER` 权限的用户的能力,转而使用 `RESTRICTED` 细粒度权限作为替代,这些权限必须被显式授予以控制特定的管理操作。 + Security Enhanced Mode(安全增强模式)用于对 TiDB 管理员进行更细粒度的权限划分。受[安全增强式 Linux](https://zh.wikipedia.org/wiki/安全增强式Linux) 等系统设计的启发,SEM 削减了拥有 `SUPER` 权限的用户的能力,转而使用 `RESTRICTED` 细粒度权限作为替代,这些权限必须被显式授予以控制特定的管理操作。 详情参见[系统变量文档 - `tidb_enable_enhanced_security`](/system-variables.md#tidb_enable_enhanced_security)。 @@ -360,7 +360,7 @@ PD 中的 Store 指的是集群中的存储节点,也就是 tikv-server 实例 ### TiCDC -[TiCDC](/ticdc/ticdc-overview.md) 是一款数据同步工具,支持将增量数据从 TiDB 复制到各种不同的下游目标系统。目前支持的下游包括 TiDB 实例、MySQL 兼容数据库、对象存储位置和流处理器(如 Kafka 和 Pulsar)。TiCDC 会拉取上游 TiKV 的数据变更日志,将其解析为有序的行级变更数据,然后输出到下游。更多关于 TiCDC 的概念和术语,参见 [TiCDC 术语表](/ticdc/ticdc-glossary.md)。 +[TiCDC](/ticdc/ticdc-overview.md) 是一款数据同步工具,支持将增量数据从 TiDB 复制到各种不同的下游目标系统。目前支持的下游包括 TiDB 实例、MySQL 兼容数据库、存储服务和流处理器(如 Kafka 和 Pulsar)。TiCDC 会拉取上游 TiKV 的数据变更日志,将其解析为有序的行级变更数据,然后输出到下游。更多关于 TiCDC 的概念和术语,参见 [TiCDC 术语表](/ticdc/ticdc-glossary.md)。 ### TiDB Lightning @@ -370,7 +370,7 @@ PD 中的 Store 指的是集群中的存储节点,也就是 tikv-server 实例 ### TiFlash -[TiFlash](/tiflash/tiflash-overview.md) 是 TiDB HTAP 形态的关键组件,它是 TiKV 的列存扩展,在提供良好隔离性的同时,也兼顾了强一致性。列存副本通过 Raft Learner 协议异步复制 TiKV 的数据。在读取时,它通过 Raft 校对索引配合 MVCC(多版本并发控制) 的方式获得 Snapshot Isolation 的一致性隔离级别。这个架构很好地解决了 HTAP 场景的隔离性以及列存同步的问题,在进行高效分析查询的同时保持实时数据的一致性。 +[TiFlash](/tiflash/tiflash-overview.md) 是 TiDB HTAP 形态的关键组件,它是 TiKV 的列存扩展,在提供良好隔离性的同时,也兼顾了强一致性。列存副本通过 Raft Learner 协议异步复制 TiKV 的数据。在读取时,它通过 Raft 校对索引配合 MVCC(多版本并发控制)的方式获得 Snapshot Isolation 的一致性隔离级别。这个架构很好地解决了 HTAP 场景的隔离性以及列存同步的问题,在进行高效分析查询的同时保持实时数据的一致性。 ### Timestamp Oracle (TSO)