当前位置：首页 > 问答 > 正文

Redis源码手册里那些核心东西，想深入掌握就得这样看才行

水靖荷
问答
2026-01-07 23:19:36
7

要真正深入掌握Redis，只看文档和用API是远远不够的，必须深入其源码，但面对数万行C代码，不能盲目地一头扎进去，正确的方法是带着明确的目标，像侦探一样,围绕其最核心的设计与实现进行突破性的阅读。

第一，从核心数据结构入手，这是Redis的基石。 Redis对外暴露的字符串、列表、哈希、集合、有序集合，在源码内部都有其独特的实现，你不能只看数据结构的定义，关键是要看Redis是如何为了“快”这个目标而对这些结构进行优化的，最经典的SDS（Simple Dynamic String，简单动态字符串），你就要找到sds.h和sds.c文件，通过阅读源码你会发现，SDS在C语言原生字符数组的基础上，增加了len（记录字符串长度）和free（记录剩余空间）等元数据，这就解释了为什么Redis的字符串获取长度是O(1)时间复杂度（直接读len），而C语言原生的strlen是O(n)；同时也解释了为什么SDS可以有效避免缓冲区溢出，同样，对于哈希结构，你要去研究在什么情况下Redis会使用压缩列表（ziplist），什么时候会升级为哈希表（dict），这个过程会让你对Redis如何权衡内存和速度有最直观的感受,这是理解Redis所有功能的起点。

第二，必须彻底搞懂持久化机制，这是Redis的可靠性关键。 RDB和AOF是面试和工作中最常见的问题，源码会给你最权威的答案，看RDB持久化，你不能满足于知道它是快照，你要去rdb.c文件里追踪rdbSave函数的执行流程，看看Redis是如何通过fork一个子进程，利用操作系统的写时复制（Copy-on-Write）机制来生成数据快照的，这个过程是如何保证不阻塞主线程的，而对于AOF，你要去aof.c文件里研究，重点看三个部分：AOF缓冲区的内容是如何被追加（append）到文件末尾的；appendfsync everysec策略下，那个独立的后台线程（bio）是如何工作的；以及AOF重写（rewrite）时，rewriteAppendOnlyFile函数是如何通过创建临时文件、遍历数据库生成最小命令集，最后再原子替换的，通过源码你会发现，所谓的AOF重写并不是分析旧的AOF文件，而是直接根据当前数据库状态反向生成的，把这部分代码逻辑理清,你对数据安全的理解会提升一个档次。

Redis源码手册里那些核心东西，想深入掌握就得这样看才行

第三，深入事件循环模型，这是Redis高性能的灵魂。 Redis是单线程却能处理高并发的典范，其核心就是基于I/O多路复用的事件循环，这个循环就在ae.c文件中，函数通常是aeMain，你需要像看一张蓝图一样，把这个主循环的步骤画出来：它如何初始化（aeCreateEventLoop）、如何注册网络读写事件（aeCreateFileEvent）、如何等待事件发生（aeApiPoll）、事件发生后如何分发给对应的处理函数（读事件对应readQueryFromClient，写事件对应sendReplyToClient），特别要注意的是，Redis是如何将耗时的操作（比如RDB持久化、AOF重写、某些KEY的删除）交给后台线程（Bio）处理的，以避免阻塞这个主事件循环，理解了这一点，你就明白了为什么在Redis执行keys *这样的命令是危险的，因为它会直接霸占这个单线程,导致整个服务暂停响应。

第四，研究主从复制和哨兵机制的实现，这是Redis高可用的保障。 这部分代码相对复杂，分布在replication.c和sentinel.c等文件中，阅读时，你要把自己想象成一个Redis副本（replica），比如主从复制，就从slaveof命令开始跟踪，看副本节点是如何与主节点建立连接、发送PSYNC命令、接收RDB文件、以及最后进行数据同步的，而对于哨兵，重点看它如何通过定时任务（sentinelTimer函数）来监控主节点和副本节点，如何通过投票机制达成共识，以及如何执行故障切换（failover）的决策流程,源码会让你看到这些分布式协调场景下的各种细节和边界条件处理。

第五，有选择地阅读一些经典命令的实现。 列表的LPUSH和RPOP是如何在双向链表或压缩列表上操作的；有序集合的ZADD是如何同时更新跳跃表（skiplist）和哈希表的；过期键的EXPIRE命令是如何将键和过期时间存入过期字典，并如何通过主动和被动两种方式清理的，通过这些具体命令的代码路径,你能把前面学到的数据结构和事件模型知识串联起来。

多位专家（如黄健宏在《Redis设计与实现》中强调）都建议，阅读源码一定要动手实践，不要只看，要用GDB调试器在关键函数设置断点，观察变量的变化；或者添加一些日志打印，跟踪程序的执行流，从用一个简单的Redis实例开始，用gdb --args redis-server启动，然后一步步跟踪一个SET命令从接收到返回响应的全过程,这个过程会让你对代码的理解从平面变得立体。

看Redis源码不是要你记住每一行代码，而是要像解剖一只麻雀一样，抓住其骨架（数据结构）、神经（事件循环）、血液循环（持久化）和免疫系统（高可用）这几个最核心的系统，理解它们是如何协同工作，最终成就了Redis这款高效、稳定的软件，这个过程一开始会很难，但每攻克一个点,你对分布式系统和数据库的理解都会深刻一分。

Redis源码手册里那些核心东西，想深入掌握就得这样看才行