当前位置：首页 > 问答 > 正文

DB2里那个MQT物化查询表到底怎么用才算正确，别光听理论了实际点讲讲

太叔访天
问答
2025-12-26 22:19:32
3

光说没用，咱们看个实际的场景。

假设你在一家电商公司,有一张超级大的订单表（order_big_table），里面有几十亿条记录，老板和运营团队每天都要看各种销售报表，每个省份、每个商品类目的每日销售总额”，这个查询写出来大概长这样：

SELECT province, category, ORDER_DATE, SUM(sale_amount)
FROM order_big_table
GROUP BY province, category, ORDER_DATE;

这个查询每次运行都要去扫几十亿条记录,然后做分组汇总（GROUP BY），就算你索引建得再好，每次跑起来也得花好几分钟，甚至更久，数据库服务器CPU蹭蹭往上涨，其他业务查询也跟着变慢，这时候，你就该考虑用MQT了。

那这个MQT具体怎么建呢？

你不是要“每个省份、每个商品类目的每日销售总额”吗？那我们就创建一个MQT，把这个查询的结果直接存起来，建表的SQL大概是这个样子：

CREATE TABLE mqt_sales_summary AS
(
    SELECT province, category, ORDER_DATE, SUM(sale_amount) as total_sales,
           COUNT(*) as order_count -- 也可以顺便存点其他统计信息
    FROM order_big_table
    GROUP BY province, category, ORDER_DATE
)
DATA INITIALLY DEFERRED
REFRESH IMMEDIATE;

我来解释一下这几个关键点：

CREATE TABLE ... AS：这就是在告诉DB2，我要创建一张表，表里的数据就是后面这个SELECT语句查出来的结果。
DATA INITIALLY DEFERRED：意思是“建表的时候先不往里灌数据”，表结构先建好，数据是空的，这是一步好棋，因为给大表建MQT如果直接初始化数据，可能会锁表很久，影响业务，我们宁愿先建个空壳。
REFRESH IMMEDIATE：这是MQT的“刷新模式”，这是最核心的地方。IMMEDIATE 表示这个MQT是“可维护的”，只要源表（order_big_table）有数据变动（增、删、改），DB2就会自动地、实时地去更新MQT里对应的汇总数据，比如新插入一笔订单，DB2会自动找到这笔订单属于哪个省份、哪个类目、哪一天，然后把这个类目的total_sales加上新订单的金额。

表建好了,空壳一个，接下来你需要手动执行一次全量刷新，把数据灌进去：

REFRESH TABLE mqt_sales_summary;

这个过程可能会比较耗时,因为它相当于把那个很慢的查询跑了一遍，但只跑这一次，以后就是增量维护了。

神奇的事情发生了。

当老板再要那个销售报表时,你不需要改任何代码，DB2的优化器是个聪明人，它会自己分析你的查询语句，它一看：“咦，这个查询要的东西，好像那个mqt_sales_summary表里全有啊，而且数据是完全一样的！” 它就会静悄悄地把你的查询“重写”，变成从mqt_sales_summary这张小得多的表里取数据。

你的查询还是原来的样子,但速度可能从原来的几分钟变成了零点几秒，这种感觉就像给你的慢查询装上了火箭发动机。

那是不是所有情况都适合用MQT呢？当然不是，你得会挑地方用。

用在最痛的查询上：就像上面的例子，那些带GROUP BY、JOIN很多张大表的、查询频率高、但又跑得特别慢的报表查询，是MQT的最佳人选，你别拿MQT去优化一个本身就跑得飞快的根据主键查询的语句，那是杀鸡用牛刀。
权衡“新鲜度”和“性能”：我们用的是REFRESH IMMEDIATE，保证了数据实时性，但这是有代价的，每次源表有更新，DB2都要花一点点开销去维护MQT，如果你的业务是秒杀场景，源表更新极其频繁，那维护MQT的开销可能会成为一个负担，这时候，你可以考虑另一种模式 REFRESH DEFERRED，它允许数据有延迟（比如每天凌晨刷新一次），用“非实时”换“高性能”和“低维护开销”。
考虑存储成本：MQT是实实在在的表，要占用存储空间的，你得确保磁盘空间足够。
不是所有查询都能被“重写”：DB2的优化器得能识别出你的查询和MQT的定义是匹配的，如果你的查询条件非常复杂，或者用了些特殊的函数，可能就无法利用到MQT，建完之后最好用db2exfmt之类的工具看看执行计划，确认一下查询是否真的走到了MQT上。

正确使用MQT的步骤就是：

第一步：找目标，从数据库监控里找出那些消耗资源最多、执行时间最长的TOP SQL。
第二步：分析，看看这些慢查询是不是经常做汇总、关联操作，结果集是不是比源表小很多。
第三步：建表，用CREATE TABLE ... AS语句，根据慢查询的定义来创建MQT，对于大表，建议用DATA INITIALLY DEFERRED。
第四步：初始化，在业务低峰期，用REFRESH TABLE语句初始化数据。
第五步：验证，跑一下原来的慢查询，感受速度的提升，并通过执行计划确认查询确实使用了MQT。