• 企业400电话
  • 微网小程序
  • AI电话机器人
  • 电商代运营
  • 全 部 栏 目

    企业400电话 网络优化推广 AI电话机器人 呼叫中心 网站建设 商标✡知产 微网小程序 电商运营 彩铃•短信 增值拓展业务
    Transactional replication(事务复制)详解之如何跳过一个事务

    在transactional replication, 经常会遇到数据同步延迟的情况。有时候这些延迟是由于在publication中执行了一个更新,例如update ta set col=? Where ?,这个更新包含巨大的数据量。在subscription端,这个更新会分解成多条命令(默认情况下每个数据行一个命令),应用到subscription上。 不得已的情况下,我们需要跳过这个大的事务,让replication继续运行下去。

    现在介绍一下transactional replication的一些原理和具体的方法

    当publication database的article发生更新时, 会产生相应的日志,Log reader会读取这些日志信息,将他们写入到Distribution 数据库的msrepl_transactions和msrepl_commands中。 

    Msrepl_transactions中的每一条记录都有一个唯一标识xact_seqno,xact_seqno对应日志中的LSN。 所以可以通过xact_seqno推断出他们在publication database中的生成顺序,编号大的生成时间就晚,编号小的生成时间就早。

    Distributionagent包含两个子进程,reader和writer。 Reader负责从Distribution 数据库中读取数据,Writer负责将reader读取的数据写入到订阅数据库.

    reader是通过sp_MSget_repl_commands来读取Distribution数据库中(读取Msrepl_transactions表和Msrepl_Commands表)的数据

    下面是sp_MSget_repl_commands的参数定义

    CREATE PROCEDURE sys.sp_MSget_repl_commands 
    
    ( 
    
    @agent_id int, 
    
    @last_xact_seqno varbinary(16), 
    
    @get_count tinyint = 0, -- 0 = no count, 1 = cmd and tran (legacy), 2 = cmd only 
    
    @compatibility_level int = 7000000, 
    
    @subdb_version int = 0, 
    
    @read_query_size int = -1 
    
    ) 
    
    

    这个存储过程有6个参数,在Transactional replication 中,只会使用前4个(并且第三个参数和第四个参数的值是固定不变的.分别为0和10000000)。下面是一个例子:

    execsp_MSget_repl_commands 46,0x0010630F000002A900EA00000000,0,10000000

    @agent_id表示Distributionagentid,每个订阅都会有一个单独的Distributionagent来处理数据。 带入@agent_id后,就可以找到订阅对应的publication 和所有的article。

    @last_xact_seqno 表示上一次传递到订阅的LSN。

    大致逻辑是:Reader读取subscription database的MSreplication_subscriptions表的transaction_timestamp列,获得更新的上一次LSN编号,然后读取分发数据库中LSN大于这个编号的数据。 Writer将读取到的数据写入订阅,并更新MSreplication_subscriptions表的transaction_timestamp列。然后Reader会继续用新的LSN来读取后续的数据,再传递给Writer,如此往复。

    如果我们手工更新transaction_timestamp列,将这个值设置为当前正在执行的大事务的LSN,那么distribution agent就会不读取这个大事务,而是将其跳过了。

    下面以一个实例演示一下

    环境如下

    Publisher: SQL108W2K8R21

    Distributor: SQL108W2K8R22

    Subscriber: SQL108W2K8R23

    图中高亮的publication中包含3个aritcles,ta,tb,tc

    其中ta包含18,218,200万数据,然后我们进行了一下操作

    在11:00进行了更新语句,

    update ta set c=-11

    后续陆续对表ta,tb,tc执行一些插入操作

    insert tb values(0,0)

    insert tc values(0,0)

    之后我们启动replication monitor ,发现有很大的延迟,distribution agent一直在传递a)操作产生的数据

    在subscription database中执行下面的语句,得到当前最新记录的事务编号

    declare @publisher sysname 
    
    declare @publicationDB sysname 
    
    declare @publication sysname 
    
    set @publisher='SQL108W2K8R22' 
    
    set @publicationDB='pubdb' 
    
    set @publication='pubdbtest2'
    
    select transaction_timestamp From MSreplication_subscriptions 
    
    where 
    
    publisher=@publisher and 
    
    publisher_db=@publicationDB and 
    
    publication=@publication 
    
    

    在我的环境中,事务编号为0x0000014900004E9A0004000000000000

    返回到distribution database,执行下面的语句,得到紧跟在大事务后面的事务编号. 请将参数替换成您实际环境中的数据。(请注意,如果执行下列语句遇到性能问题,请将参数直接替换成值)

    declare @publisher sysname 
    
    declare @publicationDB sysname 
    
    declare @publication sysname 
    
    declare @transaction_timestamp [varbinary](16) 
    
    set @publisher='SQL108W2K8R21' 
    
    set @publicationDB='publicationdb2' 
    
    set @publication='pubtest' 
    
    set @transaction_timestamp= 0x0000014900004E9A0004000000000000
    
    select top 1 xact_seqno from MSrepl_commands with (nolock) where xact_seqno>@transaction_timestamp and 
    
    article_id in ( 
    
      select article_id From MSarticles a inner join MSpublications p on a.publication_id=p.publication_id and a.publisher_id=p.publisher_id and a.publisher_db=p.publisher_db 
    
      inner join sys.servers s on s.server_id=p.publisher_id 
    
      where p.publication=@publication and p.publisher_db=@publicationDB and s.name=@publisher 
    
    ) 
    
    and publisher_database_id =( 
    
        select id From MSpublisher_databases pd inner join MSpublications p on pd.publisher_id=p.publisher_id 
    
        inner join sys.servers s on pd.publisher_id=s.server_id and pd.publisher_db=p.publisher_db 
    
        where s.name=@publisher and p.publication=@publication and pd.publisher_db=@publicationDB 
    
    ) 
    
    Order by xact_seqno
    
    

    在我的环境中,事务编号为0x0000018C000001000171

    在subscription database中执行下面的语句,跳过大的事务。请将参数替换成您实际环境中的数据

    declare @publisher sysname
    
    declare @publicationDB sysname 
    
    declare @publication sysname 
    
    declare @transaction_timestamp [varbinary](16) 
    
    set @publisher='SQL108W2K8R22' 
    
    set @publicationDB='pubdb' 
    
    set @publication='pubdbtest2' 
    
    set @transaction_timestamp= 0x0000018C000001000171
    
    update MSreplication_subscriptions set transaction_timestamp=@transaction_timestamp 
    
    where publisher=@publisher and publisher_db=@publicationDB and publication=@publication 
    
    

    执行完成后开启distribution agent job即可。

    接下来您就会发现,事务已经成功跳过,ta在订阅端不会被更新,后续的更新会逐步传递到订阅,延迟消失。

    您可能感兴趣的文章:
    • spring 中事务注解@Transactional与trycatch的使用
    • Spring事务注解@Transactional失效的八种场景分析
    • 解决@Transactional注解事务不回滚不起作用的问题
    • Java注解@Transactional事务类内调用不生效问题及解决办法
    • Spring声明式事务@Transactional知识点分享
    • springboot中事务管理@Transactional的注意事项与使用场景
    • 浅谈Spring中@Transactional事务回滚及示例(附源码)
    • 基于Transactional事务的使用以及注意说明
    上一篇:SQL SERVER中关于exists 和 in的简单分析
    下一篇:SQL语句中含有乘号报错的处理办法
  • 相关文章
  • 

    © 2016-2020 巨人网络通讯 版权所有

    《增值电信业务经营许可证》 苏ICP备15040257号-8

    Transactional replication(事务复制)详解之如何跳过一个事务 Transactional,replication,事务,