MySQL資料庫MMM高可用方案

本篇文章主要介紹搭建MMM方案以及MMM架構的原理。這裡不介紹主從、主主的搭建方法,MMM方案不適用對數據一致性要求很高的業務。

架構

部署

1.修改hosts

在所有的伺服器中執行相同的操作。

vim /etc/hosts

192.168.137.10 master
192.168.137.20 backup
192.168.137.30 slave
192.168.137.40 monitor

2.添加mysql用戶

隻需要在所有的資料庫端執行即可,監控端不需要。

GRANT REPLICATION CLIENT ON *.* TO 'mmm_monitor'@'192.168.137.%' IDENTIFIED BY 'mmm_monitor'; 
GRANT SUPER,REPLICATION CLIENT, PROCESS ON *.* TO 'mmm_agent'@'192.168.137.%' IDENTIFIED BY  'mmm_agent';
flush privileges;

註意:repl用戶在搭建主從服務的時候已經創建好瞭。

3.安裝監控軟件

註意:監控端全部安裝,但是監控端隻需要用到mysql-mmm-monitor,mysql-mmm-agent不需要啟動。資料庫端隻需要安裝mysql-mmm-agent

1.在監控伺服器執行

wget https://mirrors.ustc.edu.cn/fedora/epel/6/x86_64/epel-release-6-8.noarch.rpm
rpm –ivh epel-release-6-8.noarch.rpm
yum –y  install mysql-mmm*

2.在資料庫伺服器上執行,每個資料庫伺服器上都要執行

wget https://mirrors.ustc.edu.cn/fedora/epel/6/x86_64/epel-release-6-8.noarch.rpm
rpm –ivh epel-release-6-8.noarch.rpm
yum -y install mysql-mmm-agent

路徑說明:

4.配置文件

db伺服器配置文件:mmm_agent.conf,mmm_common.conf

監控伺服器的配置文件:mmm_mon.conf,mmm_common.conf(該文件所有伺服器一樣)

配置db伺服器

1.修改master伺服器

vim /etc/mysql-mmm/mmm_common.conf

復制代碼

active_master_role      writer     ###積極的master角色的標示,所有的db伺服器都需要開啟read_only參數,對於writer伺服器監控代理會自動將read_only屬性關閉。


    cluster_interface       eth0      #####群集的網絡接口
    pid_path                /var/run/mysql-mmm/mmm_agentd.pid    ####pid路徑
    bin_path                /usr/libexec/mysql-mmm/              #####可執行文件路徑 
    replication_user        repl           #######復制用戶
    replication_password    repl           #######復制用戶密碼
    agent_user              mmm_agent      #######代理用戶,用於更改隻讀操作
    agent_password          mmm_agent      #######代理用戶密碼


            ##########master1的host名
    ip      192.168.137.10   #####master1的ip
    mode    master       ########角色屬性,master代表是主
    peer    backup       ########與master1對等的伺服器的host名,也就是master2的伺服器host名


     ####和master的概念一樣
    ip      192.168.137.20
    mode    master
    peer    master


      #####從庫的host名,如果存在多個從庫可以重復一樣的配置
    ip      192.168.137.30   ####從的ip
    mode    slave    #####slave的角色屬性代表當前host是從


   ####writer角色配置
    hosts   master,backup   ####能進行寫操作的伺服器的host名,如果不想切換寫操作這裡可以隻配置master,這樣也可以避免因為網絡延時而進行write的切換,但是一旦master出現故障那麼當前的MMM就沒有writer瞭隻有對外的read操作。
    ips     192.168.137.100  #####對外提供的寫操作的虛擬IP
    mode    exclusive    #####exclusive代表隻允許存在一個主,也就是隻能提供一個寫的IP


   #####read角色配置
    hosts   backup,slave  ######對外提供讀操作的伺服器的host名,當然這裡也可以把master加進來
    ips     192.168.137.120,192.168.137.130,192.168.137.140  ###對外提供讀操作的虛擬ip,這兩個ip和host不是一一對應的,並且ips也hosts的數目也可以不相同,如果這樣配置的話其中一個hosts會分配兩個ip
    mode    balanced   ###balanced代表負載均衡

復制代碼

同時將這個文件拷貝到其它的伺服器包括監控伺服器,配置不變

scp  /etc/mysql-mmm/mmm_common.conf slave:/etc/mysql-mmm/
scp  /etc/mysql-mmm/mmm_common.conf backup:/etc/mysql-mmm/
scp  /etc/mysql-mmm/mmm_common.conf monitor:/etc/mysql-mmm/

2.代理文件配置

vim /etc/mysql-mmm/mmm_agent.conf

註意:這個配置隻配置db伺服器,監控伺服器不需要配置,this後面的host名改成當前伺服器的host命令,master2和slave也改成對應的伺服器的host名。

3.啟動代理進程

chkconfig mysql-mmm-agent on
service mysql-mmm-agent start

每臺db伺服器上都需要啟動

配置監控伺服器

vim /etc/mysql-mmm/mmm_mon.conf

復制代碼

include mmm_common.conf

    ip                  127.0.0.1
    pid_path            /var/run/mysql-mmm/mmm_mond.pid
    bin_path            /usr/libexec/mysql-mmm
    status_path         /var/lib/mysql-mmm/mmm_mond.status  #####群集的狀態文件,也就是執行mmm_control show操作的顯示來源。
    ping_ips            192.168.137.10,192.168.137.20,192.168.137.30  ######被監控的db伺服器的ip地址
    auto_set_online     0   ####設置自動online的時間,默認是超過60s就將它設置為online,默認是60s,這裡將其設為0就是立即online

    # The kill_host_bin does not exist by default, though the monitor will
    # throw a warning about it missing.  See the section 5.10 "Kill Host
    # Functionality" in the PDF documentation.
    #
    # kill_host_bin     /usr/libexec/mysql-mmm/monitor/kill_host
    #



    monitor_user        mmm_monitor   ####監控db伺服器的用戶
    monitor_password    mmm_monitor   ####監控db伺服器的密碼


debug 0       #######debug 0正常模式,1為debug模式

復制代碼

註意:配置文件中的註釋是為瞭便於理解,在部署的時候最好把註釋去掉以免因為註釋造成的潛在影響。

啟動監控進程

chkconfig mysql-mmm-monitor on
service mysql-mmm-monitor start

註意:無論是在db端還是在監控端如果有對配置文件進行修改操作都需要重啟代理進程和監控進程。

操作分析

日志文件

日志文件往往是分析錯誤的關鍵,所以要善於利用日志文件進行問題分析。

db端:/var/log/mysql-mmm/mmm_agentd.log

監控端:/var/log/mysql-mmm/mmm_mond.log

命令文件

mmm_agentd :db代理進程的啟動文件
mmm_mond :監控進程的啟動文件   
mmm_backup :備份文件 
mmm_restore :還原文件
mmm_clone    
mmm_control:監控操作命令文件   

db伺服器端隻有mmm_agentd程式,其它的都是在monitor伺服器端。

mmm_control用法

mmm_control程式可以用於監控群集狀態、切換writer、設置online\offline操作等。

復制代碼

Valid commands are:
    help                              - show this message    ###幫助信息
    ping                              - ping monitor ###ping當前的群集是否正常
    show                              - show status  ####群集在線狀態檢查
    checks [|all [|all]] - show checks status #####執行監控檢查操作
    set_online                  - set host  online ####將host設置為online
    set_offline                 - set host  offline  ###將host設置為offline
    mode                              - print current mode.  ####打印輸出當前的mode
    set_active                        - switch into active mode.
    set_manual                        - switch into manual mode.
    set_passive                       - switch into passive mode.
    move_role [--force]   - move exclusive role  to host   ####移除writer伺服器為指定的host伺服器
                                        (Only use --force if you know what you are doing!)
    set_ip                  - set role with ip  to host 

復制代碼

1.檢查所有的db伺服器群集狀態

復制代碼

[root@monitor mysql-mmm]# mmm_control checks all
master  ping         [last change: 2016/06/07 16:31:24]  OK
master  mysql        [last change: 2016/06/07 16:31:24]  OK
master  rep_threads  [last change: 2016/06/07 16:31:24]  OK
master  rep_backlog  [last change: 2016/06/07 16:31:24]  OK: Backlog is null
slave   ping         [last change: 2016/06/07 16:31:24]  OK
slave   mysql        [last change: 2016/06/07 16:31:24]  OK
slave   rep_threads  [last change: 2016/06/07 16:31:24]  OK
slave   rep_backlog  [last change: 2016/06/07 16:31:24]  OK: Backlog is null
backup  ping         [last change: 2016/06/07 16:31:24]  OK
backup  mysql        [last change: 2016/06/07 16:31:24]  OK
backup  rep_threads  [last change: 2016/06/07 16:31:24]  OK
backup  rep_backlog  [last change: 2016/06/07 16:31:24]  OK: Backlog is null

復制代碼

檢查項包括:ping、mysql是否正常運行、復制線程是否正常等

2.檢查群集環境在線狀況

[root@monitor mysql-mmm]# mmm_control show
  backup(192.168.137.20) master/ONLINE. Roles: reader(192.168.137.120)
  master(192.168.137.10) master/ONLINE. Roles: writer(192.168.137.100)
  slave(192.168.137.30) slave/ONLINE. Roles: reader(192.168.137.130)

3.對指定的host執行offline操作

[root@monitor mysql-mmm]# mmm_control set_offline backup
OK: State of 'backup' changed to ADMIN_OFFLINE. Now you can wait some time and check all roles!
[root@monitor mysql-mmm]# mmm_control show
  backup(192.168.137.20) master/ADMIN_OFFLINE. Roles: 
  master(192.168.137.10) master/ONLINE. Roles: writer(192.168.137.100)
  slave(192.168.137.30) slave/ONLINE. Roles: reader(192.168.137.120), reader(192.168.137.130)

4.對指定的host執行onine操作

復制代碼

[root@monitor mysql-mmm]# mmm_control set_online backup
OK: State of 'backup' changed to ONLINE. Now you can wait some time and check its new roles!
[root@monitor mysql-mmm]# mmm_control show
  backup(192.168.137.20) master/REPLICATION_FAIL. Roles: 
  master(192.168.137.10) master/ONLINE. Roles: writer(192.168.137.100)
  slave(192.168.137.30) slave/ONLINE. Roles: reader(192.168.137.120), reader(192.168.137.130)

[root@monitor mysql-mmm]# mmm_control show
  backup(192.168.137.20) master/ONLINE. Roles: reader(192.168.137.120)
  master(192.168.137.10) master/ONLINE. Roles: writer(192.168.137.100)
  slave(192.168.137.30) slave/ONLINE. Roles: reader(192.168.137.130)

復制代碼

5.執行write切換

1.查看當前的slave對應的master

復制代碼

[root@slave ~]# mysql -uroot -proot -e 'show slave status \G;'
Warning: Using a password on the command line interface can be insecure.
*************************** 1. row ***************************
               Slave_IO_State: Waiting for master to send event
                  Master_Host: 192.168.137.10
                  Master_User: repl
                  Master_Port: 3306
                Connect_Retry: 60
              Master_Log_File: mysql-bin.000073
          Read_Master_Log_Pos: 1461
               Relay_Log_File: mysql-relay-bin.000006
                Relay_Log_Pos: 283
        Relay_Master_Log_File: mysql-bin.000073
             Slave_IO_Running: Yes
            Slave_SQL_Running: Yes

復制代碼

2.writer切換,要確保mmm_common.conf文件中的writer屬性有配置對應的host,否則無法切換

[root@monitor mysql-mmm]# mmm_control move_role writer backup
OK: Role 'writer' has been moved from 'master' to 'backup'. Now you can wait some time and check new roles info!
[root@monitor mysql-mmm]# mmm_control show
  backup(192.168.137.20) master/ONLINE. Roles: reader(192.168.137.120), writer(192.168.137.100)
  master(192.168.137.10) master/ONLINE. Roles: 
  slave(192.168.137.30) slave/ONLINE. Roles: reader(192.168.137.130)

3.save從庫自動切換到瞭新的master

復制代碼

[root@slave ~]# mysql -uroot -proot -e 'show slave status \G;'
Warning: Using a password on the command line interface can be insecure.
*************************** 1. row ***************************
               Slave_IO_State: Waiting for master to send event
                  Master_Host: 192.168.137.20
                  Master_User: repl
                  Master_Port: 3306
                Connect_Retry: 60
              Master_Log_File: mysql-bin.000039
          Read_Master_Log_Pos: 120
               Relay_Log_File: mysql-relay-bin.000002
                Relay_Log_Pos: 283
        Relay_Master_Log_File: mysql-bin.000039
             Slave_IO_Running: Yes
            Slave_SQL_Running: Yes

復制代碼

其它處理問題

如果不想讓writer從master切換到backup(包括主從的延時也會導致寫VIP的切換),那麼可以在配置/etc/mysql-mmm/mmm_common.conf時,去掉中的backup

   ####writer角色配置
    hosts   master   ###這裡隻配置一個Hosts
    ips     192.168.137.100  #####對外提供的寫操作的虛擬IP
    mode    exclusive    #####exclusive代表隻允許存在一個主,也就是隻能提供一個寫的IP

這樣的話當master出現故障瞭writer寫操作不會切換到backup伺服器,並且slave也不會指向新的master,此時當前的MMM之前對外提供寫服務。

之前寫的復制相關文章:

主從復制:https://www.cnblogs.com/chenmh/p/5089919.html

主主復制:https://www.cnblogs.com/chenmh/p/5153184.html

總結

主從的延時會導致寫VIP的切換,下一篇文章會寫關於半同步復制結合MMM方案,可以更有效的解決切換數據不一致性的問題,歡迎關註。

1.對外提供讀寫的虛擬IP是由monitor程式控制。如果monitor沒有啟動那麼db伺服器不會被分配虛擬ip,但是如果已經分配好瞭虛擬ip當monitor程式關閉瞭原先分配的虛擬ip不會立即關閉外部程式還可以連接訪問(隻要不重啟網絡),這樣的好處就是對於monitor的可靠性要求就會低一些,但是如果這個時候其中的某一個db伺服器故障瞭就無法處理切換,也就是原先的虛擬ip還是維持不變,掛掉的那臺DB的虛擬ip會變的不可訪問。

2.agent程式受monitor程式的控制處理write切換,從庫切換等操作。如果monitor進程關閉瞭那麼agent進程就起不到什麼作用,它本身不能處理故障。

3.monitor程式負責監控db伺服器的狀態,包括Mysql資料庫、伺服器是否運行、復制線程是否正常、主從延時等;它還用於控制agent程式處理故障。

4.monitor會每隔幾秒鐘監控db伺服器的狀態,如果db伺服器已經從故障變成瞭正常,那麼monitor會自動在60s之後將其設置為online狀態(默認是60s可以設為其它的值),有監控端的配置文件參數“auto_set_online”決定,群集伺服器的狀態有三種分別是:HARD_OFFLINE→AWAITING_RECOVERY→online

5.默認monitor會控制mmm_agent會將writer db伺服器read_only修改為OFF,其它的db伺服器read_only修改為ON,所以為瞭嚴謹可以在所有的伺服器的my.cnf文件中加入read_only=1由monitor控制來控制writer和read,root用戶和復制用戶不受read_only參數的影響

6.monitor會控制slave指向master,如果當前master故障瞭MMM會控制slave指向新的master,由於MMM是非搶占機制所以新的master將一直承擔寫服務。

發佈留言