这是一篇相当难得的mysql主从复制的教程,作者根据自己多年的mysql主从维护经验,编写并整理了mysql主从复制的配置心得与技巧,脚本小编在此感谢原作者的辛苦劳动。 Mysql数据库主从配置教程与经验总结 作者经历:管理mysql主从有2年多了,管理过200多组mysql主从,几乎涉及到各个版本的主从。
一、mysql主从原理 2、MySQL 复制的基本过程: 2.1.Slave 上面的IO线程连接上 Master,并请求从指定日志文件的指定位置(或者从最开始的日志)之后的日志内容; 2.2. Master 接收到来自 Slave 的 IO 线程的请求后,通过负责复制的 IO 线程根据请求信息读取指定日志指定位置之后的日志信息,返回给 Slave 端的 IO 线程。返回信息中除了日志所包含的信息之外,还包括本次返回的信息在 Master 端的 Binary Log 文件的名称以及在 Binary Log 中的位置; 2.3. Slave 的 IO 线程接收到信息后,将接收到的日志内容依次写入到 Slave 端的Relay Log文件(mysql-relay-bin.xxxxxx)的最末端,并将读取到的Master端的bin-log的文件名和位置记录到master- info文件中,以便在下一次读取的时候能够清楚的高速Master“我需要从某个bin-log的哪个位置开始往后的日志内容,请发给我” 2.4. Slave 的 SQL 线程检测到 Relay Log 中新增加了内容后,会马上解析该 Log 文件中的内容成为在 Master 端真实执行时候的那些可执行的 Query 语句,并在自身执行这些 Query。这样,实际上就是在 Master 端和 Slave 端执行了同样的 Query,所以两端的数据是完全一样的。 3、Mysql复制的几种模式
3.1.从 MySQL 5.1.12 开始,可以用以下三种模式来实现:
1.当DML语句更新一个NDB表时
3.2.设定主从复制模式:
复制代码代码示例:
log-bin=mysql-bin
#binlog_format="STATEMENT" #binlog_format="ROW" binlog_format="MIXED"
也可以在运行时动态修改binlog的格式。例如
mysql> SET SESSION binlog_format = 'STATEMENT';
mysql> SET SESSION binlog_format = 'ROW'; mysql> SET SESSION binlog_format = 'MIXED'; mysql> SET GLOBAL binlog_format = 'STATEMENT'; mysql> SET GLOBAL binlog_format = 'ROW'; mysql> SET GLOBAL binlog_format = 'MIXED';
3.3.两种模式各自的优缺点:
SBR 的缺点:
RBR 的缺点:
BINLOG日志信息为:
复制代码代码示例:
—————————————–
BEGIN /*!*/; # at 173 #090612 16:05:42 server id 1 end_log_pos 288 Query thread_id=4 exec_time=0 error_code=0 SET TIMESTAMP=1244793942/*!*/; insert into db_allot_ids select * from db_allot_ids /*!*/; —————————————–
在BINLOG_FORMAT=ROW 模式下:
复制代码代码示例:
—————————————–
BINLOG ' hA0yShMBAAAAMwAAAOAAAAAAAA8AAAAAAAAAA1NOUwAMZGJfYWxsb3RfaWRzAAIBAwAA hA0yShcBAAAANQAAABUBAAAQAA8AAAAAAAEAAv/8AQEAAAD8AQEAAAD8AQEAAAD8AQEAAAA= '/*!*/; —————————————–
4、Mysql主从的优缺点
实际上,在老版本中,MySQL 的复制实现在 Slave 端并不是由 SQL 线程和 IO 线程这两个线程共同协作而完成的,而是由单独的一个线程来完成所有的工作。但是 MySQL 的工程师们很快发现,这样做存在很大的风险和性能问题,主要如下: 其次,Slave 端的这个复制线程从 Master 端获取 Binary Log 过来之后,需要接着解析这些内容,还原成 Master 端所执行的原始 Query,然后在自身执行。在这个过程中,Master端很可能又已经产生了大量的变化并生成了大量的 Binary Log 信息。如果在这个阶段 Master 端的存储系统出现了无法修复的故障,那么在这个阶段所产生的所有变更都将永远的丢失,无法再找回来。这种潜在风险在Slave 端压力比较大的时候尤其突出,因为如果 Slave 压力比较大,解析日志以及应用这些日志所花费的时间自然就会更长一些,可能丢失的数据也就会更多。
所以,在后期的改造中,新版本的 MySQL 为了尽量减小这个风险,并提高复制的性能,将 Slave 端的复制改为两个线程来完成,也就是前面所提到的 SQL 线程和 IO 线程。最早提出这个改进方案的是Yahoo!的一位工程师“Jeremy Zawodny”。通过这样的改造,这样既在很大程度上解决了性能问题,缩短了异步的延时时间,同时也减少了潜在的数据丢失量。 如果要完全避免这些问题,就只能用 MySQL 的 Cluster 来解决了。不过 MySQL的 Cluster 知道笔者写这部分内容的时候,仍然还是一个内存数据库的解决方案,也就是需要将所有数据包括索引全部都 Load 到内存中,这样就对内存的要求就非常大的大,对于一般的大众化应用来说可实施性并不是太大。 MySQL 现在正在不断改进其 Cluster 的实现,其中非常大的一个改动就是允许数据不用全部 Load 到内存中,而仅仅只是索引全部 Load 到内存中,我想信在完成该项改造之后的 MySQL Cluster 将会更加受人欢迎,可实施性也会更大。
5、Mysql的半同步模式(Semisynchronous Replication) 在MySQL5.5版本中,引入了半同步复制模式(Semi-synchronous Replication)能够成功(只是相对的)避免上述数据丢失的隐患。在这种模式下:master会等到binlog成功传送并写入至少一个slave的relay log之后才会提交,否则一直等待,直到timeout(默认10s)。当出现timeout的时候,master会自动切换半同步为异步,直到至少有一个slave成功收到并发送Acknowledge,master会再切换回半同步模式。结合这个新功能,我们可以做到,在允许损失一定的事务吞吐量的前提下来保证同步数据的绝对安全,因为当你设置timeout为一个足够大的值的情况下,任何提交的数据都会安全抵达slave。 mysql5.5 版本支持半同步复制功能(Semisynchronous Replication),但还不是原生的支持,是通过plugin来支持的,并且默认是没有安装这个插件的。不论是二进制发布的,还是自己源代码编译的,都会默认生成这个插件,一个是针对master 的一个是针对slave的,在使用之前需要先安装这俩plugins。
二、Mysql主从复制的过滤
复制的优化:
下面二项需要在Master上设置:
下面六项需要在slave上设置:
Replicate_Do_DB:设定需要复制的数据库,多个DB用逗号分隔
Replicate_Ignore_DB:设定可以忽略的数据库. Replicate_Do_Table:设定需要复制的Table Replicate_Ignore_Table:设定可以忽略的Table Replicate_Wild_Do_Table:功能同Replicate_Do_Table,但可以带通配符来进行设置。 Replicate_Wild_Ignore_Table:功能同Replicate_Do_Table,功能同Replicate_Ignore_Table,可以带通配符。 优点是在slave端设置复制过滤机制,可以保证不会出现因为默认的数据库问题而造成Slave和Master数据不一致或复制出错的问题. 缺点是性能方面比在Master端差一些.原因在于:不管是否须要复制,事件都会被IO线程读取到Slave端,这样不仅增加了网络IO量,也给Slave端的IO线程增加了Relay Log的写入量。
注:在实际的生产应用中发现,在mysql5.0以前的版本,mysql的这个过滤设置几乎是形同虚设,不起作用:不管你在主库或是从库上设置了忽略某个数据库或是表,他依然会进行同步,
三、Mysql主从同步的配置
复制代码代码示例:
添加一个用于主从同步的用户:
GRANT REPLICATION SLAVE ON *.* TO 'repl'@'%' IDENTIFIED BY ‘1q2w3e4r’; 如果监控mysql主从的话,请加上一个super权限: GRANT SUPER, REPLICATION SLAVE ON *.* TO 'repl'@'%' IDENTIFIED BY '1q2w3e4r';
1、主库的配置
复制代码代码示例:
server-id = 1
log-bin=/home/mysql/logs/binlog/bin-log max_binlog_size = 500M binlog_cache_size = 128K binlog-do-db = adb binlog-ignore-db = mysql log-slave-updates
1.2. mysql5.0以上版本的配置
复制代码代码示例:
server-id = 1
log-bin=/home/mysql/logs/binlog/bin-log max_binlog_size = 500M binlog_cache_size = 128K binlog-do-db = adb binlog-ignore-db = mysql log-slave-updates expire_logs_day=2 binlog_format="MIXED"
1.3.各个参数的含义和相关注意项:
server-id = 1 #服务器标志号,注意在配置文件中不能出现多个这样的标识,如果出现多个的话mysql以第一个为准,一组主从中此标识号不能重复。
log-bin=/home/mysql/logs/binlog/bin-log #开启bin-log,并指定文件目录和文件名前缀。 max_binlog_size = 500M #每个bin-log最大大小,当此大小等于500M时会自动生成一个新的日志文件。一条记录不会写在2个日志文件中,所以有时日志文件会超过此大小。 binlog_cache_size = 128K #日志缓存大小 binlog-do-db = adb #需要同步的数据库名字,如果是多个,就以此格式在写一行即可。 binlog-ignore-db = mysql #不需要同步的数据库名字,如果是多个,就以此格式在写一行即可。 log-slave-updates #当Slave从Master数据库读取日志时更新新写入日志中,如果只启动log-bin 而没有启动log-slave-updates则Slave只记录针对自己数据库操作的更新。 expire_logs_day=2 #设置bin-log日志文件保存的天数,此参数mysql5.0以下版本不支持。 binlog_format="MIXED" #设置bin-log日志文件格式为:MIXED,可以防止主键重复。 2、从库的配置
2.1.mysql5.1.7以前版本
复制代码代码示例:
server-id=2
master-host=192.168.1.2 master-user=repl master-password=1q2w3e4r master-port=3306 master-connect-retry=30 slave-skip-errors=1062 replicate-do-db = adb replicate-ignore-db = mysql slave-skip-errors=1007,1008,1053,1062,1213,1158,1159 master-info-file = /home/mysql/logs/master.info relay-log = /home/mysql/logs/relay-bin relay-log-index = /home/mysql/logs/relay-bin.index relay-log-info-file = /home/mysql/logs/relay-log.info 如果修改了连接主库相关信息,重启之前一定要删除master.info文件,否则重启之后由于连接信息改变从库而不会自动连接主库,造成同步失败。此文件是保存连接主库信息的。
2.2.mysql5.1.7以后版本
slave-skip-errors=1007,1008,1053,1062,1213,1158,1159
2.3. 各个参数的含义和相关注意项 3、实现主从同步
3.1.实现数据库的统一
3.2.查看并记录主库bin-log信息
复制代码代码示例:
mysql> show master status;
+-------------+----------+--------------+------------------+ | File | Position | Binlog_do_db | Binlog_ignore_db | +-------------+----------+--------------+------------------+ | bin-log.003 | 4 | adb | mysql | +-------------+----------+--------------+------------------+ 1 row in set (0.00 sec) 记录File 和Position信息;
3.3.在从库上执行同步语句
复制代码代码示例:
slave stop;
change master to master_host='192.168.1.2', master_user='repl', master_password='1q2w3e4r', master_port=3306, master_log_file='bin-log.003', master_log_pos=4; slave start;
3.4.查看主从同步状态
Mysql5.5之前版本:
Mysql5.5版本:
重要的指标为:
Slave_IO_Running: Yes
Slave_SQL_Running: Yes Master_Log_File: bin-log.003 Relay_Master_Log_File: bin-log.003 Read_Master_Log_Pos: 4 Exec_master_log_pos: 4 Seconds_Behind_Master: 0(5.0之前版本没有这个选项) 以上选项是两两对应的,只要结果是一致的,就说明主从同步成功。
3.5.同步中的常见的错误和处理
Slave_IO_Running: Yes
Slave_SQL_Running: No Seconds_Behind_Master: NULL
原因:
解决方法:
mysql> show master status;
+----------------------+----------+--------------+------------------+ | File | Position | Binlog_Do_DB | Binlog_Ignore_DB | +----------------------+----------+--------------+------------------+ | mysql-bin.000040 | 324 |adb | mysql| +----------------------+----------+--------------+------------------+
然后,到slave服务器上执行手动同步:
slave stop;
change master to master_host='10.14.0.140', master_user='repl', master_password='1q2w3e4r', master_port=3306, master_log_file='mysql-bin.000040', master_log_pos=324; slave start; show slave status\G;
2、现象:从数据库无法同步,show slave status显示:
Slave_IO_Running: No
Slave_SQL_Running: Yes Seconds_Behind_Master: NULL
解决:
mysql> show master status;
+------------------+----------+--------------+------------------+ | File | Position | Binlog_Do_DB | Binlog_Ignore_DB | +------------------+----------+--------------+------------------+ | mysql-bin.000001 | 98 | adb| mysql| +------------------+----------+--------------+------------------+
进入从库mysql,执行:
slave stop;
change master to Master_Log_File='mysql-bin.000001',Master_Log_Pos=98; slave start;
或是这样:
stop slave;
set global sql_slave_skip_counter =1; start slave; 这个现象主要是master数据库存在问题,由于连接主库信息错误、主库数据库挂掉如果说常见错等原因引起的,我在实际的操作中先重启master后重启slave即可解决这问题,出现此问题,必须要要重启master数据库。
四、mysql主主和主主集群
Slave_IO_Running: Yes
Slave_SQL_Running: Yes Master_Log_File: bin-log.003 Relay_Master_Log_File: bin-log.003 Read_Master_Log_Pos: 4 Exec_master_log_pos: 4 Seconds_Behind_Master: 0(5.0之前版本没有这个选项) 通过以上的参数可以反映出主库和从库状态是否正常,从库是否落后于主库等。值得一提的是在mysql5.0以前的版本,Slave_IO_Running这个状态指标不可靠,会在主库直接挂掉的情况下不会变成NO,Seconds_Behind_Master参数也不存在。监控以上参数即可监控mysql主从。
2、mysql主从监控的实现
#/bin/sh
user=repl passwd=123415 master_ip="192.168.1.2" log="/data3/check_repl.log" value() { master=`/usr/local/mysql/bin/mysql -u$user -p$passwd -h$master_ip -e "show master status\G;"|egrep "File|Position"` #mysql 4.0 slave=`/usr/local/mysql/bin/mysql -u$user -p$passwd -h127.0.0.1 -e "show slave status\G;"|egrep "Relay_Master_Log_File|Exec_master_log_pos"` #mysql 5.0 #slave=`mysql -u$user -p$passwd -e "show slave status\G;"|egrep "Relay_Master_Log_File|Exec_Master_Log_Pos"` #取主库上的bin-log号及写入的当前日志位置 Master_Log=`echo $master |awk '{print $2}'|awk -F "." '{print $2}'` Master_Log_Pos=`echo $master |awk '{print $4}'` #取从库上当前同步主库的位置 Relay_Master_Log_File=`echo $slave |awk '{print $2}'|awk -F "." '{print $2}'` Exec_Master_Log_Pos=`echo $slave |awk '{print $4}'` echo "Master_Log:"$Master_Log>>$log echo "Master_Log_Pos:"$Master_Log_Pos>>$log echo "Relay_Master_Log_File:"$Relay_Master_Log_File>>$log echo "Exec_Master_Log_Pos:"$Exec_Master_Log_Pos>>$log } for((i=1;i<=10;i++)); do echo "#################################">>$log value time=`date +"%Y-%m-%d %H:%M:%S"` if [ $Master_Log -eq $Relay_Master_Log_File ];then A=`expr $Master_Log_Pos - $Exec_Master_Log_Pos` if [ $A -lt 0 ];then A=`expr 0 - $A` fi echo $A>>$log if [ $A -lt 10000 ];then echo "$time Master-Slave is OK.">>$log #echo "$i" break else if [ $i ge 3 ];then echo "$time Warning:Slave-Master lag $A " >>$log echo "$i" fi sleep 30 continue fi else sleep 60 fi if [ $i -eq 10 ];then echo "$i" echo "$time Error:Slave-Master must be check !" >>$log fi done 在mysql5.0以后的版本,mysql主从已经相当的成熟了,可以只监控Slave_IO_Running,Slave_SQL_Running,Seconds_Behind_Master状态即可,大家研究下。 (责任编辑:IT) |