此文已由作者张镐薪授权网易云社区发布。
欢迎访问网易云社区,了解更多网易技术产品运营经验。
首先,利用开源产品,我们的第一个首要目标是--稳定!
还是用之前的例子:
首先,我们可以这么理解,MyCat只应该做两件事:请求转发与结果合并。源代码篇讲过MyCat的分布式事务的弱XA原理(其实根本不算是分布式事务),这是不可靠的,我们要想稳定的高可信的利用MyCat,就要避免一切分布式事务。 从现在开始,MyCat的所有图例为了演示方便将采用以下规则:
1.某一表同一分片多记录的插入和更新多次的事务是允许的: 对于分片表的事务,如果只包含单一分片列id,则事务只会被发送到一个真实数据库上执行。不涉及到分布式事务。
2.只涉及到同种分片规则并相同分布的表(其实就是父子表,就算你不用childtable标签,分布和分片规则都相同的表和父子表也是等价的)的同一条对应记录的插入和更新多次的事务是允许的! 多条记录更新:不允许这么做!
3.其他类型的,例如涉及到同一表不同分片的插入更新事务,或者涉及到不同分布分片的表的插入更新事务,都是不允许的。 4. 公共表的更新是不允许的,最好交由DBA去每一个分片上更新,保证一致性。
再次强调,MyCat只应该做两件事:请求转发与结果合并。 但是,在结果合并时,我们要考虑到JVM的内存限制,不能返回结果过大。好在MyCat设置里面我们可以开启sqllimit来控制每条不加limit的语句返回的结果数量。
1.要么开启sqllimit来控制每条不加limit的语句返回的结果数量,要么保证每条业务sql都加上合适的limit
2.MySQL本身不能做join,只能交由底层真实数据库去做, MyCat去做结果合并(sqllimit有效) 父子表按分片列join
如果join条件为分片列,则可以返回正确结果 父子表按非分片列join 如果join条件为非分片列,返回的结果不可靠,因为join是底层真实数据库完成的,但是每个库都没有完整的数据
分片表与公共表join 这样结果是正确的,因为公共表有全量数据
超过2表以上join,不支持
3. 不论是什么查询,都要考虑好量级,Join,group by还有order by都最好不要用。
更多网易技术、产品、运营经验分享请点击。