GitHub - lxyfirst/queue_server: 分布式队列服务器，实现接口简单，支持tcp/udp，高可用、高性能的队列服务器集群

概述

开源的消息队列服务有很多，比如kafka，rabbitmq，redis等，但没有发现能同时支持优先级队列、消息确认机制、高可用复制，同时部署和使用又简单方便的系统，因此开发一个这样的系统。
本系统提供各种语义的队列服务，以分布式方式运行，数据在多个节点之间复制，通过master节点自动选举实现高可用性。
所有请求由master节点处理，异步复制到其他节点，客户端可以使用集群中任意选择一个服务器节点发起请求，请求会自动转发给master节点，失败则重试下一个。主要功能点如下：

支持tcp/udp协议，数据通过json格式请求实现消息的生产、消费、确认。
支持消息的最多处理一次，最少处理一次语义。
支持消息的延迟、重试和有效期。
系统以集群方式运行，数据在多个节点间自动复制,少于一半节点失效时，服务不受影响，数据不会丢失。
节点支持请求转发也支持重定向。客户端可以实现的更灵活。

设计思路

队列消息在创建时有不同的优先级(延迟时间),这要求消息能够按优先级(延迟时间)排序。
队列消息在消费时支持确认机制，这要求消息在存活期间需要有唯一的消息ID，能够根据消息ID查询到消息。
队列消息重试的间隔支持自定义，重新被消费的时间间隔是不同的。
消息过期时间用来控制重试次数，为保证最少处理一次语义，没有被处理过的过期消息不会被丢弃，处理一次后才会被丢弃。
消息的生产、消费和确认都可以看作写操作，为保证一致性，只有一个节点能够处理此类请求，容量或处理能力不够时，可部署多套系统实现水平伸缩。
为了实现节点间数据同步，master节点需要维护队列数据变化日志列表，slave节点获得日志列表进行回放实现数据一致性。如果日志容量过小，可能同步不完整。
消息同步基于递增的全局trans_id ,同步协议中带有前后消息的trans_id，通过trans_id的连续性控制同步的可靠性。

实现

使用c++实现，采用单进程多线程异步模型，工作线程负责处理请求，主线程负责在节点间同步数据。
所有节点都可以接收请求，队列数据相关请求转发给master节点处理,如果关闭转发功能，则返回master节点信息。
对外接口支持tcp/udp协议，请求中数据量过大时(超过2k)建议使用tcp协议，报文使用json格式。
节点间的数据复制通过内部tcp连接通道进行，异步复制，推拉结合。
对消息的增/删操作都会记录在消息日志中，使用递增的trans_id保证全局顺序，通过消息日志回放方式实现数据复制。
消息队列包含两种数据结构，消息存储结构和按时间索引的待消费队列。
节点选举算法采用类raft算法。

内存程序数据结构

主要由队列和队列消息日志构成:
队列内部有两个数据结构，待处理队列和消息索引。
消息索引使用unordered_map保存，维护消息id和消息内容的对应关系。
待处理队列使用multimap保存,维护消息的出队列顺序。
队列消息日志维护所有队列的数据变化(增删)列表，用于在节点间同步数据，每条日志具有唯一且递增的trans_id，使用map保存以保证有序。

选举算法

集群中的节点分为master节点和slave节点，一个集群中有奇数个节点组成，只有一个master节点，其他都是slave节点。
master节点处理所有请求，slave节点同步数据，当master节点失效时，从所有slave节点中重新选举一个作为master。
为了实现数据一致性，选举算法将节点的队列消息日志中的最大trans_id作为选举的一个条件。
选举使用(trans_id,vote_id,node_id)组成的三元组表示选举值，每次有数据更新，trans_id会增加，每次发起选举，vote_id会增加，保证数据最新的节点选举值最高。
当节点连接到其他节点数量超过半数时，才能形成有效集群。
当有效集群中不存在master节点时，集群中的节点发起选举，获得集群大多数同意的节点赢得选举，成为新master节点，通知其他节点。

队列算法

生产消息时，通过消息列表存储消息内容，根据消息的delay插入待处理队列相应位置。
消费消息时，从待处理队列中按顺序出队列，若消息需要确认(retry>0)，再加入待重入队列，若不需要确认则删除消息。
确认消息时，直接删除消息。
消息的生产和删除事件会记录到消息日志中。

同步算法

数据同步发生在master节点和slave节点之间，通过消息日志的push同步方式和pull同步方式互相配合实现高效的节点间数据同步。
当slave节点启动或选举结束时，主动向master节点发起pull同步请求，带上本地最大的trans_id,master节点返回trans_id的后一条数据，slave持续重复这个过程，直到同步完成。
为了防止数据同步占用过多master节点资源，pull同步可以限制同步速率。
当master节点上发生数据变更时，master节点写入消息日志，push同步给所有slave节点，slave节点判断收到的数据和本地数据是否连续，如果不连续，忽视此数据并发起pull方式同步。
如果连续，接受此数据。

虚拟队列

多个真实队列可以绑定在一起，形成一个虚拟队列，向虚拟队列中写入时，会同时向每个真实队列复制。虚拟队列只处理写入，其他操作都通过真实队列进行。

部署和维护

同一个集群内所有节点node_type必须相同，node_id必须不同。
每个节点会接受两种连接，面向客户端的tcp/udp连接和面向内部节点的tcp连接。
增删节点时应一个个进行，并确认数据同步完成，防止集群节点数量变化造成现有存活节点少于集群节点数量一半，引起集群失效。
虚拟队列仅用于生产消息，相当于对所配置的真实队列分别生产消息。

演进方向

消息日志持久化存储。
long-polling , 只有在master节点直接接受tcp协议请求时适合使用该模式。

性能测试

使用php进行简单的性能测试，同网段2台机器，一台运行客户端，一台运行服务端，服务器为4核E5-2620 v2 @ 2.10GHz虚拟机，系统未做优化。
客户端为8个php并发进程，每个进程不停发送1万个请求，测试结果：
total:10000 fail:0 min:0.000230 max:0.003858 avg:0.000540
total:10000 fail:0 min:0.000226 max:0.004506 avg:0.000542
total:10000 fail:0 min:0.000231 max:0.005618 avg:0.000542
total:10000 fail:0 min:0.000270 max:0.004635 avg:0.000581
total:10000 fail:0 min:0.000281 max:0.003218 avg:0.000582
total:10000 fail:0 min:0.000280 max:0.004616 avg:0.000582
total:10000 fail:0 min:0.000275 max:0.008703 avg:0.000583
total:10000 fail:0 min:0.000278 max:0.004305 avg:0.000584
说明 min : 最小耗时(秒) max : 最大耗时(秒) avg : 平均耗时(秒)
服务器TPS达到近14000/秒时，平均延迟在0.6毫秒。

依赖

依赖protobuf 2.4及以上

编译安装

$make && make install
编译后的程序和配置文件生成在./deploy目录下

配置项

使用json格式配置文件：

{
   "log_prefix" : "queue_server" , //日志文件前缀
   "log_level" :3 , //日志级别

   "node_type" :10 ,       //集群id
   "node_id" :1 ,          //节点id 
   "host" : "0.0.0.0",     //对外服务IP
   "port" : 1111 ,         //对外服务端口

   "queue_size":100000 ,      //每个队列长度
   "queue_log_size":100000 ,  //队列日志总容量
   "queue_sync_rate":3000  ,  //节点数据同步频率
   "forward_request":1 ,      //转发请求到master，如果关闭，slave节点收到请求后将直接返回master节点信息

   "cluster_node_list" : [       //集群节点配置，id，内部服务ip和端口
       {"node_id":1 , "host":"127.0.0.1", "port":1101 },
       {"node_id":2 , "host":"127.0.0.1", "port":1102 },
       {"node_id":3 , "host":"127.0.0.1", "port":1103 }
   ],
   "virtual_queue_list" :  [     //虚拟队列配置，虚拟队列名->真实队列列表
       {"name":"test" , "queue_list" : ["test1","test2"] }      
   ]

}

接口

数据格式为json对象,字段定义：

请求

action: 请求类型，数字， 1:生产消息 2:消费消息 3:确认消息 4:监控 7:队列列表 8:获取leader信息 104:本节点监控 107:本节点队列列表。
queue: 队列名字，字符串。
pattern : 队列名匹配模式，字符串。
delay : 消息延迟处理时间，数字。
ttl : 消息过期时间，数字，应大于delay。
retry : 消息未确认时重新进入队列时间，数字，0表示不重试，即最多处理一次，>0表示重试间隔，直到超时，即最少处理1次。
data : 消息内容，字符串。
seq : 请求序列号，可选项。
msg_id : 消息id 。

响应

code: 响应码， 0表示成功 , -1表示系统错误，-2表示重定向。
reason : 原因，失败时表示失败原因。
size : 队列长度。
max_size : 队列最大长度。
max_id : 当前消息id 。
leader_node_id ： master节点id 。
leader_host： master节点对外服务IP。
leader_port： master节点对外服务端口。
node_id : 处理请求节点id 。
log_size : 消息日志数量。
max_log_size ：消息日志最大数量。
trans_id ：当前trans_id值。
wait_status : 队列拥塞情况。

协议

生产消息：(action,queue,delay,ttl,retry,data) -> (action,code,reason,msg_id)
消费消息 : (action,queue) -> (action,code,reason,msg_id,data)
确认消息 : (action,msg_id) -> (acton,code,reason)
监控 : (action) -> (action,code,reason,size,max_id,wait_status,leader_node_id,node_id,trans_id)
列表 : (action,pattern) -> (action,code,reason,queue_list,queue_count)
leader信息 : (action) -> (action,code,reason,leader_node_id,leader_host,leader_port)

Name		Name	Last commit message	Last commit date
Latest commit History 57 Commits
framework		framework
public		public
queue_server		queue_server
rapidjson		rapidjson
test		test
.gitignore		.gitignore
makefile		makefile
readme.md		readme.md

lxyfirst/queue_server

Folders and files

Latest commit

History

Repository files navigation

概述

设计思路

实现

内存程序数据结构

选举算法

队列算法

同步算法

虚拟队列

部署和维护

演进方向

性能测试

依赖

编译安装

配置项

接口

请求

响应

协议

About

Resources

Stars

Watchers

Forks

Languages