RocketMQ - Topic、message

RocketMQ - Topic、message

Topic

表示一类消息的集合,每个主题包含若干条消息,每条消息只能属于一个主题,是RocketMQ进行消息订阅的基本单位。

存储方式

每个Broker可以存储多个Topic消息,每个Topic的消息同时也可以分片存储在不同的Broker上,每个Topic中的消息地址存储于多个Message Queue中。

架构信息

在这里插入图片描述

Topic利用queue记录消息所在broker的存储的消息信息,相互之间的关系就是,Topic关联MessageQueue(queue-a,queue-b),queue里存储的queuedata关联borker(记录消息在broker存储的详细情况)。

消息

订阅与发布

消息发布:某个生产者想topic发送带有/不带有某些tag的消息;
消息订阅:某个消费者关注了某个topic中带有某些tag的消息;

消息的有序性

一类消息消费时,能按照发送顺序来消费,顺序消费分两种,一种是全局顺序消息和分区顺序消息。
全局顺序:某个Topic下,所有的消息都要保证顺序,要全局顺序只能一个分区,对于制定的消息严格按照先入先出(FIFO)的顺序进行发布和消费,当然这样会影响性能。
部分顺序:某个Topic下,只要保证每一组消息被顺序消费就OK,所有消息根据sharding key进行区块分区,同一个分区内的消息按照严格的FIFO顺序进行发布和消费,Sharding key是顺序消息中用来区分不同分区的关键字段,和普通消息的key是完全不同的概念,性能较高。
在这里插入图片描述

过滤消息

消费者可以根据标签(tag)进行消息过滤,也支持自定义属性过滤,消息过滤目前是在Broker端实现的,主要是减少Consumer无用消息的网络传输,但同时增加了Broker负担,而且实现相对比较复杂。
主要支持如下2种的过滤方式 (1) Tag过滤方式:Consumer端在订阅消息时除了指定Topic还可以指定TAG,如果一个消息有多个TAG,可以用||分隔。其中,Consumer端会将这个订阅请求构建成一个 SubscriptionData,发送一个Pull消息的请求给Broker端。Broker端从RocketMQ的文件存储层—Store读取数据之前,会用这些数据先构建一个MessageFilter,然后传给Store。Store从 ConsumeQueue读取到一条记录后,会用它记录的消息tag hash值去做过滤,由于在服务端只是根据hashcode进行判断,无法精确对tag原始字符串进行过滤,故在消息消费端拉取到消息后,还需要对消息的原始tag字符串进行比对,如果不同,则丢弃该消息,不进行消息消费。
(2) SQL92的过滤方式:这种方式的大致做法和上面的Tag过滤方式一样,只是在Store层的具体过滤过程不太一样,真正的 SQL expression 的构建和执行由rocketmq-filter模块负责的。每次过滤都去执行SQL表达式会影响效率,所以RocketMQ使用了BloomFilter避免了每次都去执行。SQL92的表达式上下文为消息的属性。

消息的可靠性

影响消息可靠性的有一下集中可能:

  1. Broker非正常关闭
  2. Broker异常宕机
  3. OS 宕机
  4. 机器掉电,但是能立即恢复供电情况
  5. 机器无法开机
  6. 磁盘设备损坏
    1)2)3)4)属于硬件资源可立即恢复情况,能保证消息不丢,或者丢失少量数据(依赖刷盘方式是同步还是异步)
    5)6)属于单点故障,且无法恢复,一旦发生,在此节点消息全部消失,可以通过异步复制,可保证99%的消息不丢,但是仍然会有极少的消息可能丢失,通过同步双写技术可以完全避免单点,但是会影响性能

消息消费回溯

Broker提供了一种机制,可以按照时间维度来回退消费进度,所以支持重新消费,时间维度精确到毫秒

事务消息

RocketMQ事务消息(Transactional Message)是指应用本地事务和发送消息操作可以被定义到全局事务中,要么同时成功,要么同时失败。RocketMQ的事务消息提供类似 X/Open XA 的分布事务功能,通过事务消息能达到分布式事务的最终一致。
在这里插入图片描述

定时消息

定时消息(延迟队列)是指消息发送到broker后,不会立即被消费,等待特定时间投递给真正的topic。 broker有配置项messageDelayLevel,默认值为“1s 5s 10s 30s 1m 2m 3m 4m 5m 6m 7m 8m 9m 10m 20m 30m 1h 2h”,18个level。可以配置自定义messageDelayLevel。注意,messageDelayLevel是broker的属性,不属于某个topic。发消息时,设置delayLevel等级即可:msg.setDelayLevel(level)。level有以下三种情况:

level == 0,消息为非延迟消息
1<=level<=maxLevel,消息延迟特定时间,例如level=1,延迟1s
level > maxLevel,则level== maxLevel,例如level==20,延迟2h
定时消息会暂存在名为SCHEDULE_TOPIC_XXXX的topic中,并根据delayTimeLevel存入特定的queue,queueId = delayTimeLevel – 1,即一个queue只存相同延迟的消息,保证具有相同发送延迟的消息能够顺序消费。broker会调度地消费SCHEDULE_TOPIC_XXXX,将消息写入真实的topic。

需要注意的是,定时消息会在第一次写入和调度写入真实topic时都会计数,因此发送数量、tps都会变高。

消息重试

Consumer消费消息失败后,要提供一种重试机制,令消息再消费一次。Consumer消费消息失败通常可以认为有以下几种情况:
由于消息本身的原因,例如反序列化失败,消息数据本身无法处理。这种错误通常需要跳过这条消息,再消费其它消息,而这条失败的消息即使立刻重试消费,99%也不成功,所以最好提供一种定时重试机制,即过10秒后再重试。
由于依赖的下游应用服务不可用,例如db连接不可用,外系统网络不可达等。遇到这种错误,即使跳过当前失败的消息,消费其他消息同样也会报错。这种情况建议应用sleep 30s,再消费下一条消息,这样可以减轻Broker重试消息的压力。
RocketMQ会为每个消费组都设置一个Topic名称为“%RETRY%+consumerGroup”的重试队列(这里需要注意的是,这个Topic的重试队列是针对消费组,而不是针对每个Topic设置的),用于暂时保存因为各种异常而导致Consumer端无法消费的消息。考虑到异常恢复起来需要一些时间,会为重试队列设置多个重试级别,每个重试级别都有与之对应的重新投递延时,重试次数越多投递延时就越大。RocketMQ对于重试消息的处理是先保存至Topic名称为“SCHEDULE_TOPIC_XXXX”的延迟队列中,后台定时任务按照对应的时间进行Delay后重新保存至“%RETRY%+consumerGroup”的重试队列中。

消息查询

RocketMQ支持按照下面两种维度(“按照Message Id查询消息”、“按照Message Key查询消息”)进行消息查询。

消息重发

生产者在发送消息时,同步消息失败会重投,异步消息有重试,oneway没有任何保证。消息重投保证消息尽可能发送成功、不丢失,但可能会造成消息重复,消息重复在RocketMQ中是无法避免的问题。消息重复在一般情况下不会发生,当出现消息量大、网络抖动,消息重复就会是大概率事件。另外,生产者主动重发、consumer负载变化也会导致重复消息。如下方法可以设置消息重试策略:
retryTimesWhenSendFailed:同步发送失败重投次数,默认为2,因此生产者会最多尝试发送retryTimesWhenSendFailed + 1次。不会选择上次失败的broker,尝试向其他broker发送,最大程度保证消息不丢。超过重投次数,抛出异常,由客户端保证消息不丢。当出现RemotingException、MQClientException和部分MQBrokerException时会重投。
retryTimesWhenSendAsyncFailed:异步发送失败重试次数,异步重试不会选择其他broker,仅在同一个broker上做重试,不保证消息不丢。
retryAnotherBrokerWhenNotStoreOK:消息刷盘(主或备)超时或slave不可用(返回状态非SEND_OK),是否尝试发送到其他broker,默认false。十分重要消息可以开启。

流量控制

生产者流控,因为broker处理能力达到瓶颈;消费者流控,因为消费能力达到瓶颈。

生产者流控:
commitLog文件被锁时间超过osPageCacheBusyTimeOutMills时,参数默认为1000ms,返回流控。
如果开启transientStorePoolEnable == true,且broker为异步刷盘的主机,且transientStorePool中资源不足,拒绝当前send请求,返回流控。
broker每隔10ms检查send请求队列头部请求的等待时间,如果超过waitTimeMillsInSendQueue,默认200ms,拒绝当前send请求,返回流控。
broker通过拒绝send 请求方式实现流量控制。
注意,生产者流控,不会尝试消息重投。

消费者流控:
消费者本地缓存消息数超过pullThresholdForQueue时,默认1000。
消费者本地缓存消息大小超过pullThresholdSizeForQueue时,默认100MB。
消费者本地缓存消息跨度超过consumeConcurrentlyMaxSpan时,默认2000。
消费者流控的结果是降低拉取频率。

猜你喜欢

转载自blog.csdn.net/jianghuafeng0/article/details/106552756