Topology运行流程及方法调用流程

Topology运行流程及方法调用流程Topology 运行流程 1 提交 Topology 后 Storm 会把代码先存放到 Nimbus 节点的 inbox 目录下 之后 把当前 Storm 运行的配置生成一个 stormconf ser 文件放到 NImbus 节点的 stormdist 目录中 此目录中同时还有序列化之后的 Topology 代码文件 2 在设定 Topology 关联的 Spout 和 bolt 时

大家好,我是讯享网,很高兴认识大家。

Topology运行流程

1)提交Topology后,Storm会把代码先存放到Nimbus节点的inbox目录下;之后,把当前Storm运行的配置生成一个stormconf.ser文件放到NImbus节点的stormdist目录中,此目录中同时还有序列化之后的Topology代码文件。

2)在设定Topology关联的Spout和bolt时,可以同时设置当前的spout和bolt的Executor的总和一致。之后,系统根据Worker的数量,尽量将这些Task平均分配到不同的Worker上执行。Worker在哪个Supervisor节点上运行是由Storm本身决定的。

3)在任务分配好之后,Nimbus节点将任务的信息提交到Zookeeper集群,同时在zookeeper集群中有workerbeats,这里存储了当前Topolody所有worker进程的心跳信息。

4)Supervisor节点不断轮询Zookeeper集群,在zookeeper的assignments中保存了所有Topology的任务分配信息、代码存储目录、人物之间的关联关系等,Supervisor通过轮询此节点的内容来领取自己的任务,启动worker进程运行。


讯享网

5)一个Topology运行之后,不断通过Spout来发送流,通过Bolt来不断处理接收到的流,流是无界的。最后一步会不间断的执行,除非手动结束该Topology。

Topology的方法调用流程

1)每个组件(spout或者bolt)的构造方法和declareOutputFiles方法都只被调用一次

2)open方法和prepare方法被调用多次。在入口函数中设定的setSpout或者setBolt中的并行度参数是指Executor的数量ÿ

小讯
上一篇 2025-03-25 19:58
下一篇 2025-04-01 11:16

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/47332.html