2025年大数据高级开发工程师——Flink学习笔记(2)

大数据高级开发工程师——Flink学习笔记(2)文章目录 Flink 学习笔记 Flink 实操篇 Flink 并行度 amp Slot amp Task 1 并行度 2 并行度的设置 算子级别 执行环境级别 客户端级别 系统级别 3 并行度操作 DataStream 编程模型 DataStream 编程模型 Flink 的 DataSource 数据源 1 基于文件 2 基于 Socket 3 基于集合 4

大家好,我是讯享网,很高兴认识大家。


讯享网

文章目录

  • Flink学习笔记
    • Flink实操篇
      • Flink 并行度 & Slot & Task
        • 1. 并行度
        • 2. 并行度的设置
          • 算子级别
          • 执行环境级别
          • 客户端级别
          • 系统级别
        • 3. 并行度操作
      • DataStream 编程模型
      • DataStream 编程模型
      • Flink 的 DataSource 数据源
        • 1. 基于文件
        • 2. 基于 Socket
        • 3. 基于集合
        • 4. 自定义输入
          • 案例一:自定义单并行度数据源
          • 案例二:自定义多并行度数据源
      • Flink 的 Sink 数据目标
        • 1. Flink 写数据到 redis 中
      • DataStream 转换算子
        • 1. map、filter
        • 2. flatMap、keyBy、sum
        • 3. reduce
        • 4. union
        • 5. connect
        • 6. 重分区算子
      • DataSet 转换算子
        • 1. mapPartition
        • 2. distinct
        • 3. join
        • 4. leftOutJoin、rightOuterJoin
        • 5. cross
        • 6. first-n和sortPartition
小讯
上一篇 2025-02-18 11:42
下一篇 2025-03-24 23:44

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/27833.html