简介
概述
PowerJob
是新一代分布式任务调度与计算框架
,支持CRON
、API
、固定频率
、固定延迟
等调度策略,提供工作流
来编排任务解决依赖关系,能让您轻松完成作业的调度与繁杂任务的分布式计算
。
为什么选择 PowerJob ?
当前市面上流行的作业调度框架有老牌的Quartz
、基于Quartz的elastic-job
和原先基于Quartz后面移除依赖的xxl-job
,这里分别谈一些这些框架现存的缺点。
Quartz
可以视为第一代任务调度框架
,基本上是现有所有分布式调度框架的“祖宗”。由于历史原因,它不提供Web界面
,只能通过API完成任务的配置
,使用起来不够方便和灵活,同时它仅支持单机执行
,无法有效利用整个集群的计算能力。
xxl-job
可以视为第二代任务调度框架
,在一定程度上解决了Quartz的不足,在过去几年中是个非常优秀的调度框架,不过放到今天来看,还是存在着一些不足的,具体如下:
数据库支持单一
: 仅支持MySQL,使用其他DB需要自己魔改代码有限的分布式计算能力
:仅支持静态分片,无法很好的完成复杂任务的计算不支持工作流
:无法配置各个任务之间的依赖关系,不适用于有DAG需求的场景
正所谓长江后浪推前浪,在如今这个数据量日益增长、业务越来越复杂的年代,急需一款更为强大的任务调度框架来解决上诉问题,而PowerJob
因此应运而生。
PowerJob
可以被认为是第三代任务调度框架
,在任务调度的基础上,还额外提供了分布式计算
和工作流功能
,其主要特性如下:
使用简单
:提供前端Web界面
,允许开发者可视化
地完成调度任务的管理(增、删、改、查)
、任务运行状态监控
和运行日志查看
等功能。定时策略完善
:
支持CRON表达式
、固定频率
、固定延迟
和API
四种定时调度策略。执行模式丰富
:
支持单机
、广播
、Map
、MapReduce
四种执行模式,其中Map
和MapReduce
处理器能使开发者寥寥数行代码便获得集群分布式计算的能力
。DAG工作流支持
:
支持在线配置任务依赖关系
,可视化得对任务进行编排,同时还支持上下游任务间的数据传递执行器支持广泛
:
支持Spring Bean
、内置/外置Java类
、Shell
、Python
等处理器,应用范围广。运维便捷
:
支持在线日志功能
,执行器产生的日志可以在前端控制台页面实时显示,降低debug成本,极大地提高开发效率。依赖精简
:
最小仅依赖关系型数据库
(MySQL/PostgreSQL/Oracle/MS SQLServer…),同时支持所有Spring Data JPA所支持的关系型数据库。高可用 & 高性能
:
调度服务器经过精心设计,一改其他调度框架基于数据库锁的策略,实现了无锁化调度
。部署多个调度服务器可以同时实现高可用和性能的提升(支持无限的水平扩展)。故障转移与恢复
:
任务执行失败后,可根据配置的重试策略
完成重试,只要执行器集群有足够的计算节点,任务就能顺利完成。
同类产品对比
适用场景
- 有
定时执行需求
的业务场景:如每天凌晨全量同步数据
、生成业务报表
等。 - 有需要
全部机器一同执行
的业务场景:如使用广播执行模式清理集群日志
。 - 有需要
分布式处理
的业务场景:比如需要更新一大批数据,单机执行耗时非常长,可以使用Map/MapReduce
处理器完成任务的分发,调动整个集群加速计算。
整体架构
快速体验
PowerJob
由调度服务器(powerjob-server)
和执行器(powerjob-worker)
两部分组成,powerjob-server
负责提供Web服务
和完成任务的调度
,powerjob-worker
则负责执行
用户所编写的任务代码
,同时提供分布式计算
能力。
初始化项目
git clone https://github.com/KFCFans/PowerJob.git |
导入 IDE,源码结构如下,我们需要启动调度服务器(powerjob-server)
,同时在samples
工程中编写
自己的处理器代码
启动调度服务器(powerjob-server)
创建数据库:
powerjob-daily
修改配置文件(配置文件的说明官方文档写的非常详细,此处不再赘述):需要修改的地方为数据库配置
spring.datasource.core.jdbc-url
、spring.datasource.core.username
和spring.datasource.core.password
,当然,有mongoDB
的同学也可以修改spring.data.mongodb.uri
以获取完全版体验。
oms.env=DAILY |
完成配置文件的修改后,可以直接通过启动类com.github.kfcfans.powerjob.server.OhMyApplication
启动调度服务器,观察启动日志,查看是否启动成功,访问http://127.0.0.1:7700/
,如果能顺利出现Web界面,则说明调度服务器启动成功!
- 注册应用:点击主页应用注册按钮,填入
oms-test
和控制台密码
(用于进入控制台),注册示例应用(当然你也可以注册其他的appName
,只是别忘记在示例程序中同步修改
~)
编写示例代码(powerjob-worker)
进入示例工程
powerjob-worker-samples
,修改配置文件连接powerjob-server
并编写自己的处理器代码。修改
powerjob-worker-samples
的启动配置类com.github.kfcfans.powerjob.samples.OhMySchedulerConfig
,将AppName
修改为刚刚在控制台注册的名称。
|
- 编写自己的处理器:随便找个地方新建类,继承你想要使用的处理器(各个
处理器的介绍可见官方文档
,文档非常详细),这里为了简单演示,选择使用单机处理器BasicProcessor
,以下是代码示例。
|
启动示例程序,即直接运行主类com.github.kfcfans.powerjob.samples.SampleApplication
,观察控制台输出信息,判断是否启动成功。
任务的配置与运行
调度服务器
与示例工程
都启动完毕后,再次前往Web
页面(http://127.0.0.1:7700/
),进行任务的配置与运行。
- 在
首页输入框输入配置的应用名称
,成功操作后会正式进入前端管理界面。
- 点击
任务管理
->新建任务(右上角)
,开始创建任务。
- 完成任务创建后,即可在控制台看到刚才创建的任务,如果觉得等待调度太过于漫长,可以直接点击运行按钮,立即运行本任务。
- 前往
任务示例
边栏,查看任务的运行状态和在线日志
基础的教程到这里也就结束了~更多功能示例可见官方文档,工作流、MapReduce、容器等高级特性等你来探索!