一聚教程网:一个值得你收藏的教程网站

最新下载

热门教程

PiFlow大数据流水线系统 V1.8

时间:2026-06-04 09:14:01 编辑:袖梨 来源:一聚教程网

 PiFlow是一个简单易用,功能强大的大数据流水线系统。包含丰富的处理器组件,提供Shell、DSL、Web配置界面、任务调度、任务监控等功能。

特性:

1、简单易用

可视化配置流水线。

监控流水线。

查看流水线日志。

检查点功能。

2、扩展性强:

支持自定义开发数据处理组件。

3、性能优越:

基于分布式计算引擎Spark开发。

4、功能强大:

提供100+的数据处理组件。

包括Hadoop 、Spark、MLlib、Hive、Solr、Redis、MemCache、ElasticSearch、JDBC、MongoDB、HTTP、FTP、XML、CSV、JSON等。

集成了微生物领域的相关算法。

环境要求:

JDK 1.8

Spark-2.11.8

Apache Maven 3.1.0

Spark-2.1.0 及以上版本

Hadoop-2.6.0

PiFlow大数据流水线系统 v1.8

热门栏目