开源免费的数据开发工具 Data Studio

如题所述

数据开发平台(Data Studio)是一款基于shell+hql脚本的可视化编辑工具,能够实现从模板上传、脚本内容填写、测试执行到下发的全生命周期管控,是数仓管理者的得力助手。它不仅能帮助开发人员避免线上脚本混乱,还能确保上线后的脚本无问题,同时规避安全风险。

产品介绍:

2.1 Apache Drill:这是一个用于大数据探索的Apache开源SQL查询引擎,旨在支持对来自现代大数据应用程序的半结构化和快速发展的数据进行高性能分析,同时提供行业标准查询语言ANSI SQL的熟悉度和生态系统。

2.2 Apache Linkis:它构建在上层应用程序和底层引擎之间的一层计算中间件,通过REST/WebSocket/JDBC等标准接口,上层应用可以方便地连接访问MySQL/Spark/Hive/Presto/Flink等底层引擎,同时实现统一变量、脚本、用户定义函数和资源文件等用户资源的跨上层应用互通,以及通过REST标准接口提供了数据源管理和数据源对应的元数据查询服务。

2.3 Apache Paimon:这是一项流式数据湖存储技术,可以提供高吞吐、低延迟的数据摄入、流式订阅以及实时查询能力,采用开放的数据格式和技术理念,可以与Apache Flink/Spark/Trino等业界主流计算引擎进行对接。

2.4 Apache StreamPark:原名StreamX,是流处理极速开发框架,流批一体&湖仓一体的云原生平台,一站式流处理计算平台。

2.5 Apache Zeppelin:这是一种开源的Web笔记本类型交互式数据分析工具,允许数据工程师和科学家通过各种语言和工具进行数据分析、可视化以及分享。

2.6 Byzer Notebook:基于Byzer引擎搭建的网页交互计算(Web IDE)应用平台,提供易用而又完善的产品能力,支持可视化Workflow的运行和调度的集成。

2.7 DTSphere DataStudio:数梦工场数据集成开发平台,支持离线数据开发和实时数据开发两种模式,提供一站式开发、全流程调度、一体化运维能力。

2.8 DanaStudio数智开发:面向开发者、数据管理者、数据应用者提供的一站式大数据协作开发、管理平台,致力于解决结构化、半结构化和非结构化数据的采集融合、数据治理、元数据管理、分层管理、交换服务等问题。

2.9 Dinky:以Apache Flink为基础,连接OLAP和数据湖等众多框架的一站式实时计算平台,致力于流批一体和湖仓一体的探索与实践。

2.10 Jupyter Notebook:一个开源的web应用程序,可以创建和共享包含实时代码、方程、可视化和文本的文档,支持实时代码、数学方程、可视化和Markdown。

2.11 Scriptis:支持在线写SQL、Pyspark、HiveQL等脚本,提交给Linkis执行的数据分析Web工具,支持UDF、函数、资源管控和智能诊断等企业级特性。

2.12 Tempo数据工厂:集数据采集、数据接入、数据处理、数据应用于一体的软件产品,为企业提供各类场景下海量数据开发平台。
温馨提示:答案为网友推荐,仅供参考
相似回答
大家正在搜