MaxCompute（原ODPS）开发入门指南——数据开发工具篇-广西水牛所-中国农业科学院水牛研究所

MaxCompute（原ODPS）开发入门指南——数据开发工具篇

投稿用户 • 2023年5月7日上午9:12 • 科研百科 • 阅读 558

大家在使用大数据计算服务MaxCompute时，最头疼就是我现在已有的数据如何快速上云？我的日志数据如何采集到MaxCompute上？等等。。。具体详见《MaxCompute（原ODPS）开发入门指南——数据上云篇》。

MaxCompute（原ODPS）开发入门指南——数据开发工具篇

但是数据在MaxCompute上了之后，问题又来了，我怎么基于上面进行快速的数据开发，构建大数据仓库。

本文就重点为大家推荐和介绍开发工具：① 大数据开发套件Data IDE； ② MaxCompute Studio。

大数据开发套件Data IDE

大数据开发套件基于MaxCompute强大的计算存储能力，提供多人协作开发能力且支持百万级别任务稳定调度系统的在线开发工具，在阿里巴巴集团内是建设大数据仓库平台的必备工具。

1.工作流设计器

通过拖拽式进行工作流任务的设计，包括上下游节点任务的依赖关系。包括SQL、MR、数据同步、机器学习、shell节点任务等。

MaxCompute（原ODPS）开发入门指南——数据开发工具篇

2.数据集成

支持常见的数据源集成，提供可视化方式配置和脚本模式，开发者可以根据自己喜好进行选择。

MaxCompute（原ODPS）开发入门指南——数据开发工具篇

例子：ftp数据同步到MaxCompute的可视化配置界面。如下：

MaxCompute（原ODPS）开发入门指南——数据开发工具篇

例子：ftp数据同步到MaxCompute的脚本开发模式，包括reader和writer。如下：

MaxCompute（原ODPS）开发入门指南——数据开发工具篇

3.调度系统

大数据开发套件Data IDE支持调度周期类型：**天、小时、分钟（5的倍数）、月、周**。也就是说在大数据开发套件中如果做数据集成，最小的数据周期颗粒度为5分钟一次。具体可以在调度配置中进行设置：

MaxCompute（原ODPS）开发入门指南——数据开发工具篇

只需要进行下拉框配置即可设置工作流任务的调度周期和任务执行时间。

4.运维系统

提供可视化运维界面，完全解放数据开发运维的问题，包括任务的重跑、kill和补数据等操作。

MaxCompute（原ODPS）开发入门指南——数据开发工具篇

5.数据管理

在大数据开发套件中也提供了表级/字段级的数据血缘管理。同时提供整个组织级别的空间表权限管理，包括权限申请、授权和收回。

MaxCompute（原ODPS）开发入门指南——数据开发工具篇

详情可以进入了解大数据开发套件Data IDE！

MaxCompute Studio

不同于大数据开发套件Data IDE，MaxCompute Studio是阿里云数加MaxCompute提供的本地集成开发环境，MaxCompute Studio 基于 IntelliJ IDEA 平台提供了一套扩展插件，皆在提升MaxCompute 用户的开发体验，给到用户不同开发体验的多种选择。