etl入门基础知识
基础知识包括技术、理论
技术方面:需要学习使用数据源、目标端工具的基本使用(如 oracle MySQL hive等);需要学习etl工具的安装配置常用错误解决(如 kettle DataStage infa sqoop datax等)
理论方面:懂得数仓分层架构,维度建模等。
从ETL的字面来看,它主要包含三大阶段,分别是数据抽取、数据转换、数据加载。
ETL包含的主要内容
数据抽取:
数据清洗:
数据转换:
数据加载:
五、 ETL & ELT
六、ETL开发介绍
七、 常见的ETL流程模板
1) Koala:
2) Delta Merge:
3) Sync:
、 简介
ETL即Extract(抽取)、Transform(转换)、Load(装载);
抽取是将数据从各种原始的业务系统中读取出来,这是所有工作的前提

