DMETL(达梦数据交换平台)是武汉达梦数据库股份有限公司自主研发的一站式数据集成与处理平台,融合传统ETL功能与分布式大数据技术,支持异构数据源的全量/增量同步、复杂清洗转换及高效装载。
数据源 | 支持版本 | 连接方式 |
---|---|---|
达梦数据库 | DM7、DM8、DMDSC、DPC | 原生JDBC/ODBC |
Oracle | 9i/10g/11g/12c/19c | JDBC/ODBC |
MySQL | 5.5/5.6/5.7/8.0 | JDBC |
SQL Server | 2008/2012/2014/2016/2019 | JDBC/ODBC |
PostgreSQL | 9.x/10.x/11.x/12.x/13.x | JDBC |
DB2 | 9.7/10.5/11.1 | JDBC/ODBC |
Sybase | ASE 15/16 | JDBC |
国产数据库 | 人大金仓(Kingbase)、神通(Osbase)、南大通用(Gbase)等 | JDBC/ODBC |
组件 | 功能 |
---|---|
管理器 | 统一管理数据源、工程、调度任务 |
调度器 | 控制任务执行时序,支持Cron表达式定时触发 |
执行器 | 分布式节点并行处理数据(集群模式下可水平扩展) |
元数据库 | 存储流程配置信息,支持内置Derby或外置数据库(如DM8/Oracle) |
主要是将不同来源的各种数据,经过数据清洗的转换后变为统一格式存储的过程。这个场景主要是由于数据量大,数据种类丰富,且由于不同来源的数据质量和格式的不同导致数据的不一致性等问题,则需要适用dmetl来进行处理。
dmetl支持多节点共享元数据库,即可以统一监控管理各个执行器节点,方便对于转换过程的监控;并且支持远程的启停升级,提高了项目实施部署的运维效率;全面的数据源支持,支持各种主流的数据库。
对于一些业务场景中可能存在数据交换,数据交换一般是指跨部门、跨地域的数据共享和业务协同等涉及多个部门的数据处理,那么在这样复杂的数据交换场景下,部门与部门之间的联系有可能因为地域部门不同导致数据库的格式、版本等不同,所以需要dmetl来进行统一的监控管理数据源和数据交换节点。
数据迁移和同步主要涉及到了新老版本的的系统升级的时候出现的问题,需要一次性以及周期性的将数据源从源数据库到目的数据库中,需要通过两步:1.通过全量抽取数据加载到中间库中。2.用过增量抽取模块再将数据放到目的库中。
使用ETL主要也分为三个数据库
一般来说我们讲源库和中间库可以放到一个服务器中,但目的库和etl工具要放一起,一般放到本机能直接连接的服务器上,因为在linux上的dmetl的客户端工具在使用的过程中很有可能出现断连的情况,以及操作不便,所以一般在配置规则的时候最好在windows上进行配置。
--查看dm数据库服务
ps -ef | grep dmser
--查看dmetl服务
ps -ef | grep dmetl
--复制文件
cp a.txt /home/b.txt
--ssh连接服务器
ssh root@服务器地址 -Y //-X是图形化开启
--移动文件/重命名
mv a.txt /home/b.txt
首先导入影子表——配置列映射——修改需要修改的域数据格式——映射输出到目的表 总体完成增量转换后放如到作业汇总中进行SQL语句生成,将中间库的增量数据映射到目的库中 配置验证方法 连接测试在DMETL设计器中右键数据源 → 测试连接,提示“成功”即配置有效。 数据预览双击数据源 → 选择表 → 预览数据,确认字段映射正确。
文章
阅读量
获赞