笔新阁

笔新阁>离语言文字 > 第323章 焯(第1页)

第323章 焯(第1页)

etl是企业数据仓库构建过程中的一个核心步骤y我们可以借助于etl

工具来高效地完成数据抽取转换和加载工作之所以需要etl工具y

主要有以下几个原因x

?

1?当数据来自不同的物理主机y这时候如果使用sql语句去处理的

话y就显得比较吃力且开销也更大]

?

2?数据来源可以是各种不同的数据库或者文件y这时候需要先把它

们整理成统一的格式后才可以进行数据的处理y这一过程用代码实现

显然有些麻烦]

?

3?在数据库中我们当然可以使用存储过程去处理数据y但是y处理

海量数据的时候y存储过程显然比较吃力y而且会占用较多数据库的

资源y这可能会导致数据库资源不足y进而影响数据库的性能。

在选择etl工具时主要考虑如下因素x

?对平台的支持程度]

?抽取和装载的性能是不是较高y且对业务系统的性能影响大不

大,高不高]。

?对数据源的支持程度]。

?是否具有良好的集成性和开放性]。

?数据转换和加工的功能。

?是否具有管理和调度的功能。

cdc解决方案包括变化捕捉代理变化数据服务和变化分发机制三个

组成部分

?

1?变化捕捉代理变化捕捉代理是一个软件组件y它负责确定和捕

捉发生在操作型数据存储源系统中的数据变化可以对变化捕捉代理

进行专门优化y使它适用于特定的源系统y比如使用数据库触发器]

也可以使用通用的方法y比如数据日志比较。

变化数据服务变化数据服务为变化数据捕捉的成功实现提供了

一系列重要的功能y包括过滤排序附加数据生命周期管理和审

计等表6-4给出了每个功能的解释。

变化分发机制变化分发机制负责把变化分发到变化的消费者?通

常是etl程序?那里变化分发机制可以支持一个或多个消费者y并且提

供了灵活的数据分发方式y包括推(push)或拉(pull)的方式pull方式需要

消费者周期性地发送请求y通常采用标准接口实现y比如odbc或jdbc

push方式需要消费者一直监听和等待变化的发生y一旦捕捉到变化y就立

刻转移变化的数据y通常采用消息中间件来实现变化分发机制的另一个

重要功能就是提供动态返回和请求旧的变化的能力y从而满足重复处理和

恢复处理等任务。

变化数据捕捉技术有两个典型的应用场景x面向批处理的cdc

请勿开启浏览器阅读模式,否则将导致章节内容缺失及无法阅读下一章。

相邻推荐:在捉鬼中收获老攻  作大死者不拘小节  协议离婚后我自由了  断袖小秀才【CP完结】  潜滋慢长[ABO]【CP完结】  晴空下的我们GL  新婚夜被抄家?医妃搬空全京城  你丫是大爷!  与九个美女荒岛求生的日子  全网黑后我在军旅综艺杀疯了  中二病  湮梦【CP完结】  完美白月光的必备素养(快穿)  奶味儿小暴龙  纸上谈罪之翎雀谈  母亲1.0之时代起源  数码宝贝物语驯兽师时代  噬天珠  哥哥他顶不住娇软宝贝的露骨蜜语  职粉就业指南【CP完结】  

已完结热门小说推荐

最新标签