Greenplum( 三 )

Map Reduce的功能整合到统一的数据处理框架中 。Greenplum中国公司拥有一支具备丰富行业经验的销售和技术团队 , 具备金融、电信、政府、网际网路等等行业的数据仓库项目行业经验 , 专注于推动Greenplum在数据仓库分析领域的套用 , 为客户实现投资回报、价值增长 。软体优势数据存储当今是个数据不断膨胀的时代 , 採取MPP架构的资料库系统可以对海量数据进行管理 。Greenplum支持50PB(1PB=1024TB)级海量数据的存储和处理 , Greenplum将来自不同源系统的、不同部门、不同平台的数据集成到资料库中集中存放 , 并且存放详尽历史的数据轨迹 , 业务用户不用再面对一个又一个信息孤岛 , 也不再困惑于不同版本数据导致的偏差 , 同时对于IT人员也降低管理维护工作的複杂度 。高并发随着商业智慧型在企业内的快速发展 , BI 用户对信息分析平台的访问频率和查询複杂度也快速提升 , 因此要求相应的资料库系统对高并发查询进行支持 。Greenplum利用强大并行处理能力提供并发支持 。Greenplum提供资源管理功能(workload managemnt)来管理资料库资源 , 利用资源伫列管理可实现按用户组的进行资源分配 , 如Session同时激活数、最大资源值等 。通过资源管理功能 , 可以按用户级别进行资源分配和管理用户SQL查询优先权别 , 同时也能防止低质量SQL(如没有条件的多表join等)对系统资源的消耗 。线性扩展Greenplum与其他分散式大数据产品如Yonghong Z-DataMart一样採用了通用的MPP并行处理架构 , 在MPP架构中增加节点就可以线性提高系统的存储容量和处理能力 。Greenplum在扩展节点时操作简单 , 在很短时间内就能完成数据的重新分布 。Greenplum线性扩展支持为数据分析系统将来的拓展给予了技术上的保障 , 用户可根据实施需要进行容量和性能的扩展 。高性价比Greenplum资料库软体系统节点基于业界各种开放式硬体平台 , 如SUN/HP/DELL等厂商的PC Server等 , 在普通的x86 Server上就能达到很高的性能 , 因此性价比很高 , 相比于其他封闭式数据仓库专用系统 , Greenplum每TB的投资是前者的1/5甚至更低 。同样 , Greenplum产品的维护成本相比同类厂商也低许多 。反应速度我们面对的是一个瞬息变化的市场 , 谁能首先感知到市场的需求和变化 , 就能在竞争中先行一步 , 获得主动权 , 在竞争中立于不败之地 。Greenplum通过準实时、实时的数据载入方式 , 实现数据仓库的实时更新 , 进而实现动态数据仓库(ADW) 。基于动态数据仓库 , 业务用户能对当前业务数据进行BI实时分析-“Just In Time BI” , 能够让企业敏锐感知市场的变化 , 加快决策支持反应速度 。高可用性Greenplum是高可用的系统 , 在已有案例中最多使用了96台机器的集群MPP环境 。除了硬体级的Raid技术外 , Greenplum还提供资料库层Mirror机制保护 , 即每个节点数据在另外的节点中同步镜像 , 单个节点的错误不影响整个系统的使用 。对于主节点 , Greenplum提供Master/Stand by机制进行主节点容错 , 当主节点发生错误时 , 可以切换到Stand by节点继续服务 。系统易用Greenplum产品是基于流行的PostgreSQL之上开发 , 几乎所有的