Hadoop十大应用领域--从互联网行业到传统行业

【Hadoop十大应用领域--从互联网行业到传统行业】本文整理自:
中文版参考自:
谈到应用,如果仅将目光集中在为搜索引擎提供动力或者为广告服提供用户行为分析的平台上,那么显然有所局限 。本文提供了搜索和广告分析以外的10个应用领域,和在这些领域中通过使用而获得成功的多家创新型企业 。也许相比互联网巨头并不知名,但却代表了的生命力——在行业端商务领域的新拓展方向 。
图1.1 的12个应用领域
最近,在最新版本的发布会上,COO Kirk Dunn和业内一些专家指出了在不同领域的应用案例 。这与我近些年来关注的方向相同 。为此,特别总结出在线旅游、移动数据、电子商务、能源发现、能源节省、基础设施管理、图像处理、欺诈检测、IT安全和医疗保健这十个领域,这其中,几乎每个领域都有我曾采访过的创新企业 。当然,我也相信,在这些企业之外,还有更多的应用空间等待挖掘 。
1. 在线旅游( ) 。Dunn表示,目前的架构正在为80%左右的全球在线旅游预定服务 。尽管其并没有提及这些客户的名字,但是去年的时候我曾对应用了的一家企业 做了采访 。CEO当时表示,受益于架构,他们极为轻松地实现了诸多的数据分析工作,并在其中得出“MAC用户比用户愿意支付20美元的成本来预订酒店”,这样的影响范围很广的调查结论 。当然,在他看来,本身并不能带来如此的神奇效应,但是其可以帮助发现以前从来没有发现的数据点,进而使分析和挖掘成为了可能 。
2. 移动数据( data) 。这是Dunn的另一项“匿名”统计,为“70%美国智能手机”提供服务 。我认为他谈论的是通过无线方式存储和处理移动数据,以及有关市场份额的数学可以帮助他们锁定客户 。
3. 电子商务(E-) 。Dunn所谈的第三个市场是美国超过10,000,000家网上商店 。Dunn说一家大型零售商(我认为说的是eBay,作为一个主要的用户并且成功经营着大型零售卖场来帮助数百万商人销售)在使用了后仅90天内就增加了3%的净利润 。
4. 能源发现( ) 。在的圆桌会议上,来自行业的一位代表解释了为什么他们选择了:我们采用来对数据进行排序和整理,而这些数据全部来自从海洋深处地震时产生的数据,而其背后有可能意味着石油储量 。
5. 能源节省( ) 。与 目标截然相反,使用来提升电力服务,尽量为用户节省在资源方面的投入 。一个代表小组注意到,某些特定功能,如精确并长期的费用预测如果没有几乎很难完成 。据了解,现在管理着30TB的信息,其中包括来自5000万用户(横跨60个公共事业部)能源数据,气象与人口方面的公共及私人数据,历史信息,地理数据及其他 。这些都是通过超过20个MySQL数据库和一个集群来存储和处理的 。
6. 基础设施管理( ) 。这是一个比较常见的应用方向,实际上,随着更多的公司(Esty,我最近采访过)从服务器、交换机及其他IT设备商收集并分析数据,更有市场 。在发布会中,代表指出他们公司收集设备日志(现在已经超过1PB的容量了),并将它们存储在中 。事实上,Esty是专门从事国产与复古商品的电子商务网站,现在已经超过110万的用户,250万的独立访问量和11亿的页面浏览量 。举个例子,通过管理和分析的集群数据已经到了每天1TB的量级 。Esty每晚都要在以为基础的亚马逊云计算平台上运行数十种工作流程 。根据一些详细技术报告,其运行差不多5000job是在2011年5月份来分析来自内部运行数据和外部活动数据如用户行为变化 。
7. 图像处理(Image ) 。一家创业型企业,利用来存储和处理高来自卫星捕捉的高分辨率图像,并尝试将这些信息及图像与地理格局的变化相对应 。延伸阅读:新投7000万美元在云中处理图像