如何结合大数据与云计算

时间:15-01-25 栏目:大数据 作者:爱说云网 评论:0 点击: 2,599 次

你如何在大数据的海洋寻宝?对于那些拥有庞大信息需要处理的企业,在数据分析之前要克服的第一个障碍就是--不能够定位到相关并且有意义的信息。这也是HGST遇到的问题,HGST(日立环球存储科技公司)是一个计算机硬件的主要生产厂商,他们现在迫切需要追踪在生产设施上收集到的数据。据HGST的云计算与高性能解决方案主管David Hinz介绍,找到所需要的数据来评估生产过程是一个漫长或者说是不可能完成的任务。

“我们不能确定它在哪里,谁拥有它,以及如何得到它,”Hinz说,“对于HGST,我们想改善性能使其能够及时得到数据,并使团队能够快速找到它。然后,我们就可以回过头来开始分析并找出相关见解,来帮助我们改进制造工艺,改善客户响应,并帮助产品推广。”通过在云端集中和精简数据,数据检索用户能够在几分钟之内找到想要的信息而不是几周。事实证明这家公司在云端设立Hive数据仓库是明智的选择。

如何结合大数据云计算

如今的数据绝大多数是非结构化的,而且大多数这类数据都是用户生成的。AWS的大数据及高可用性高级经理Ben Butler发表评论说:“现在生成数据更加容易,并且成本更低。然而它却把压力推给了生命周期的其余部分:收集和存储、分析和计算,从而能够搞清楚这些快速增长的数据的意义。”

如今,拥有PB数量级数据,并且一直包含流媒体的大企业已经不足为奇。可用信息的爆炸性增长意味着在可以被收集和高速分析的数据之间存在差距将越来越大。 “关于大数据,你拥有的数据量,种类,以及增长速率都要求新的工具,”Butler说,“在云端,我们组合不同的计算,网络以及存储工具,你可以用来解决这些问题。”

解锁大数据的秘密

云计算提供的弹性和按需配置,为让企业组织能够试验和尝试解决大数据的新方法提供了核心力量。企业可以根据供应的基础设施,用不同的迭代方式尝试和操纵他们的数据。基础设施不再限制用什么来处理数据。这些相同的灵活性使企业即使有高可变负载的情况下也不会超支。

根据需要可扩展性还可以减少数据处理的等待时间,这样对资源的争用就会更少。获得无限制的资源可以让企业在使用AWS解决方案时做出更好的决策。例如,把EMR或其他解决方案植入Kinesis后台,接近实时的分析可以在几秒之内,通过把可视化的结果传递给BI系统展示出来。

大数据处理是一个挑战,对于这些数据,如果没有强有力的硬件做支撑处理,对其进行有意义的分析几乎是不可能的。但幸运的是,云计算爆炸和弹性使用处理的能力意味着小型企业组织现在可以完成曾经只有大企业才能完成的任务。云计算已经使大数据更易于管理,而且还可以对这些数据做更多,更快的分析。随着大数据还在不断变大,更大的云计算将在那里等待处理。

相关文章

云计算背景下的大数据时代来临
views 1564
数据中心正在成为新时代的“信息电厂”,成为知识经济的基础设施。过去一年,“大数据”正在成为一个热门话题。 半个世纪信息技术的发展,主要解决的是云计算中“结构性”数据的存储、处理与应用。“结构性”数据的特征有如你到银行去存取款,银行的计算机系统记录着你的名字,在名字之后是你存取款的数量、时间、类型等信...
《机器学习实战》作者Peter Harrington:如何成为一位数据科学家-技术方案...
views 1943
 现如今,人们的生活无外乎就是这个样子的,早上被闹钟准时叫醒,醒来后喝杯现泡的咖啡、吃上一片现烤的面包片,然后乘坐交通工具去上班。通常在上班的路上还要堵车一小会儿。   虽然生活的每一天都在重复,但却总不是一成不变的。随着物联网技术的不断成熟,越来越多的无生命物体开始变得更加智能。它们通过传感器、...
42页PPT干货!R在行动广告大数据的应用-技术方案...
views 1210
网易的实时计算需求 对于大多数的大数据而言,实时性是其所应具备的重要属性,信息的到达和获取应满足实时性的要求,而信息的价值需在其到达那刻展现才能利益最大化,例如电商网站,网站推荐系统期望能实时根据顾客的点击行为分析其购买意愿,做到精准营销。 实时计算指针对只读(Read On...
阿里云计算推全新大数据工具“采云间”...
views 1591
25日,阿里云计算发布大数据工具采云间——基于ODPS的简易工具解决方案。利用采云间,中小型公司不用再购买上百万元的商业智能(BI)软件,大大降低大数据分析的门槛。   采云间是一个Web端的在线工具,简称DPC(Data Process Center),内部集成了阿里数据开发者套件和商业智能套件...
Google后Hadoop时代的新“三驾马车”——Caffeine、Pregel、Dremel...
views 1742
Google在2003年到2004年公布了关于GFS、 MapReduce和BigTable三篇技术论文,这也成为后来云计算发展的重要基石,如今Google在后Hadoop时代的新“三驾马车”—— Caffeine、Pregel、Dremel再一次影响着全球大数据技术的发展潮流。 Mike Ols...
百度实时计算平台的实现和应用
views 1580
百度实时计算平台的实现和应用     “大数据”在互联网行业中已是普遍现象,一家公司每天累积的用户行为数据甚至已不能用TB来衡量。海量数据对实时分析和计算提出了更高的要求,实时处理程序必须确保在严格的时间内响应,通常以秒为单位,甚至是毫秒。传统的批量计算模型已无法满足这些要...
大数据平台核心竞争力:业务敏捷性,实时性,性能 – hadoop技术学习 (欢迎关注同名...
views 1869
最近在考虑新一年的架构的时候,我就在想一个大数据平台核心竞争力到底是什么?每个平台发展的阶段可能不太一样,所以所需要的核心竞争力不同。但是做架构,做设计的朋友一定要常常思考下你负责的平台到底核心竞争力是什么。 我们现在做的平台不是自用的,是销售给第三方。我觉得排在前三核心竞争力分别是:   1、业务...
移动互联时代CFO变身记
views 1813
美国零售巨头Target在邮件中向一位中学女生推荐孕婴用品及其优惠券,被其父亲强烈质疑与抗议,在获得道歉后,父亲却发现女儿真的怀孕了。Target这个广为流传的故事,被认为是其在大数据营销等方面精密的探索。 不过在客户身上搜集信息用于营销决策,也可能存在数据安全的风险。2014年1月,Target公...

声明: 本文由( 爱说云网 )原创编译,转载请保留链接: 如何结合大数据与云计算

如何结合大数据与云计算:等您坐沙发呢!

发表评论


读者排行