如何结合大数据与云计算

时间:15-01-25 栏目:大数据 作者:爱说云网 评论:0 点击: 2,905 次

你如何在大数据的海洋寻宝?对于那些拥有庞大信息需要处理的企业,在数据分析之前要克服的第一个障碍就是--不能够定位到相关并且有意义的信息。这也是HGST遇到的问题,HGST(日立环球存储科技公司)是一个计算机硬件的主要生产厂商,他们现在迫切需要追踪在生产设施上收集到的数据。据HGST的云计算与高性能解决方案主管David Hinz介绍,找到所需要的数据来评估生产过程是一个漫长或者说是不可能完成的任务。

“我们不能确定它在哪里,谁拥有它,以及如何得到它,”Hinz说,“对于HGST,我们想改善性能使其能够及时得到数据,并使团队能够快速找到它。然后,我们就可以回过头来开始分析并找出相关见解,来帮助我们改进制造工艺,改善客户响应,并帮助产品推广。”通过在云端集中和精简数据,数据检索用户能够在几分钟之内找到想要的信息而不是几周。事实证明这家公司在云端设立Hive数据仓库是明智的选择。

如何结合大数据云计算

如今的数据绝大多数是非结构化的,而且大多数这类数据都是用户生成的。AWS的大数据及高可用性高级经理Ben Butler发表评论说:“现在生成数据更加容易,并且成本更低。然而它却把压力推给了生命周期的其余部分:收集和存储、分析和计算,从而能够搞清楚这些快速增长的数据的意义。”

如今,拥有PB数量级数据,并且一直包含流媒体的大企业已经不足为奇。可用信息的爆炸性增长意味着在可以被收集和高速分析的数据之间存在差距将越来越大。 “关于大数据,你拥有的数据量,种类,以及增长速率都要求新的工具,”Butler说,“在云端,我们组合不同的计算,网络以及存储工具,你可以用来解决这些问题。”

解锁大数据的秘密

云计算提供的弹性和按需配置,为让企业组织能够试验和尝试解决大数据的新方法提供了核心力量。企业可以根据供应的基础设施,用不同的迭代方式尝试和操纵他们的数据。基础设施不再限制用什么来处理数据。这些相同的灵活性使企业即使有高可变负载的情况下也不会超支。

根据需要可扩展性还可以减少数据处理的等待时间,这样对资源的争用就会更少。获得无限制的资源可以让企业在使用AWS解决方案时做出更好的决策。例如,把EMR或其他解决方案植入Kinesis后台,接近实时的分析可以在几秒之内,通过把可视化的结果传递给BI系统展示出来。

大数据处理是一个挑战,对于这些数据,如果没有强有力的硬件做支撑处理,对其进行有意义的分析几乎是不可能的。但幸运的是,云计算爆炸和弹性使用处理的能力意味着小型企业组织现在可以完成曾经只有大企业才能完成的任务。云计算已经使大数据更易于管理,而且还可以对这些数据做更多,更快的分析。随着大数据还在不断变大,更大的云计算将在那里等待处理。

相关文章

专访携程大数据平台高级经理李亚锋:大数据技术融合下的Spark更具魅力...
views 1641
随着移动互联时代的到来,人们的双手得到解放,因为通过智能手机APP和触摸屏就可以彻底解决交互性和易用性的问题,这也使用户行为数据呈现爆炸性增长。大数据技术可以帮助我们对海量的数据进行加工分析,了解用户的行为特征,以及他们对服务的期待,从而使用户得到更好的服务体验。 Hadoop 和Spark都是大家...
百度实时计算平台的实现和应用
views 1814
百度实时计算平台的实现和应用     “大数据”在互联网行业中已是普遍现象,一家公司每天累积的用户行为数据甚至已不能用TB来衡量。海量数据对实时分析和计算提出了更高的要求,实时处理程序必须确保在严格的时间内响应,通常以秒为单位,甚至是毫秒。传统的批量计算模型已无法满足这些要...
谷歌技术”三宝”之MapReduce — 大数据云计算时代...
views 3718
江湖传说永流传:谷歌技术有"三宝",GFS、MapReduce和大表(BigTable)! 谷歌在03到06年间连续发表了三篇很有影响力的文章,分别是03年SOSP的GFS,04年OSDI的MapReduce,和06年OSDI的BigTable。SOSP和OSDI都是操作系统领域的顶级会议,在计算机...
机器学习的9个基础概念和10种基本算法总结-...
views 1955
1.基础概念:   (1) 10折交叉验证:英文名是10-fold cross-validation,用来测试算法的准确性。是常用的测试方法。将数据集分成10份。轮流将其中的9份作为训练数据,1分作为测试数据,进行试验。每次试验都会得出相应的正确率(或差错率)。10次的结果的正确率(或差错率)的平均...
网易大数据平台的Spark技术实践-技术方案...
views 1437
网易的实时计算需求 对于大多数的大数据而言,实时性是其所应具备的重要属性,信息的到达和获取应满足实时性的要求,而信息的价值需在其到达那刻展现才能利益最大化,例如电商网站,网站推荐系统期望能实时根据顾客的点击行为分析其购买意愿,做到精准营销。 实时计算指针对只读(Read On...
大数据与网络黑产
views 3038
随着互联网不断深度介入人们的生活,网络上也在源源不断积累起大量数据。这些数据就像散落在互联网生态中的粒粒珍珠,诱惑着网络黑产分子瞪大贪婪的双眼,伺机而动…… 记者调查发现,基于这些存在的产业链,上游,是以技术含量最高的职业黑客为主,他们通过挖掘漏洞、编写木马实施入侵,获取数据;中游,是购买这些数据...
百度大数据洞察:“数”说年轻女性的自我世界-应用案例...
views 1721
  百度大数据带您透视小世界里的大女人精神。小世界指的是新一代年轻女性的自我世界,寓意每一个小小的我都是一个世界;大女人寓意新一代年轻女性脱离集体意识形态,不再完全秉承传统女性小鸟依人式的附属与顺从,而体现为一种独立自主的精神、一种大女人的情怀。   新一代年轻女性自我意识崛起下的3个需求层次  ...
大数据时代的危害性与局限性
views 2992
2月3日消息,白宫去年曾发表书面声明称,“大数据将作为历史性的驱动因素,帮助美国持久性地促进社会与经济活力”,其创造的社会价值与经济价值得以遵从该国提倡的“隐私、公正、平等、自主”。然而事实真的如此吗?大数据时代的危害性与局限性又是否会赶超其效益性? 某知名评论人表示,白宫这一努力平衡大数据成...

声明: 本文由( 爱说云网 )原创编译,转载请保留链接: 如何结合大数据与云计算

如何结合大数据与云计算:等您坐沙发呢!

发表评论


读者排行