数据库大数据访问的常用解决方法

时间:14-07-10 栏目:大数据作者:爱说云网评论:0 点击: 1,698 次

本文标签：大数据

1、对海量数据进行分区操作

对海量数据进行分区操作十分必要，例如针对按年份存取的数据，我们可以按年进行分区，不同的数据库有不同的分区方式，不过处理机制大体相同。例如SQL Server的数据库分区是将不同的数据存于不同的文件组下，而不同的文件组存于不同的磁盘分区下，这样将数据分散开，减小磁盘I/O，减小了系统负荷，而且还可以将日志，索引等放于不同的分区下。

2、建立广泛的索引

对海量的数据处理，对大表建立索引是必行的，建立索引要考虑到具体情况，例如针对大表的分组、排序等字段，都要建立相应索引，一般还可以建立复合索引，对经常插入的表则建立索引时要小心，笔者在处理数据时，曾经在一个ETL流程中，当插入表时，首先删除索引，然后插入完毕，建立索引，并实施聚合操作，聚合完成后，再次插入前还是删除索引，所以索引要用到好的时机，索引的填充因子和聚集、非聚集索引都要考虑。

3、加大虚拟内存

如果系统资源有限，内存提示不足，则可以靠增加虚拟内存来解决。笔者在实际项目中曾经遇到针对18亿条的数据进行处理，内存为1GB，1个P4 2.4G的CPU，对这么大的数据量进行聚合操作是有问题的，提示内存不足，那么采用了加大虚拟内存的方法来解决，在6块磁盘分区上分别建立了6个 4096M的磁盘分区，用于虚拟内存，这样虚拟的内存则增加为 4096*6 + 1024 = 25600 M，解决了数据处理中的内存不足问题。

4、分批处理

海量数据处理难因为数据量大，那么解决海量数据处理难的问题其中一个技巧是减少数据量。可以对海量数据分批处理，然后处理后的数据再进行合并操作，这样逐个击破，有利于小数据量的处理，不至于面对大数据量带来的问题，不过这种方法也要因时因势进行，如果不允许拆分数据，还需要另想办法。不过一般的数据按天、按月、按年等存储的，都可以采用先分后合的方法，对数据进行分开处理。

5、使用数据仓库和多维数据库存储

数据量加大是一定要考虑OLAP的，传统的报表可能5、6个小时出来结果，而基于Cube的查询可能只需要几分钟，因此处理海量数据的利器是OLAP多维分析，即建立数据仓库，建立多维数据集，基于多维数据集进行报表展现和数据挖掘等。

6、负载均衡技术

负载均衡集群是由一组相互独立的计算机系统构成，通过常规网络或专用网络进行连接，由路由器衔接在一起，各节点相互协作、共同负载、均衡压力，对客户端来说，整个群集可以视为一台具有超高性能的独立服务器。

实现数据库的负载均衡技术，首先要有一个可以控制连接数据库的控制端。在这里，它截断了数据库和程序的直接连接，由所有的程序来访问这个中间层，然后再由中间层来访问数据库。这样，我们就可以具体控制访问某个数据库了，然后还可以根据数据库的当前负载采取有效的均衡策略，来调整每次连接到哪个数据库。

云计算、大数据、物联网发展趋势

　1.个人和企业等将在技术上花费21000亿美元　　更多　　信息产业的研究报告　　2014-2018年版信息产业园区定位规划及招商策略2008-2009年中国信息产业发展研究年度总报告2008-2009年中国台湾地区信息产业发展研究年度2008-2009年欧盟信息产业发展研究年度报告2008...

运营商如何玩转大数据

　　如果说大数据在之前仅仅是人们口头上热炒的一个词的话，今年春节时央视《晚间新闻》启用百度地图定位可视化大数据播报的春节人口迁徙新闻，随后“百度迁徙”的上线通过春运线路、热门迁移城市等海量数据在线服务为“大数据”上演的一幕幕生动情景剧，则形象地说明了大数据走入各行各业的现实。　　在盘活大数据价值...

云计算遭遇大数据碰撞出技术革命

前两天有人在微博发问，用什么样的方式讲述大数据和云计算才能非专业人士听的更清楚，其实关于大数据的案例有很多，商业智能分析也多次提到过关于数据挖掘的价值和意义，只不过在今天看数据比以前还多而已，大数据并不可怕，可怕的是他的实时分析能力，会让缺点和真相赤裸裸暴露在人们面前，那么当云计算遭遇大数据一股脑向...

大数据 | 零售店铺十二大数据分析指标...

零售店铺一天生意的好坏，如何提升，要掌握分析好十二大数据指标。一、营业额（1）营业额反映了店铺的生意走势。针对以往销售数据，结合地区行业的发展状况，通过对营业额的每天定期跟进，每周总结比较，以此来调整促销及推广活动。（2）为店铺及员工设立销售目标。根据营业额数...

云计算大数据联手PE资本最佳投资时机来临...

　　5月20日-23日，第六届云计算大会在北京举行。大会上，中国电子学会与北京藏山资本投资有限公司共同发起成立“中国云计算、大数据产业发展基金”。藏山资本作为中国电子学会在云计算、大数据方面唯一的资本合作方，基金一期规模2亿元人民币，主要投资于国内云计算、大数据等产业领域的成长型优秀企业。　　行业...

工信部：推云计算、大数据、移动互联促中小企业信息化-搜狐财经...

工信部总工程师朱宏任周一表示，今年将大力推进云计算、大数据、移动互联等新信息技术的应用，促进中小企业信息化。　　朱宏任是在今日举行的2014中小企业信息化服务发布会作上述表示的。他还表示要组织实施中小企业两化融合能力提升行相关公司股票走势动和中小企业信息化推进工程，健全和完善中...

开源云平台 CloudStack 4.1.0 安装详解 – 5、基本资源域...

CloudStack拥有强大的硬件管理能力，可以把企业的内部硬件资源统一管理起来，虚拟化为一个硬件资源池，实现按需分配。 CloudStack对硬件资源的管理功能全部放在“基础架构”菜单下。登录后，选择左侧导航上的“基础架构”–>区域–>添加区域。区域是CloudStack中最大的范...

为什么中小企业更应采用云计算

　　据国外媒体报道，云计算为各种规模企业带来业务成本方面的降低，云计算提供的优势对于刚成立的小公司尤其明显。可以总结出八条原因，证明小公司更加适合采用云计算。 1.规模效益：大公司的规模效益很明显，小公司通常资源有限，任何能够节约采购预算的方案都应被优先考虑。 2.企业级功能：大公司通...

声明: 本文由( 爱说云网 )原创编译，转载请保留链接: 数据库大数据访问的常用解决方法