数据库大数据访问的常用解决方法

时间:14-07-10 栏目:大数据 作者:爱说云网 评论:0 点击: 1,149 次

1、对海量数据进行分区操作

对海量数据进行分区操作十分必要,例如针对按年份存取的数据,我们可以按年进行分区,不同的数据库有不同的分区方式,不过处理机制大体相同。例如SQL Server的数据库分区是将不同的数据存于不同的文件组下,而不同的文件组存于不同的磁盘分区下,这样将数据分散开,减小磁盘I/O,减小了系统负荷,而且还可以将日志,索引等放于不同的分区下。

2、建立广泛的索引

对海量的数据处理,对大表建立索引是必行的,建立索引要考虑到具体情况,例如针对大表的分组、排序等字段,都要建立相应索引,一般还可以建立复合索引,对 经常插入的表则建立索引时要小心,笔者在处理数据时,曾经在一个ETL流程中,当插入表时,首先删除索引,然后插入完毕,建立索引,并实施聚合操作,聚合 完成后,再次插入前还是删除索引,所以索引要用到好的时机,索引的填充因子和聚集、非聚集索引都要考虑。

3、加大虚拟内存

如果系统资源有限,内存提示不足,则可以靠增加虚拟内存来解决。笔者在实际项目中曾经遇到针对18亿条的数据进行处理,内存为1GB,1个P4 2.4G的CPU,对这么大的数据量进行聚合操作是有问题的,提示内存不足,那么采用了加大虚拟内存的方法来解决,在6块磁盘分区上分别建立了6个 4096M的磁盘分区,用于虚拟内存,这样虚拟的内存则增加为 4096*6 + 1024 = 25600 M,解决了数据处理中的内存不足问题。

4、分批处理

海量数据处理难因为数据量大,那么解决海量数据处理难的问题其中一个技巧是减少数据量。可以对海量数据分批处理,然后处理后的数据再进行合并操作,这样逐 个击破,有利于小数据量的处理,不至于面对大数据量带来的问题,不过这种方法也要因时因势进行,如果不允许拆分数据,还需要另想办法。不过一般的数据按 天、按月、按年等存储的,都可以采用先分后合的方法,对数据进行分开处理。

5、使用数据仓库和多维数据库存储

数据量加大是一定要考虑OLAP的,传统的报表可能5、6个小时出来结果,而基于Cube的查询可能只需要几分钟,因此处理海量数据的利器是OLAP多维分析,即建立数据仓库,建立多维数据集,基于多维数据集进行报表展现和数据挖掘等。

6、负载均衡技术

负载均衡集群是由一组相互独立的计算机系统构成,通过常规网络或专用网络进行连接,由路由器衔接在一起,各节点相互协作、共同负载、均衡压力,对客户端来说,整个群集可以视为一台具有超高性能的独立服务器。

实现数据库的负载均衡技术,首先要有一个可以控制连接数据库的控制端。在这里,它截断了数据库和程序的直接连接,由所有的程序来访问这个中间层,然后再由中间层来访问数据库。这样,我们就可以具体控制访问某个数据库了,然后还可以根据数据库的当前负载采取有效的均衡策略,来调整每次连接到哪个数据库。

相关文章

Big Data大数据正在改变生活.创造新生意...
views 1322
从个人电脑发明、网际网路到云端,电脑科技和人们的关系愈来愈紧密,每隔三、五年就会出现新概念,并且期待带来新商机。2012年开始,「Big Data」正成为这个备受瞩目的新概念、新机会。Big Data称为大数据、海量资料或巨量资料,其重要性不在于数据资料有多少,而是人们如何应用软硬体,从各种数据中找...
大数据处理
views 1397
java.util.BitSet可以按位存储。 计算机中一个字节(byte)占8位(bit),我们java中数据至少按字节存储的, 比如一个int占4个字节。 如果遇到大的数据量,这样必然会需要很大存储空间和内存。 如何减少数据占用存储空间和内存可以用算法解决。 java.util.BitSet就提...
大数据与大健康会擦出什么火花?
views 1231
用“黑匣子”表述大数据意义的理论非常形象——问题从一个端口进去,中间是一个集合成千上万数据的“黑匣子”,经过一番计算机工程“提纯”、“钻取”后,有用的信息从另一个端口出去。毫无疑问的是,博云网表示,当大健康穿过大数据这个“黑匣子”,便兼具了“打破传统”和“智慧未来”的巨大推力。两者结合产生出最闪耀的...
国务院推六项政策扶持小微企业
views 1258
国务院总理李克强9月17日主持召开国务院常务会议,部署进一步扶持小微企业发展推动大众创业万众创新,决定全面建立临时救助制度、为困难群众兜底线救急难。  李克强说,今年经济下行压力依然很大,特别是七八月份以来增速放缓,但就业仍然实现了稳定增长。他说,“这里既有服务业增长的因素,但更重要的,还是通过改革...
列举不适合大数据处理的10件事情-
views 1803
许多企业领导人开始接纳大数据处理并期待神奇和奇迹,但却发现大数据带来新的复杂性——且从中获益所需要付出的努力要预计中的多得多。   每个组织机构都对大数据应用寄予厚望,期待它可以解答长期存在的业务问题,让他们在市场集中镇南关,在产品、服务交付中更具竞争力。这种对于大数据获益的预期很难实现,除非给...
云计算大数据联手PE资本 最佳投资时机来临...
views 1251
  5月20日-23日,第六届云计算大会在北京举行。大会上,中国电子学会与北京藏山资本投资有限公司共同发起成立“中国云计算、大数据产业发展基金”。藏山资本作为中国电子学会在云计算、大数据方面唯一的资本合作方,基金一期规模2亿元人民币,主要投资于国内云计算、大数据等产业领域的成长型优秀企业。   行业...
大数据挖掘带动的变迁
views 1125
自大数据进入了人们的视线之后,它便逐渐成为人们普遍关注的焦点。大数据讲的是PB时代的科学,本质上大数据的挑战是PB时代的对科学的挑战,更是对包括数据挖掘在内的认知科学的挑战。那么,大数据时代怎么做数据挖掘呢?   在现今时代人们通常所说的大数据主要包括三个来源:第一是自然界大数据,也就是地球上的自然...
无处不在的大数据
views 1278
大数据正把我们变成新的物种。首先,大数据改变了我们的思维方式,让我们从因果关系的串联思维变成了相关关系的并联思维。第二,大数据改变了我们的生产方式,物质产品的生产退居次位,信息产品的加工将成为主要的生产活动。第三,大数据改变了我们的生活方式,我们的精神世界和物质世界都将构建在大数据之上。大数据不仅仅...

声明: 本文由( 爱说云网 )原创编译,转载请保留链接: 数据库大数据访问的常用解决方法

数据库大数据访问的常用解决方法:等您坐沙发呢!

发表评论


读者排行