CSDN论坛 > .NET技术 > C#

急!请问如何处理大数据量的数据采集及同步。 [问题点数:100分,结帖人xiaohei]

Bbs2
本版专家分:234
结帖率 100%
CSDN今日推荐
Bbs5
本版专家分:4742
Bbs5
本版专家分:4742
Bbs4
本版专家分:1653
Bbs5
本版专家分:3338
匿名用户不能发表回复!
其他相关推荐
springmvc 针对大数据量操作数据库 优化
20151014_针对大数据量的数据库操作问题 转至元数据结尾 由 胡明伟创建并最终修改于 十月 18, 2015 转至元数据起始   程序针对处理大数据量的问题,通常需要对代码进行优化后进行操作,切不可同步循环逐一针对每条记录的数据单独操作数据库,这样不仅很浪费资源,导致系统效率慢,还有可能导致其他问题的出现。  
oracle 处理大数据量问题
1. 采用高速的存储设备,提高读写能力,如:EMC 和NetApp,   2. 假如tab1表中的没有数据的话  DROP   TABLE   TAB1; CREATE   TABLE   TAB1   AS   SELECT   *   FROM   TAB2; 然后在创建索引   3. 用Hint 提示减少操作时间     INSERT   /*+Append*/   INT
如何处理大数据量的查询
在实际的任何一个系统中,查询都是必不可少的一个功能,而查询设计的好坏又影响到系统的响应时间和性能这两个关键指标,尤其是当数据量变得越来越大时,于是如何处理大数据量的查询成了每个系统架构设计时都必须面对的问题。本文将从数据及数据查询的特点分析出发,结合讨论现有各种解决方案的优缺点及其适用范围,来阐述J2EE平台下如何进行查询框架的设计。Value List Handler模式及其局限性在J2EE应用
Hibernate大数据量处理,大量数据处理代码优化方法概念(转载)
1) 在处理大数据量时,会有大量的数据缓冲保存在Session的一级缓存中,这缓存大太时会严重显示性能,所以在使用Hibernate处理大数据量的,可以使用session.clear()或者session. Evict(Object) 在处理过程中,清除全部的缓存或者清除某个对象。  2) 对大数据量查询时,慎用list()或者iterator()返回查询结果,  1. 使用List()返回结
项目开发中,大数据量的增删改查的若干解决方法
近期,一直在做一个基于SSH2框架的ERP项目,也算得上是自己的处女作,趁晚上有时间,分享一下。       自从有了SSH等这样的框架之后,越来越多的java开发人员喜欢使用框架来做开发,其中hibernate便是最经常被用到的框架之一,有了它,可以让开发人员省去很多气力写琐屑的代码段,用JDBC去做数库中的CRUD操作,当项目很小,数据量不大时候,还可以接受,当数据量了上10万级别,很多时候
大数据量的五种处理方式
 http://www.51projob.com/a/bishimianshi/hailiangshuju/2012/0322/111.html 处理海量数据问题,无非就是: 分而治之/hash映射 + hash统计 + 堆/快速/归并排序; Bloom filter/Bitmap;Trie树/数据库/倒排索引;外排序;分布式处理之hadoop/mapreduce。
大数据量、高并发量网站解决方案
一个小型的网站,可以使用最简单的html静态页面就实现了,配合一些图片达到美化效果,所有的页面均存放在一个目录下,这样的网站对系统架构、性能的要求都很简单。随着互联网业务的不断丰富,网站相关的技术经过这些年的发展,已经细分到很细的方方面面,尤其对于大型网站来说,所采用的技术更是涉及面非常广,从硬件到软件、编程语言、数据库、WebServer、防火墙等各个领域都有了很高的要
大数据技术-数据采集-Flume.logstash等
随着大数据越来越被重视,数据采集的挑战变的尤为突出。今天为大家介绍几款数据采集平台: Apache Flume Fluentd Logstash Chukwa Scribe Splunk Forwarder 大数据平台与数据采集 任何完整的大数据平台,一般包括以下的几个过程: 数据采集-->数据存储-->数据处理-->数据展现(可视化,报表和监控) 其中,数据采集是
大数据量快速处理的架构设计
在业务数据的处理过程中,经常会遇到夜间批次处理大量的数据,而且会有时效的要求。特别是当应用系统跑了2年以上时,就会有大表或者特大表的操作了,数据量达到百万甚至上亿。 这时回顾前期的设计,就会发现好多问题。 可能是数据模型设计的时候没有考虑表的分区和及时归档、sql的设计没有考虑索引或全表扫描、数据的处理没有考虑及时的分批切分、并发处理的多线程可配置化等等, 为了以后的设计不要走相同的错路。这里暂时
Java 大型系统高并发大数据的处理方式
页面静态化 (页面层面的缓存) 缓存 (memcached、redis等,数据缓存、避免多次请求) 集群负载均衡(单机处理能力不足) 分库分表(大量数据的处理、原则分、分、分) 读写分离 队列、MQ、数据库增加加锁(防止并发) 存储(IO最耗性能) 小型机(提交硬件性能,呵呵) ..... 等待再补充 数据库层面: 当数据增加到100万以上,那么,MySQL的效能急剧下降
关闭