社区
C#
帖子详情
我有一个集合,里面数据在10万条左右
低调点没事
2020-12-16 11:35:24
我现在需要对这些数据做一次数据验证。
所以我需要请求一个接口,接口是第三方提供的,接口响应时间在2s左右。
那么我要处理这批数据,我怎么样能尽快完成呢?
能想到就是用Task,进行多任务操作,但有点想不通该控制用多少个Task.
...全文
387
6
打赏
收藏
我有一个集合,里面数据在10万条左右
我现在需要对这些数据做一次数据验证。 所以我需要请求一个接口,接口是第三方提供的,接口响应时间在2s左右。 那么我要处理这批数据,我怎么样能尽快完成呢? 能想到就是用Task,进行多任务操作,但有点想不通该控制用多少个Task.
复制链接
扫一扫
分享
转发到动态
举报
AI
作业
写回复
配置赞助广告
用AI写文章
6 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
wanghui0380
2020-12-16
打赏
举报
回复
数据验证看对方的,不看你的。 看对方接口允许你是一条一条,还是一批一批。 看对方允许你的访问频次和数据大小。 假设你1条1条提交,假设你的网络够快,你一次并行提交1w,对方扛得住,有啥问题?? 对于你来说,我们考虑得根本就不是啥task,我们考虑的是池。不管你的机器,还是他的机器。只要任何一方都扛不住,那就修改池大小
glb21
2020-12-16
打赏
举报
回复
让对方开放数据库接口,你使用多线程并发,能快不少。
wanghui0380
2020-12-16
打赏
举报
回复
你这个主要是IO密集。 3个因素 1.内存io:你自己的内存是否扛得住,扛不住需要池化 2.网络io:网络上行速率,你最大上行就那么大,你在并行也还只有那么大,并且并行过多会网络拥堵会产生超时,所以还是池化httpclient,当然net现在自己有个httclientfactory是自己池化的 3.对方处理能力,他处理不了你过多的请求,你并行发在多也木用。反而容易造成对方宕机或者惩罚性限流 4.异常处置,网络IO总会有异常的,所以你的重试策略(比如指数退避重试),熔断策略,注意在有大规模异常重试的情况下不要在继续往上堆请求,那样做只会加大撕扯“伤口” 总体上我们需要的是个池
低调点没事
2020-12-16
打赏
举报
回复
引用 2 楼 正怒月神 的回复:
你拿到数据,需要2s,然后目前自己处理数据需要多少s?
目前只是取出数据了,代码现在只有主线程,计算下时间也要两天。 太慢了太慢了,而且每天都要跑一遍 就想着优化的,能想到的就是Task.。。上面回复告诉我要好像不是那么回事。。。 目前用了Parallel.Foeach。。。集合拆成了每次200条。。。不知道时间快不快。我先去测试下看看。
低调点没事
2020-12-16
打赏
举报
回复
谢谢。看样子想差了。。
正怒月神
2020-12-16
打赏
举报
回复
你拿到数据,需要2s,然后目前自己处理数据需要多少s?
面试系列 | 文件里存储了
10
亿条销量
数据
, 如何找出前
10
00大的
数据
?
题目: 我有
一个
文件,
里面
存储了
10
亿个商品销量
数据
, 如何找出前
10
00大的
数据
? 分析: 第一种最容易想到的方法是将
数据
全部排序,在排序后的
集合
中进行查找,最快的排序算法的时间复杂度一般为O(nlogn),如快速排序。但是在32位的机器上,每个float类型占4个字节,
10
亿个浮点数就要占用400MB的存储空间,对于一些可用内存小于400M的计算机而言,很显然是不能一次将全部
数据
...
后端一次给你
10
万条
数据
,如何优雅展示,面试官到底考察我什么?
背景 面试题:后台传给前端十
万条
数据
,你作为前端如何渲染到页面上? 回答者A:我有句话不知当讲不当讲,这什么鬼需求。 回答者B:滚,后端,我不要这样的
数据
,你就不能分页给我吗。 回答C:
10
万条
数据
这怎么展示,展示了也看不完啊。 分析: 面试官既然能这么问,我们从技术的角度出发,探索一下这道题,上手操作了一下: function loadAll(response) { var html = ""; for (var i = 0; i <
10
0000; i++) {
mysql查询
集合
中的特定
数据
_快速查询List中指定的
数据
时间:2017/5/15作者:李国君题目:快速查询List中指定的
数据
背景:当List中保存了大量的
数据
时,用传统的方法去遍历指定的
数据
肯定会效率低下,有
一个
方法就是类似于
数据
库查询那样,根据索引直接提取
数据
。项目中遇到的软件卡顿的现象,其中一部分原因是因为
数据
量大的原因,所以有必要提高
数据
查询的速度。这里先展示一下模拟的的方法:假设List
集合
中有500000个点,每个点都有他的属性值xInde...
Python 爬虫 | 获取
集合
竞价
数据
本想着直接对结果进行筛选,选出时间为9:25的分时
数据
就好了,结果居然有意外,有些个股的竞价
数据
不是在9:25整的,这也简单处理,直接选取9:30前最后
一个
的分时
数据
(东财的分时
数据
没有9:25-9:30的
数据
)Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。以002175为例(随便点到的,不要以为我在推荐喔):东财的
集合
竞价的
数据
为9:25的分时
数据
(一开始我以为是9:30前的
数据
相加。
使用 HashMap 存一
万条
数据
,构造时传
10
000 还会触发扩容吗?
问题 向 HashMap 中存
10
000 条
数据
,初始化时,构造方法传值
10
000,会触发扩容吗? Map<String,String> map = new HashMap<>(
10
000); 分析 乍一看 肯定会触发扩容呀,因为 HashMap 中有个负载因子默认为 0.75,就是说存储的数量超过容量的 75% 就会触发扩容,put 到后 25% 的
数据
时,肯定就会触发扩容。但事实真是这样吗?源码中有我们想知道的一切,真相只有
一个
。 分析源码 HashMap 的初始化
C#
111,093
社区成员
642,554
社区内容
发帖
与我相关
我的任务
C#
.NET技术 C#
复制链接
扫一扫
分享
社区描述
.NET技术 C#
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
让您成为最强悍的C#开发者
试试用AI创作助手写篇文章吧
+ 用AI写文章