请问大神们，我这里怎么设置才能让task数增加？或者还有其他的解决方案吗？

z630860668 2017-03-25 12:06:32

1000万的数据没问题，4000千万就会报这个错，我推测是内存不足导致的，所以我想把这里的任务数增加些，可是怎么设置参数都是1
sql内容如下
select telBF,telDF,sum(duration),count(id),sum(case when type=\"主叫\" then 1 else 0 end),sum(case when type=\"被叫\" then 1 else 0 end) ,max(tel_date),min(tel_date) from tel_rel group by telBF,telDF

或者还有其他方案吗？求大神们帮帮忙，困扰我好久了这个问题

这个是1000万数据任务成功执行的截图

...全文

142 2 打赏收藏转发到动态举报

写回复

2 条回复

切换为时间正序

请发表友善的回复…

发表回复

java8964 2017-03-26

打赏
举报

回复

change the "spark.sql.shuffle.partitions" to 800 (which is 200 * (4000 / 1000)) For Spark 2.x spark.conf.set("spark.sql.shuffle.partitions", 800) Or Spark 1.x sc.getConf.set("spark.sql.shuffle.partitions", 800)

LinkSe7en 2017-03-25

打赏
举报

回复

Stage下Task数表明操作的RDD/Dataset(Frame)的分区数。在执行SQL查询前先对Dataset(Frame)进行重新分区（reparation）。可以选择重新分区为Executor个数整数倍且大于200的分区数

200个C# Winform程序代码，学会你就是大神 200个C# Winform程序代码，学会你就是大神 200个C# Winform程序代码，学会你就是大神

该代码是一个工程，可以直接打开运行，内含全部源码，无Bug，使用IntraFace算法。

一、本文将解决什么问题? 本文将解决:在主线程绑定了数据源的前提下，工作线程改变数据源，数据源无法及时更新的问题。二、问题是如何出现的？ UI控件属于UI线程。所有的绑定关系，是没办法穿透线程的。所以，在子线程中改变数据源的步骤，必须要‘回到UI线程’来进行。当然，这与要避免在UI线程里进行耗时操作的理念并不冲突。我们只在改变数据时回UI线程，切记。 ...

声明：本教程借鉴了网上诸多大神的教程，由于······确实借鉴太多了，以至于都忘了有些在哪找到的，所以就暂时不列举了（基本都是CSDN上的），不过，在这里我仍然要表达一下对各位前辈的感谢。本教程仅基于win10系统、VScode1.49.2版本以及gcc9.2.0版本MinGW编译器，如遇不兼容情况，请自行寻找其他教程进行解决。本教程中所提供的中文编码问题解决方案并非完美，若有其他需要或要求，可能导致乱码问题，届时请自行寻找其他教程。如本教程有谬误之处，欢迎各位前来指正！ 1、Visual Studi

声明：本教程借鉴了网上诸多大神的教程，由于······确实借鉴太多了，以至于都忘了有些在哪找到的，所以就暂时不列举了（基本都是CSDN上的），不过，在这里我仍然要表达一下对各位前辈的感谢。本教程仅基于win10系统、VScode1.49.2版本以及gcc9.2.0版本MinGW编译器，如遇不兼容情况，请自行寻找其他教程进行解决。本教程中所提供的中文编码问题解决方案并非完美，若有其他需要或要求，可能...

1,273

社区成员

1,171

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章