Linux服务器CPU使用率多少算合理

ruiruining2010 2014-10-22 09:52:51

组里的一个Linux项目，后台有6个服务，分布在6台刀片机上，其中一个服务用于进行计算，CPU使用率较高。
刀片机有24个核心，每个核是24GHz，有128G内存。

计算服务有5个线程，其中3个线程CPU使用率基本上不会超过1%，但另外两个线程CPU的使用率较高，平均大概50%和30%的样子。峰值能够达到100%。

我一直认为这样的分布不合理，我的想法是拆分CPU使用率过高的线程，将负载分布到多个线程上，才能更充分利用服务器，毕竟有24个核……

另外我一直觉得CPU就是用来计算的，不到1%的使用率完全就是浪费了服务器的性能，不如把多个服务合并到一台刀片机上，现在是每个服务一台刀片机……

请问更为合理的分布应该是怎样的，每个线程的CPU利用率多少才算合理？

...全文

3042 13 打赏收藏转发到动态举报

写回复

用AI写文章

13 条回复

切换为时间正序

请发表友善的回复…

发表回复

williamhong 2014-11-15

打赏
举报

cpu load达到最高代表着处理新的请求的能力下降了，理论上刚好不达到最高时的利用率最好，但很难保证

二进制脑袋 2014-11-13

打赏
举报

个人看法：从楼主的回帖上看，其实是有分析、有想法的人。在楼主不能提供给大家更细节的基础上，估计网友并不能给出很有针对性的解决建议，倒是8楼、10楼的一些原则楼主注意一下就可以了。

ruiruining2010 2014-11-13

打赏
举报

引用 8 楼 Cody2k3 的回复:

个人浅见，楼主的想法大方向是正确的 cpu的load一般是按照同时就绪的task数目来衡量，如果单个cpu load过高，说明这个cpu一直需要处理计算任务这时，进行业务分离，提高并行度是自然的也是正确的想法，一般来说，系统在N个cpu的情况下，load=N 是满载不过cpu load并不是唯一的指标，比如楼主还应该关心：出于什么原因这两类不相关业务在单个线程中运行，也许是因为两类数据之间存在顺序的问题，所以单线程可以保证不乱序 cpu load低的服务是否存在内存和IO的限制，其业务流量是否平稳，是否存在峰值时服务质量保证如果用户数据响应慢，需要看瓶颈是在cpu还是memory还是IO 是否可以用多台server做load balance 诸如此类，需要全面考虑，仅供楼主参考

这个原因的话……我也不知道，我接触到这个项目的时候已经是这样子了…… 我看下来，两类数据不存在顺序问题…… 另外我个人觉得，当网卡数据量特别大的时候，单线程的计算速度如果低于流入的数据速度，那势必导致数据的累积，线程肯定会一直处于计算状态。多线程将计算压力分摊，如果计算线程的处理速度之和高于网卡流入速度，那势必会比单线程速度快。不是么？

ljc007 2014-10-29

打赏
举报

引用

不如把多个服务合并到一台刀片机上，现在是每个服务一台刀片机

古人教育我们：不要把所有的鸡蛋放到同一个篮子里面。

fly 100% 2014-10-27

打赏
举报

一般10以下

Cody2k3 2014-10-26

打赏
举报

个人浅见，楼主的想法大方向是正确的 cpu的load一般是按照同时就绪的task数目来衡量，如果单个cpu load过高，说明这个cpu一直需要处理计算任务这时，进行业务分离，提高并行度是自然的也是正确的想法，一般来说，系统在N个cpu的情况下，load=N 是满载不过cpu load并不是唯一的指标，比如楼主还应该关心：出于什么原因这两类不相关业务在单个线程中运行，也许是因为两类数据之间存在顺序的问题，所以单线程可以保证不乱序 cpu load低的服务是否存在内存和IO的限制，其业务流量是否平稳，是否存在峰值时服务质量保证如果用户数据响应慢，需要看瓶颈是在cpu还是memory还是IO 是否可以用多台server做load balance 诸如此类，需要全面考虑，仅供楼主参考

小笨和漂向北方 2014-10-22

打赏
举报

引用 6 楼 ruiruining2010 的回复:

具体的细节我也不好说………… 但是现在已经影响到客户端使用了。每逢CPU高的时候，原本正常的数据就无法到达客户端了。可以想象，数据源中有两类数据，A类数据只需进行简单的处理就要送达客户端，B类数据需要执行复杂的计算才能送到客户端。这两类数据的数据量相当。现在A类和B类数据在一条线程中计算，每逢流入服务器的数据量特别大的时候，就会严重影响A类数据的传输。

It still doesn't sound like a cpu issue. Have you check your network traffic and your bandwidth?

ruiruining2010 2014-10-22

打赏
举报

具体的细节我也不好说………… 但是现在已经影响到客户端使用了。每逢CPU高的时候，原本正常的数据就无法到达客户端了。可以想象，数据源中有两类数据，A类数据只需进行简单的处理就要送达客户端，B类数据需要执行复杂的计算才能送到客户端。这两类数据的数据量相当。现在A类和B类数据在一条线程中计算，每逢流入服务器的数据量特别大的时候，就会严重影响A类数据的传输。

小笨和漂向北方 2014-10-22

打赏
举报

引用 4 楼 ruiruining2010 的回复:

[quote=引用 3 楼 micropentium6 的回复:] [quote=引用 2 楼 ruiruining2010 的回复:] [quote=引用 1 楼 micropentium6 的回复:] there is no golden rule for cpu load... the question is: can you break down the algorithm in a way that can take advantage of concurrency? another mistake we usually made: we try to be outsmart of OS... just my 2 cents!

由于某些历史原因吧，CPU使用率最高的线程中融合了对多类信息的处理，而这些信息的处理实际上没有相互关系的…… 所以说，并不是因为算法原因导致的CPU较高。[/quote] If it's not computation extensive, do you think it's possible the real bottleneck is on i/o? when you say cpu is busy, what was it doing?[/quote] CPU最高的时候的确也是接收数据最多的时候，但数据的接收是在另外的线程中。 CPU使用率最高的线程对这些接收到的数据进行分析，但这些数据是从属不同类别的，不同类别之间是没有关系的。现在的情况是所有的数据在这一条线程中进行计算。所以我的想法是把这些类别根据计算的复杂度分配到多个线程中[/quote] u don't want to discuss details here. So, I guess what you try to say is: any individual processing won't trigger high cpu usage, but if they all add up together, boom! See, I still suggest leaving them as they are if your blade server can still handle them...

ruiruining2010 2014-10-22

打赏
举报

引用 3 楼 micropentium6 的回复:

[quote=引用 2 楼 ruiruining2010 的回复:] [quote=引用 1 楼 micropentium6 的回复:] there is no golden rule for cpu load... the question is: can you break down the algorithm in a way that can take advantage of concurrency? another mistake we usually made: we try to be outsmart of OS... just my 2 cents!

小笨和漂向北方 2014-10-22

打赏
举报

引用 2 楼 ruiruining2010 的回复:

[quote=引用 1 楼 micropentium6 的回复:] there is no golden rule for cpu load... the question is: can you break down the algorithm in a way that can take advantage of concurrency? another mistake we usually made: we try to be outsmart of OS... just my 2 cents!

ruiruining2010 2014-10-22

打赏
举报

引用 1 楼 micropentium6 的回复:

there is no golden rule for cpu load... the question is: can you break down the algorithm in a way that can take advantage of concurrency? another mistake we usually made: we try to be outsmart of OS... just my 2 cents!

由于某些历史原因吧，CPU使用率最高的线程中融合了对多类信息的处理，而这些信息的处理实际上没有相互关系的…… 所以说，并不是因为算法原因导致的CPU较高。

小笨和漂向北方 2014-10-22

打赏
举报

there is no golden rule for cpu load... the question is: can you break down the algorithm in a way that can take advantage of concurrency? another mistake we usually made: we try to be outsmart of OS... just my 2 cents!