Linux服务器CPU使用率多少算合理

ruiruining2010 2014-10-22 09:52:51
组里的一个Linux项目,后台有6个服务,分布在6台刀片机上,其中一个服务用于进行计算,CPU使用率较高。
刀片机有24个核心,每个核是24GHz,有128G内存。

计算服务有5个线程,其中3个线程CPU使用率基本上不会超过1%,但另外两个线程CPU的使用率较高,平均大概50%和30%的样子。峰值能够达到100%。

我一直认为这样的分布不合理,我的想法是拆分CPU使用率过高的线程,将负载分布到多个线程上,才能更充分利用服务器,毕竟有24个核……

另外我一直觉得CPU就是用来计算的,不到1%的使用率完全就是浪费了服务器的性能,不如把多个服务合并到一台刀片机上,现在是每个服务一台刀片机……

请问更为合理的分布应该是怎样的,每个线程的CPU利用率多少才算合理?
...全文
2899 13 打赏 收藏 转发到动态 举报
写回复
用AI写文章
13 条回复
切换为时间正序
请发表友善的回复…
发表回复
williamhong 2014-11-15
  • 打赏
  • 举报
回复
cpu load达到最高代表着处理新的请求的能力下降了,理论上刚好不达到最高时的利用率最好,但很难保证
二进制脑袋 2014-11-13
  • 打赏
  • 举报
回复
个人看法:从楼主的回帖上看,其实是有分析、有想法的人。在楼主不能提供给大家更细节的基础上,估计网友并不能给出很有针对性的解决建议,倒是8楼、10楼的一些原则楼主注意一下就可以了。
ruiruining2010 2014-11-13
  • 打赏
  • 举报
回复
引用 8 楼 Cody2k3 的回复:
个人浅见, 楼主的想法大方向是正确的 cpu的load一般是按照同时就绪的task数目来衡量, 如果单个cpu load过高, 说明这个cpu一直需要处理计算任务 这时,进行业务分离, 提高并行度是自然的也是正确的想法,一般来说,系统在N个cpu的情况下,load=N 是满载 不过cpu load并不是唯一的指标, 比如楼主还应该关心: 出于什么原因这两类不相关业务在单个线程中运行,也许是因为两类数据之间存在顺序的问题,所以单线程可以保证不乱序 cpu load低的服务是否存在内存和IO的限制,其业务流量是否平稳,是否存在峰值时服务质量保证 如果用户数据响应慢, 需要看瓶颈是在cpu还是memory还是IO 是否可以用多台server做load balance 诸如此类,需要全面考虑,仅供楼主参考
这个原因的话……我也不知道,我接触到这个项目的时候已经是这样子了…… 我看下来,两类数据不存在顺序问题…… 另外我个人觉得,当网卡数据量特别大的时候,单线程的计算速度如果低于流入的数据速度,那势必导致数据的累积,线程肯定会一直处于计算状态。 多线程将计算压力分摊,如果计算线程的处理速度之和高于网卡流入速度,那势必会比单线程速度快。不是么?
ljc007 2014-10-29
  • 打赏
  • 举报
回复
引用
不如把多个服务合并到一台刀片机上,现在是每个服务一台刀片机
古人教育我们:不要把所有的鸡蛋放到同一个篮子里面。
fly 100% 2014-10-27
  • 打赏
  • 举报
回复
一般10以下
Cody2k3 2014-10-26
  • 打赏
  • 举报
回复
个人浅见, 楼主的想法大方向是正确的 cpu的load一般是按照同时就绪的task数目来衡量, 如果单个cpu load过高, 说明这个cpu一直需要处理计算任务 这时,进行业务分离, 提高并行度是自然的也是正确的想法,一般来说,系统在N个cpu的情况下,load=N 是满载 不过cpu load并不是唯一的指标, 比如楼主还应该关心: 出于什么原因这两类不相关业务在单个线程中运行,也许是因为两类数据之间存在顺序的问题,所以单线程可以保证不乱序 cpu load低的服务是否存在内存和IO的限制,其业务流量是否平稳,是否存在峰值时服务质量保证 如果用户数据响应慢, 需要看瓶颈是在cpu还是memory还是IO 是否可以用多台server做load balance 诸如此类,需要全面考虑,仅供楼主参考
  • 打赏
  • 举报
回复
引用 6 楼 ruiruining2010 的回复:
具体的细节我也不好说………… 但是现在已经影响到客户端使用了。 每逢CPU高的时候,原本正常的数据就无法到达客户端了。 可以想象,数据源中有两类数据,A类数据只需进行简单的处理就要送达客户端,B类数据需要执行复杂的计算才能送到客户端。这两类数据的数据量相当。 现在A类和B类数据在一条线程中计算,每逢流入服务器的数据量特别大的时候,就会严重影响A类数据的传输。
It still doesn't sound like a cpu issue. Have you check your network traffic and your bandwidth?
ruiruining2010 2014-10-22
  • 打赏
  • 举报
回复
具体的细节我也不好说………… 但是现在已经影响到客户端使用了。 每逢CPU高的时候,原本正常的数据就无法到达客户端了。 可以想象,数据源中有两类数据,A类数据只需进行简单的处理就要送达客户端,B类数据需要执行复杂的计算才能送到客户端。这两类数据的数据量相当。 现在A类和B类数据在一条线程中计算,每逢流入服务器的数据量特别大的时候,就会严重影响A类数据的传输。
  • 打赏
  • 举报
回复
引用 4 楼 ruiruining2010 的回复:
[quote=引用 3 楼 micropentium6 的回复:] [quote=引用 2 楼 ruiruining2010 的回复:] [quote=引用 1 楼 micropentium6 的回复:] there is no golden rule for cpu load... the question is: can you break down the algorithm in a way that can take advantage of concurrency? another mistake we usually made: we try to be outsmart of OS... just my 2 cents!
由于某些历史原因吧,CPU使用率最高的线程中融合了对多类信息的处理,而这些信息的处理实际上没有相互关系的…… 所以说,并不是因为算法原因导致的CPU较高。[/quote] If it's not computation extensive, do you think it's possible the real bottleneck is on i/o? when you say cpu is busy, what was it doing?[/quote] CPU最高的时候的确也是接收数据最多的时候,但数据的接收是在另外的线程中。 CPU使用率最高的线程对这些接收到的数据进行分析,但这些数据是从属不同类别的, 不同类别之间是没有关系的。 现在的情况是所有的数据在这一条线程中进行计算。 所以我的想法是把这些类别根据计算的复杂度分配到多个线程中[/quote] u don't want to discuss details here. So, I guess what you try to say is: any individual processing won't trigger high cpu usage, but if they all add up together, boom! See, I still suggest leaving them as they are if your blade server can still handle them...
ruiruining2010 2014-10-22
  • 打赏
  • 举报
回复
引用 3 楼 micropentium6 的回复:
[quote=引用 2 楼 ruiruining2010 的回复:] [quote=引用 1 楼 micropentium6 的回复:] there is no golden rule for cpu load... the question is: can you break down the algorithm in a way that can take advantage of concurrency? another mistake we usually made: we try to be outsmart of OS... just my 2 cents!
由于某些历史原因吧,CPU使用率最高的线程中融合了对多类信息的处理,而这些信息的处理实际上没有相互关系的…… 所以说,并不是因为算法原因导致的CPU较高。[/quote] If it's not computation extensive, do you think it's possible the real bottleneck is on i/o? when you say cpu is busy, what was it doing?[/quote] CPU最高的时候的确也是接收数据最多的时候,但数据的接收是在另外的线程中。 CPU使用率最高的线程对这些接收到的数据进行分析,但这些数据是从属不同类别的, 不同类别之间是没有关系的。 现在的情况是所有的数据在这一条线程中进行计算。 所以我的想法是把这些类别根据计算的复杂度分配到多个线程中
  • 打赏
  • 举报
回复
引用 2 楼 ruiruining2010 的回复:
[quote=引用 1 楼 micropentium6 的回复:] there is no golden rule for cpu load... the question is: can you break down the algorithm in a way that can take advantage of concurrency? another mistake we usually made: we try to be outsmart of OS... just my 2 cents!
由于某些历史原因吧,CPU使用率最高的线程中融合了对多类信息的处理,而这些信息的处理实际上没有相互关系的…… 所以说,并不是因为算法原因导致的CPU较高。[/quote] If it's not computation extensive, do you think it's possible the real bottleneck is on i/o? when you say cpu is busy, what was it doing?
ruiruining2010 2014-10-22
  • 打赏
  • 举报
回复
引用 1 楼 micropentium6 的回复:
there is no golden rule for cpu load... the question is: can you break down the algorithm in a way that can take advantage of concurrency? another mistake we usually made: we try to be outsmart of OS... just my 2 cents!
由于某些历史原因吧,CPU使用率最高的线程中融合了对多类信息的处理,而这些信息的处理实际上没有相互关系的…… 所以说,并不是因为算法原因导致的CPU较高。
  • 打赏
  • 举报
回复
there is no golden rule for cpu load... the question is: can you break down the algorithm in a way that can take advantage of concurrency? another mistake we usually made: we try to be outsmart of OS... just my 2 cents!
通过性能监控工具nmon的学习,清楚的了解Linux服务器资源CPU、磁盘、内存、网络、进程之间的关联,了解nmon监控结果的字段的含义以及影响,更重要的是通过熟悉监控结果中字段数据的由来,理清性能测试的分析思路,学会性能测试的分析方法。 课程内容:第一章:课程简介课程介绍课程大纲第二章:nmon介绍nmon简介nmon下载nmon安装nmon屏幕统计-交互模式nmon数据统计-数据收集模式nmon进程关闭nmon分析工具nmon数据文件解析第三章:nmon数据分析SYS_SUMM【系统资源汇总】AAA【服务器基本信息】BBBP【Linux执行的命令和结果】CPU_ALL【所有CPU数据的概述】CPU_SUMM【每个CPU的整体占用情况】CPU001【CPU001的每个时间点占用情况】DISK_SUMM【磁盘的吞吐量和IOPS】DISKBSIZE【磁盘块信息】DISKBUSY【磁盘的繁忙情况】DISKREAD【磁盘的读取操作速率】DISKXFER【磁盘的I/0传输速率】JFSFILE【JFS文件空间使用百分比】MEM【内存】VM【虚拟内存】NET【网络数据传输速率】NETPACKET【网络数据包】PROC【进程】TOP【PID进程相关的CPU/内存等】 课程提供的下载资料:包含通过nmon收集的Linux服务器资源信息ecs-lc_220715_1019.nmon文件,大家在没有Linux服务器的情况下,可以通过对这个文件进行nmon数据解析和数据分析的学习。 

23,121

社区成员

发帖
与我相关
我的任务
社区描述
Linux/Unix社区 应用程序开发区
社区管理员
  • 应用程序开发区社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧