服务器高负荷与寿命、故障率之间有什么关系?

RSYFZX 2017-12-18 11:59:21
如题,服务器长期高负荷运行和服务器的整体寿命之间有没有什么关系?有没有一些公式?粗略的,估算形式的都可以,和故障率之间有没有什么关系?另外如果服务器供电端增加测量设备,监测电流、电压、无功、谐波突变有没有什么数值分析之类的公式,谢谢!
...全文
1036 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
wx3387 2018-07-14
  • 打赏
  • 举报
回复
如果是IDC,新式的模块都配有监测系统的,公式包在软件里面。如果是小公司,单台服务器也没必要监测,不放心可以买个在线稳压电源
服务器故障处理方法探讨 作者:深圳市环球数码科技有限公司 陈武亭 从2002年上海国内第一套数字放映设备投入商业使用以来,国内已经有超过35000套数字放映设备在影院使用。十几年来业内同仁写了很多数字放映设备使用维护方面的文章,却很少有讨论服务器故障处理方法的,本文将以GDC服务器为例,抛砖引玉,与广大业内同仁共同探讨数字电影服务器故障处理方法。 声画不流畅、放映中途停止是影片放映中出现比较多的故障现象,放映机及还音系统因素导致的故障不在本文讨论之列,本文仅探讨服务器因素导致的此类故障及其检查方法,下面我们先了解一下数字电影服务器的工作原理和流程。 数字电影服务器的放映管理系统(SMS)在安全管理器的监管下将存储在存储系统中的加密内容(DCP)提取到媒体处理系统,进行解密、解码等处理,产生无压缩的重建图像、声音和字幕,并输出至数字放映机和声频处理器而实现电影的放映。 服务器故障处理方法全文共12页,当前为第1页。影片放映时,数字电影服务器是在数据的提供、传输和处理的整个过程中依次读取、传送和处理一帧帧图像和音频数据的。在此过程中,服务器的硬盘和阵列的性能、数据传输的通道、媒体模块和CPU的温度以及所存储的内容数据的完整性,都有可能导致放映不流畅或中途停止。 服务器故障处理方法全文共12页,当前为第1页。 就以处理数据量最大的视频来说,服务器是依次从存储系统中读取图像数据,并将数据传送给媒体模块进行处理。在这个过程中如果某一帧图像数据出现错误,服务器会花费更多的时间尝试纠错,当超过一定时间时,服务器将放弃此帧数据,进行后续帧的数据读取和处理。一部普通2D影片有十几万帧的图像数据,只要不是连续的多帧数据出现问题,我们从影片放映的效果上是感觉不到问题的,只有连续的帧在数据处理时出现问题时,才会看到放映不流畅的现象;如果问题严重时,则会出现放映中途停止或死机。 首先我们从节目源开始讨论,DCP打包前出现的问题不在本文讨论范围内,因此通常需要注意的是服务器内所存储内容数据的完整性。此类问题一般为DCP载入服务器过程中产生,现象为服务器只在放映某部影片时出现异常,放映其他影片正常,且出现问题时均在同一时间点,那极大可能是存储系统中的DCP数据有问题,此时只需对DCP进行完整性验证即可确认。 服务器故障处理方法全文共12页,当前为第2页。如果可以排除内容数据完整性问题,且故障出现随机,则应考虑是否因为服务器的RAID降级或硬盘性能不佳所导致的故障。造成RAID降级的因素有很多,数字电影服务器均采用RAID5技术保证存储系统的容错性与可靠性,具有数据安全、读写速度快、空间利用率高等优点;但不足之处是如果1个磁盘出现故障以后,整个系统的性能将大大降低,在修复完成前出现放映不流畅或中途停止的几率大大增加。因此当数字电影服务器的RAID存储系统出现故障时应尽快恢复,避免因存储系统的性能降低而出现放映故障。 服务器故障处理方法全文共12页,当前为第2页。 服务器出现RAID降级等问题时,开机都会有信息警示,只是现实中有相当一部分放映员对此视若无睹,直到放映出现异常了,才去查看处理。及早地处理,不仅可以避免放映事故,还可降低硬盘硬件损坏更换的几率。图一为GDC服务器开机时报告的RAID警示信息,见到此警示需要及时进行查看和修复服务器阵列。我们也可以通过菜单查看服务器的RAID状态,比如GDC服务器可以直接在控制面板中查看,例如图二中显示的RAID状态为降级(Degrade)。 服务器故障处理方法全文共12页,当前为第3页。 图一 服务器故障处理方法全文共12页,当前为第3页。 图二 接下来我们再讨论硬盘性能不佳或损坏的问题。 硬盘在环境温度为5 -60 的设计使用寿命为5年,实际上其使用寿命一般低于5年。而且随着开机时间的增加(与每天使用硬盘的时间有关)、硬盘内部温度的升高(与硬盘外部的热负荷以及硬盘自身产生的热量有关),硬盘的年故障率会有所提高。有研究表明当硬盘外壳的温度由30oC(接近室温)上升至70oC时,年故障率上升至约3.4 倍(由0.21%上升至0.71%)。 服务器故障处理方法全文共12页,当前为第4页。除此之外,异常地中断磁盘的读写、物理撞击和剧烈振动等因素,也都可能导致硬盘性能降低或损坏,严重的硬盘错误甚至可能导致服务器无法开启。因此,严格地遵循数字放映设备操作使用规范操作使用设备是确保设备正常运行的重要条件。 服务器故障处理方法全文共12页,当前为第4页。 数字电影服务器都会提供硬盘读写性能检测的功能,例如GDC服务器,可以进入控制面板(Admin panel)——存储系统管理(Storage System Management)——存储效率(Storage performance)(见图三和图四)进行硬盘和阵列的读写性能测试,从而

1,092

社区成员

发帖
与我相关
我的任务
社区描述
云计算服务器、网络、虚拟化相关讨论
社区管理员
  • 服务器
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧