服务宕掉无法解决求助

qq_35309582 2018-11-21 06:48:14
最近生产上有个系统服务进程总是会莫名其妙的消失。
监控了各种日志,没有发现oom kill,或者outofmemory等情况的。
求各路大神指教!
服务器情况:
1.做了RW的负载均衡,共2台服务器
2.做了集群部署,2台服务器共用一个weblogic域。
3.每台服务器都启动了4个进程。

问题描述:
1.进程消失发生的时间是在业务高发时期,服务器上4个进程中,只死掉1个进程,而且每次都是同一个。
2.根据日志记录,每次消失之前都在做数据的excel导出操作,但是不是每次导出都会挂掉。
3.导出的实现方法也询问了公司的各位大牛,都看不出有什么问题。

以下是服务挂掉之前的日志片段


[GC 1074337K->242500K(2599936K), 0.0116850 secs]
2018-11-21 16:44:05,553 [[ACTIVE] ExecuteThread: '2' for queue: 'weblogic.kernel.Default (self-tuning)' - ynbtG09SRvDF] INFO c.h.s.c.ScubeClientCaller - 远程服务请求完成 >>> RequestId:[rpc-2cb09f91-72e1-4c42-9b94-0ab623ea972b], 服务:[com.huateng.nbms.htes.api.busi.service.ExtIDpcQueryService->queryAmountForExport], 耗时: 704 ms
16:44:06.180 INFO 193 receive - ShcpeMQClient->receive QUEUE_TYPE = RQ_600_NAME...
16:44:06.180 DEBUG 254 receive - [_DMQS] Use existing consumer for destination QOUT.M388100000.000 selector
[GC 306622K->242703K(2601472K), 0.0082280 secs]
[Full GC 242703K->216296K(2601472K), 1.0792790 secs]
[Dynamic-linking native method sun.awt.X11GraphicsEnvironment.getNumScreens ... JNI]
[Dynamic-linking native method sun.awt.X11GraphicsDevice.initIDs ... JNI]
[Dynamic-linking native method sun.awt.X11GraphicsEnvironment.getDefaultScreenNum ... JNI]
[Dynamic-linking native method sun.awt.X11GraphicsDevice.getConfigVisualId ... JNI]
p1= nbms-htesprdserver0231
p2= http://10.20.156.32:15120
LD_LIBRARY_PATH=/wls11/bea1036/wlserver_10.3/server/native/linux/x86_64:/wls11/bea1036/wlserver_10.3/server/native/linux/x86_64/oci816_8


...全文
169 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
cocoabird 2018-11-22
  • 打赏
  • 举报
回复
建议:1,做下压测。2,进程优先级提高下试试呢
cocoabird 2018-11-22
  • 打赏
  • 举报
回复
引用 2 楼 qq_35309582 的回复:
性能测试已经安排上了,进程优先级如何设置能指导下吗
renice吧,具体方法可以查下
qq_35309582 2018-11-22
  • 打赏
  • 举报
回复
性能测试已经安排上了,进程优先级如何设置能指导下吗

19,613

社区成员

发帖
与我相关
我的任务
社区描述
系统使用、管理、维护问题。可以是Ubuntu, Fedora, Unix等等
社区管理员
  • 系统维护与使用区社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧