博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
LWP进程资源耗尽,Resource temporarily unavailable
阅读量:5822 次
发布时间:2019-06-18

本文共 2161 字,大约阅读时间需要 7 分钟。

微信公众号:《小姐姐味道》,文末附二维码,欢迎关注。

服务器环境使用root账户运行应用程序是非常危险的,容易让人拿到shell变成肉鸡。所以有点意识的团队,都会建立一个低权限的普通用户用来运行java程序。

权限低,有点不像亲儿子,在资源紧张的困难时刻尤其能看出来。

现象

问题是在一台公用的测试环境机器发生的,正式环境并没有复现。这台服务器部署了几十个服务,且部署账户最近从root切换到了xjjbot

运行一段时间后,服务器频繁发生问题了。首先,有大量连接处于CLOSE_WAIT状态,一度以为是被动关闭的问题。但并不是。

netstat -antp | grep CLOSE | awk '{print $7}'  | sort | uniq -c复制代码

奇怪的是,使用root账户或者其他账户登录系统,操作一切正常。然而当切换到xjjbot账户,则会报以下错误:

# sudo su - xjjbotbash: fork: retry: no child processesbash: fork: retry: no child processesbash: fork: retry: no child processesbash: fork: retry: no child processesbash: fork: Resource temporarily unavailable复制代码

以上是系统级别的报错信息。这种情况下,jvm也会有相应报错,但恐怕你也没有机会去看了(可以使用其他系统用户查看哦)。

- Cannot create GC thread. Out of system resources  - java.lang.OutOfMemoryError: unable to create new native thread复制代码

原因

引起的原因就是资源不够用了,具体来说是进程资源。

Linux的线程其实是一个进程,所以java的也是,具体来说,叫做“light weight process(LWP)”--轻量级进程。

LWP与其它进程共享所有(或大部分)逻辑地址空间和系统资源,一个进程可以创建多个LWP,这样它们共享大部分资源;LWP有它自己的进程标识符,并和其他进程有着父子关系;。LWP由内核管理并像普通进程一样被调度

使用以下命令可以看到某个用户使用了多少进程资源

ps -eLf | grep xjjbot(uid)  | wc -l复制代码

使用下面命令可以查看具体每个进程开启了多少线程

ps -o nlwp,pid,lwp,args -u xjjbot(uid)  | sort -n复制代码

解决

根据linux一切都是文件的规则,首先想到的,是修改ulimit的参数,然而也不是,因为它已经足够大了。交叉回想一下elasticsearch,在安装的时候,需要配置一个叫做nproc的东西,问题大概就出在这,是进程资源不够用啦。

相关的配置文件: /etc/security/limits.conf

在不同的内核版本上,也有一些小差异。比如 /etc/security/limits.d/* 下的文件,会在某些时候覆盖limits.conf的配置。所以配置不生效的情况下,记得检查一下。

鉴于以上原因,可以将limits.d中的配置全部注释掉,统一在limits.conf中配置。

以下是原始配置

*          soft    nproc     4096root       soft    nproc     unlimited复制代码

将4096改为大点的数字,或者直接改成unlimited就可以了。

ElasticSearch系统参数配置

既然提到了es,那么我们看一下es安装都需要改哪些系统配置。这些经验都是公用的,可以举一反三。

禁用swap

swap是性能杀手,所以ES也忍受不住了,直接关掉。

sudo swapoff -a复制代码

在配置文件里也可以加入这个参数,jvm锁住内存,不让它们和交换分区交换。

bootstrap.memory_lock: true复制代码

虚拟内存

ES使用mmapfs来映射一些数据,但默认的系统参数对它来说太小了,也需要修改。

sysctl -w vm.max_map_count=262144复制代码

永久生效需要修改 /etc/sysctl.conf

文件句柄

ulimit

linux打开的文件描述符数量是有限的。如果你的应用需要同时和很多小文件打交道,则需要配置此参数。

sudo su  ulimit -n 65536 su elasticsearch复制代码

/etc/security/limits.conf

ok,这就是我们刚才改动的文件。要想上面的配置永久生效,则需要改动此文件。

elasticsearch  -  nofile  65536复制代码

线程数量

就是我们上面说的啦,能够快速想到它,也是因为安装过es -.- 所以,不要随便开一大堆线程,除了增加调度时间,还容易顶到系统的天花板。

冯诺依曼架构下,这些软件,不都一个套路么? 有着一样的命运,挣扎着却无法逃脱。

转载地址:http://umbdx.baihongyu.com/

你可能感兴趣的文章
Breaking parallel loops in .NET C# using the Stop method z
查看>>
Android Content Provider Guides
查看>>
修改故障转移群集心跳时间
查看>>
[轉]redis;mongodb;memcache三者的性能比較
查看>>
微软职位内部推荐-Sr DEV
查看>>
用计算器计算“异或CRC”
查看>>
让你的WPF程序在Win7下呈现Win8风格主题
查看>>
JDBC二查询(web基础学习笔记八)
查看>>
监听器(web基础学习笔记二十二)
查看>>
802.11 学习笔记
查看>>
Leetcode-Database-176-Second Highest Salary-Easy(转)
查看>>
构建Docker Compose服务堆栈
查看>>
最小角回归 LARS算法包的用法以及模型参数的选择(R语言 )
查看>>
Hadoop生态圈-Kafka常用命令总结
查看>>
如何基于Redis Replication设计并实现Redis-replicator?
查看>>
Linux 环境下 PHP 扩展的编译与安装 以 mysqli 为例
查看>>
浮点数内存如何存储的
查看>>
贪吃蛇
查看>>
EventSystem
查看>>
用WINSOCK API实现同步非阻塞方式的网络通讯
查看>>