问题定位步骤: 1、 用root帐户 遍历 /proc/进程ID/fd目录,如果该目录下文件数比较大(如果大于10,一般就属于socket泄漏),根据该进程ID,可以确认该进程ID所对应的名称。 2、 重启程序恢复服务,以便后续查找问题。 3、 strace 该程序并记录strace信息。strace –p 进程ID >>/tmp/stracelog.log 2>&1 4、 查看 /proc/进程ID/fd 下的文件数目是否有增加,如果发现有增加,记录上一个socket编号,停止strace 5、 确认问题代码的位置。打开/tmp/stracelog.log,从尾部向上查找close(socket编号)所在行,可以确认在该次close后再次 创建的socket没有关闭,根据socket连接的server ip可以确认问题代码的位置。 另一种方法:判断是否有socket泄漏: lsof | grep "can't identify protocol" 如果存在很多,则代表socket泄漏,同时会显示哪个进程使用的sock未关闭。 (责任编辑:IT) |