一、工作中一个内存泄漏问题的解决过程:
问题背景:我司设备上运行有多个进程,在设备运行两天后,进程jsman所占用的内存达到了1200M bytes(通过ps -aux查看)。
解决步骤:
确定设备上的软件版本,根据git的commit号信息回退代码。
分析哪些操作可能导致进程的内存泄漏。jsman进程是net-snmp的子代理进程,是周期性被动响应snmp请求的进程。
首先出现内存泄漏问题时,需要逐步缩小问题的范围。通过snmpwalk命令依次获取设备上支持的6个oid,结合ps -aux命令,定位到问题出现在响应oid为56789.1.1的请求。
仔细review该部分代码。该部分代码调用到了驱动部api,snmp的api,以及自己实现的业务逻辑。分别注释掉不同部分的代码,进行测试,进一步缩小问题的范围。
最后定位到是读取不存在的xml文件时,出现的问题。
总结:
记录问题的解决步骤,可以避免重复操作,并且对梳理思路也有帮助。
放松心态,逐步进行,逐渐缩小问题的范围。
二、内存泄漏检查工具memcheck的使用。
转自:https://www.cnblogs.com/cnjy/p/4484951.html
目前在linux开发一个分析实时路况的应用程序,在联合测试中发现程序存在内存泄露的情况。
这下着急了,马上就要上线了,还好发现了一款Valgrind工具,完美的解决了内存泄露的问题。
推荐大家可以使用看看。
Valgrind是运行在Linux上一套基于仿真技术的程序调试和分析工具,它的主要作者是获得过Google-O'Reilly开源大奖的Julian Seward,它包含一个内核──一个软件合成的CPU,和一系列的小工具,每个工具都可以完成一项任务──调试,分析,或测试等。Valgrind可以检测内存泄漏和内存违例,还可以分析cache的使用等,灵活轻巧而又强大,能直穿程序错误的心脏,真可谓是程序员的瑞士军刀。
(一). Valgrind概观 Valgrind一般包含下列工具: 1.Memcheck (后续我们只对这款内存检测工具做介绍) 最常用的工具,用来检测程序中出现的内存问题,所有对内存的读写都会被检测到,一切对malloc()/free()/new/delete的调用都会被捕获。所以,它能检测以下问题: 1.对未初始化内存的使用; 2.读/写释放后的内存块; 3.读/写超出malloc分配的内存块; 4.读/写不适当的栈中内存块; 5.内存泄漏,指向一块内存的指针永远丢失; 6.不正确的malloc/free或new/delete匹配; 7,memcpy()相关函数中的dst和src指针重叠。 这些问题往往是C/C++程序员最头疼的问题,Memcheck在这里帮上了大忙。 2.Callgrind 和gprof类似的分析工具,但它对程序的运行观察更是入微,能给我们提供更多的信息。和gprof不同,它不需要在编译源代码时附加特殊选项,但加上调试选项是推荐的。Callgrind收集程序运行时的一些数据,建立函数调用关系图,还可以有选择地进行cache模拟。在运行结束时,它会把分析数据写入一个文件。callgrind_annotate可以把这个文件的内容转化成可读的形式。 3.Cachegrind Cache分析器,它模拟CPU中的一级缓存I1,Dl和二级缓存,能够精确地指出程序中cache的丢失和命中。如果需要,它还能够为我们提供cache丢失次数,内存引用次数,以及每行代码,每个函数,每个模块,整个程序产生的指令数。这对优化程序有很大的帮助。 4.Helgrind 它主要用来检查多线程程序中出现的竞争问题。Helgrind寻找内存中被多个线程访问,而又没有一贯加锁的区域,这些区域往往是线程之间失去同步的地方,而且会导致难以发掘的错误。Helgrind实现了名为“Eraser”的竞争检测算法,并做了进一步改进,减少了报告错误的次数。不过,Helgrind仍然处于实验阶段。 5. Massif 堆栈分析器,它能测量程序在堆栈中使用了多少内存,告诉我们堆块,堆管理块和栈的大小。Massif能帮助我们减少内存的使用,在带有虚拟内存的现代系统中,它还能够加速我们程序的运行,减少程序停留在交换区中的几率。 此外,lackey和nulgrind也会提供。Lackey是小型工具,很少用到;Nulgrind只是为开发者展示如何创建一个工具。我们就不做介绍了。
(二). Valgrind下载与安装
1、下载:
valgrind官网:http://valgrind.org下载
如果安装有svn则可以直接下载最新版本:svn co svn://svn.valgrind.org/valgrind/trunk valgrind
2、安装
cd valgrind
./autogen.sh
./configure --prefix=...
make
make install
(二). 使用Memcheck 工具进行内存分析
1、编译你的程序debug版本./TestMem
2、执行:valgrind --tool=memcheck --leak-check=full --log-file=./log.txt ./TestMem
3、耐心等待并分析结果(log.txt结果文件中会包含引起内存泄露的代码在在源码中的位置,即以下举例说明中标明为红色的部分)
举例说明:
下面是一段有问题的C程序代码test.c
#include <stdlib.h> void f(void) { int* x = malloc(10 * sizeof(int)); x[10] = 0; //问题1: 数组下标越界 } //问题2: 内存没有释放 int main(void) { f(); return 0; } 1、 编译程序test.c gcc -Wall test.c -g -o test 2、 使用Valgrind检查程序BUG valgrind --tool=memcheck --leak-check=full ./test 3、 分析输出的调试信息 ==3908== Memcheck, a memory error detector. ==3908== Copyright (C) 2002-2007, and GNU GPL'd, by Julian Seward et al. ==3908== Using LibVEX rev 1732, a library for dynamic binary translation. ==3908== Copyright (C) 2004-2007, and GNU GPL'd, by OpenWorks LLP. ==3908== Using valgrind-3.2.3, a dynamic binary instrumentation framework. ==3908== Copyright (C) 2000-2007, and GNU GPL'd, by Julian Seward et al. ==3908== For more details, rerun with: -v ==3908== --3908-- DWARF2 CFI reader: unhandled CFI instruction 0:50 --3908-- DWARF2 CFI reader: unhandled CFI instruction 0:50 /*数组越界错误*/ ==3908== Invalid write of size 4 ==3908== at 0x8048384: f (test.c:6) ==3908== by 0x80483AC: main (test.c:11) ==3908== Address 0x400C050 is 0 bytes after a block of size 40 alloc'd ==3908== at 0x40046F2: malloc (vg_replace_malloc.c:149) ==3908== by 0x8048377: f (test.c:5) ==3908== by 0x80483AC: main (test.c:11) ==3908== ==3908== ERROR SUMMARY: 1 errors from 1 contexts (suppressed: 14 from 1) ==3908== malloc/free: in use at exit: 40 bytes in 1 blocks. ==3908== malloc/free: 1 allocs, 0 frees, 40 bytes allocated. ==3908== For counts of detected errors, rerun with: -v ==3908== searching for pointers to 1 not-freed blocks. ==3908== checked 59,124 bytes. ==3908== ==3908== /*有内存空间没有释放*/ ==3908== 40 bytes in 1 blocks are definitely lost in loss record 1 of 1 ==3908== at 0x40046F2: malloc (vg_replace_malloc.c:149) ==3908== by 0x8048377: f (test.c:5) ==3908== by 0x80483AC: main (test.c:11) ==3908== ==3908== LEAK SUMMARY: ==3908== definitely lost: 40 bytes in 1 blocks. ==3908== possibly lost: 0 bytes in 0 blocks. ==3908== still reachable: 0 bytes in 0 blocks. ==3908== suppressed: 0 bytes in 0 blocks.