在HPUX上可用的GDB版本有一个名为"packcore"的命令,它创建一个包含核心转储,可执行文件和所有库的tarball。我发现当尝试在另一台机器上调试核心转储时,这非常有用。
在标准版本的GDB中是否有类似的命令,我可能会在Linux机器上找到?
我正在寻找一个简单的命令,有人不一定是一个开发人员可以运行,当事情在生产机器上出现问题。
核心文件包含生成它的命令。理想情况下,这将包括适当的可执行文件的完整路径。例如:
$ file core.29529
core.29529: ELF 64-bit LSB core file x86-64, version 1 (SYSV), SVR4-style, from '/bin/sleep 60'
在ELF二进制文件上运行ldd
将显示它所依赖的库:
$ ldd /bin/sleep
linux-vdso.so.1 => (0x00007fff1d3ff000)
libc.so.6 => /lib64/libc.so.6 (0x0000003d3ce00000)
/lib64/ld-linux-x86-64.so.2 (0x0000003d3ca00000)
现在我知道了分析核心转储所需的可执行文件和库。
这里棘手的部分是从核心文件中提取可执行路径。似乎没有一个好的工具可以直接阅读。数据在prpsinfo结构中编码(来自/usr/include/sys/procfs.h
),您可以使用readelf
找到数据的位置大小:
$ readelf -n core.29529
Notes at offset 0x00000468 with length 0x00000558:
Owner Data size Description
CORE 0x00000150 NT_PRSTATUS (prstatus structure)
CORE 0x00000088 NT_PRPSINFO (prpsinfo structure)
CORE 0x00000130 NT_AUXV (auxiliary vector)
CORE 0x00000200 NT_FPREGSET (floating point registers)
…因此,理论上可以编写一个代码片段,从这个结构中提取命令行,并以一种使整个过程更容易自动化的方式打印出来。当然,您可以只解析file
的输出:
$ file core.29529 | sed "s/.*from '([^']*)'/1/"
/bin/sleep 60
这就是所有的部分。下面是把它们放在一起的起点:
#!/bin/sh
core=$1
exe=$(file $core | sed "s/.*from '([^']*)'/1/" | awk '{print $1}')
libs=$(
ldd $exe |
awk '
/=> // {print $3}
! /=>/ {print $1}
'
)
cat <<EOF | tar -cah -T- -f $1-all.tar.xz
$libs
$exe
EOF
对于我的例子,如果我将这个脚本命名为packcore
,并从sleep
命令在核心文件上运行它,我会得到以下结果:$ packcore core.29529
tar: Removing leading `/' from member names
$ tar -c -f core.29529-all.tar.xz
core.29529
lib64/libc.so.6
lib64/ld-linux-x86-64.so.2
bin/sleep
目前这个脚本是相当脆弱的;我只基于这个示例输出对ldd
的输出做了很多假设。
下面是执行必要步骤的脚本(仅在RHEL5上测试,但也可能在其他地方工作):
#!/bin/sh
#
# Take a core dump and create a tarball of all of the binaries and libraries
# that are needed to debug it.
#
include_core=1
keep_workdir=0
usage()
{
argv0="$1"
retval="$2"
errmsg="$3"
if [ ! -z "$errmsg" ] ; then
echo "ERROR: $errmsg" 1>&2
fi
cat <<EOF
Usage: $argv0 [-k] [-x] <corefile>
Parse a core dump and create a tarball with all binaries and libraries
needed to be able to debug the core dump.
Creates <corefile>.tgz
-k - Keep temporary working directory
-x - Exclude the core dump from the generated tarball
EOF
exit $retval
}
while [ $# -gt 0 ] ; do
case "$1" in
-k)
keep_workdir=1
;;
-x)
include_core=0
;;
-h|--help)
usage "$0" 0
;;
-*)
usage "$0" 1 "Unknown command line arguments: $*"
;;
*)
break
;;
esac
shift
done
COREFILE="$1"
if [ ! -e "$COREFILE" ] ; then
usage "$0" 1 "core dump '$COREFILE' doesn't exist."
fi
case "$(file "$COREFILE")" in
*"core file"*)
break
;;
*)
usage "$0" 1 "per the 'file' command, core dump '$COREFILE' is not a core dump."
;;
esac
cmdname=$(file "$COREFILE" | sed -e"s/.*from '(.*)'/1/")
echo "Command name from core file: $cmdname"
fullpath=$(which "$cmdname")
if [ ! -x "$fullpath" ] ; then
usage "$0" 1 "unable to find command '$cmdname'"
fi
echo "Full path to executable: $fullpath"
mkdir "${COREFILE}.pack"
gdb --eval-command="quit" "${fullpath}" ${COREFILE} 2>&1 |
grep "Reading symbols" |
sed -e's/Reading symbols from //' -e's/....*//' |
tar --files-from=- -cf - | (cd "${COREFILE}.pack" && tar xf -)
if [ $include_core -eq 1 ] ; then
cp "${COREFILE}" "${COREFILE}.pack"
fi
tar czf "${COREFILE}.pack.tgz" "${COREFILE}.pack"
if [ $keep_workdir -eq 0 ] ; then
rm -r "${COREFILE}.pack"
fi
echo "Done, created ${COREFILE}.path.tgz"
我为此编写了shell脚本。它使用了上面答案的想法,并添加了一些用法信息和额外的命令。在未来,我可能会添加命令快速调试在docker容器与gdb.