深入理解Linux内核OOPS错误日志（嵌入式系统调试系列第6部分）

需积分: 5 57 浏览量更新于2024-07-01 收藏 402KB PDF 举报

本文档是《Kernel Debug Series - Part 6：理解内核错误日志》的一部分，主要关注嵌入式Linux系统调试。这部分教程旨在帮助读者深入理解内核异常（kernel oops）及其在Linux内核中的作用。内核错误日志，或称为 kernel oops，是Linux内核在检测到严重错误时产生的记录，用于报告偏离正常行为的行为并定位问题。内核错误（kernel oops）是当Linux内核遇到无法处理的异常情况时，如内存访问错误、硬件故障或其他系统级问题，会触发的一种机制。它通常会产生特定类型的错误消息，这些消息包含有关错误严重程度的信息，从panic()级别，表示最紧急的系统崩溃，到WARN()级别，表示较低级别的警告。 kernel oops 日志结构相当详细，主要包括以下几个部分： 1. **Error Summary**：简短概述了错误的类型和发生的位置。 2. **Error Type**：描述了错误的具体类别，例如NULL指针引用错误、硬件故障等。 3. **CPU #/PID #/Kernel-Version**：提供了出错时的处理器编号、进程ID以及使用的内核版本信息，这对于追踪问题来源至关重要。 4. **Hardware**：可能包含与硬件相关的错误细节，比如内存地址、异常发生时的内存状态。 5. **CPU Register Dump**：包括程序计数器（PC）和链接寄存器（LR）等，这些都是内核异常时的上下文信息。 6. **Stack Dump** 和 **Backtrace**：展示了出错前的调用堆栈，有助于分析错误发生的代码执行路径。本文还将介绍如何利用工具定位源代码中的错误，通过具体的 oops 日志示例来说明这些概念。例如，一个典型的 oops 日志如“Unable to handle kernel NULL pointer dereference at virtual address 00000000”表明系统尝试访问了无效的内存地址，而pgd、pte和ppte的值则提供了关于内存管理模块的信息。阅读和理解这部分内容对于嵌入式Linux开发者来说是非常重要的，它可以帮助他们诊断和修复内核级别的问题，确保系统的稳定性和可靠性。

Kernel oops log structure example

Unable to handle kernel NULL pointer dereference at virtual address 00000000

pgd = eeda0000

[00000000] *pgd=aedb8831, *pte=00000000, *ppte=00000000

Internal error: Oops: 817 [#1] PREEMPT ARM

Modules linked in: musb_am335x(+) rtc_omap omap_wdt ti_am335x_tscadc matrix_keypad matrix_keymap

CPU: 0 PID: 135 Comm: udevd Not tainted 4.4.48-02799-g2f0993afde90-dirty #440

Hardware name: Generic AM33XX (Flattened Device Tree)

task: eeeaa400 ti: eeeda000 task.ti: eeeda000

PC is at am335x_child_probe+0x2c/0x58 [musb_am335x]

LR is at am335x_child_probe+0x24/0x58 [musb_am335x]

pc : [<bf01902c>] lr : [<bf019024>] psr: 600b0013

sp : eeedbcb8 ip : eeedbcb8 fp : eeedbccc

r10: 00000000 r9 : 0000000e r8 : bf019230

r7 : fffffdfb r6 : bf019230 r5 : ee99aa00 r4 : ee99aa10

r3 : ee99aa10 r2 : 00000000 r1 : 00000001 r0 : ee99aa10

Flags: nZCv IRQs on FIQs on Mode SVC_32 ISA ARM Segment none

Control: 10c5387d Table: aeda0019 DAC: 00000051

Process udevd (pid: 135, stack limit = 0xeeeda210)

Stack: (0xeeedbcb8 to 0xeeedc000)

bca0: ee99aa10 ee99aa10

bcc0: eeedbcec eeedbcd0 c03772b4 bf01900c ee99aa10 c089f530 00000000 c08686b0

...

Backtrace:

[<bf019000>] (am335x_child_probe [musb_am335x]) from [<c03772b4>] (platform_drv_probe+0x5c/0xc0)

[<c0377258>] (platform_drv_probe) from [<c037501c>] (driver_probe_device+0x228/0x484)

[<c0374df4>] (driver_probe_device) from [<c0375314>] (__driver_attach+0x9c/0xa0)

[<c0375278>] (__driver_attach) from [<c0372dbc>] (bus_for_each_dev+0x7c/0xb0)

[<c0372d40>] (bus_for_each_dev) from [<c0374934>] (driver_attach+0x28/0x30)

Error Summary ->

Error Type ->

CPU#/PID#/kernel-Version ->

Hardware ->

CPU Register Dump ->

Stack Dump ->

Backtrace ->

剩余26页未读，继续阅读

daolongzhang

粉丝: 223
资源: 13

深入理解Linux内核OOPS错误日志（嵌入式系统调试系列第6部分）

优化JavaScript交互：探索ClojureScript的cljs-oops库

OOP课程督导工作与Java实践：OOPs-a-daisy项目解析

内核OOPS问题深度解析与调试方法

vagrant-debug-kernel-oops:使用 Vagrant 测试运行 Linux 内核的代码，并保留内核日志

abrt-addon-kerneloops-2.0.8-6.el6.centos.i686.rpm

abrt-addon-kerneloops-2.0.8-15.el6.i686.rpm

abrt-addon-kerneloops-2.0.8-21.el6.x86_64.rpm

abrt-addon-kerneloops-2.10.9-20.el8.aarch64.rpm

libreport-plugin-kerneloops-2.9.5-15.el8.aarch64.rpm

abrt-addon-kerneloops-2.10.9-21.el8.aarch64.rpm

最新资源