访问 NULL 指针错误背后的原理

前言

说到 NULL 指针大家都是谈之色变，第一印象就是 NullPointerException, Segmentation fault 之类的错误。NULL 指针大部分情况下会导致程序被终止。但是其实严格来说，访问空指针会产生不可预料的结果。只不过大部分情况是程序被终止。为什么呢？接下来让我们来探讨访问 NULL 指针错误背后的原理。

NULL 在编译器中的实现

首先，我们来看看 NULL 指针到底是什么？

Null 是一个特殊指针值（或是一种对象引用）表示这个指针并不指向任何的对象。

举一些例子，C/C++ 中的 NULL，Python 中的 None 等等。大部分 NULL 实现是用 0 代表 NULL，例如说 C/C++ 。实际上，NULL 的值并不重要，重要的是它代表的含义。例如说，JVM 规范并没有规定 NULL 的值，不同虚拟机实现可以自己定义 NULL 的值。

总之，NULL 的值取决编译器实现。

访问 NULL 指针的过程

C 语言中，NULL 的值是 0，即 NULL == 0 是成立的。我们前面说访问 NULL 指针的行为会产生不可预料的后果。但是在 Linux 系统中后果是确定的：访问空指针会产生 Segmentation fault 的错误。因此这里的“不可预料”指的是在不同系统产生的后果不一样。

让我们假设现在使用的是 C 语言，运行在 Linux 系统上，以此来分析访问 NULL 指针的过程。

Linux 中，每个进程空间的 0x0 虚拟地址开始的线性区 (memory region) 都会被映射到一个用户态没有访问权限的页上。通过这样的映射，内核可以保证没有别的页会映射到这个区域。
编译器把空指针当做 0 对待，开心地让你去访问空指针。
缺页异常处理程序被调用，因为在 0x0 的页没有在物理内存里面。
缺页异常处理程序发现你没有访问的权限。
内核发送 SIGSEGV 信号给进程，该信号默认是让进程自杀。

可以看到：不需要特定的编译器实现或者内核的支持，只需要让一个页映射到 0x0 的虚拟地址上，就完美的实现了检测空指针的错误。

总结

为了研究这个问题，我查了很多资料。空指针的问题涉及 Linux 内存管理的知识，主要参考了 Robert Love 大神对该问题的回答和《深入理解 Linux 内核》。最大的感悟是带着问题去看内核的书，你会理解内核为什么要这么做，同时可以加深理解和记忆。

总之，空指针的实现取决于编译器的实现，访问空指针的后果取决于操作系统的实现。大部分系统类似于 Linux，会产生 Segmentation fault 的错误，至于内部实现就要看各个系统的代码了。

参考资料 What actually happens when dereferencing a NULL pointer? 《深入理解 Linux 内核》