程序员避坑指南：解读野指针

郎哥
C语言
2天前
24热度
0评论

什么是野指针

在 C 和 C++ 语言中，指针是一种特殊的变量，它存储的是内存地址。而野指针，简单来说，就是指向了 “不该指向” 地方的指针。正常情况下，指针应该指向一块已经被分配且程序有权限访问的内存区域，这样我们才能通过指针安全地读取或写入数据。但野指针却打破了这种规则，它指向的可能是一块从未被初始化的内存空间。比如，当我们声明一个指针变量，却没有给它赋任何初始值时：
int *ptr;
*ptr = 10; // 这是非常危险的，因为ptr是野指针，指向未知，此时的ptr就是一个野指针，它的值是不确定的，可能指向任何地方。对这样的野指针进行解引用操作（如*ptr = 10;），极有可能访问到系统关键区域或者其他程序正在使用的内存，从而引发不可预测的错误。

当我们使用delete或free（释放了一块动态分配的内存后，如果没有将对应的指针置为NULL（或nullptr），这个指针就会变成野指针：

int *p = new int(5);
delete p;
// 此时p成为野指针，如果继续使用p就会出问题
*p = 10;

在上述代码中，delete p操作释放了p指向的内存，但p本身的值并没有改变，它仍然指向那块已经被释放的内存。如果后续代码中不小心再次使用p，必然会导致程序出现严重错误。
还有一种情况，当指针所指向的变量在其作用域结束后被销毁，而指针仍然指向该变量原来的内存地址时，也会产生野指针。例如，函数内部的局部变量在函数返回后，其内存会被回收，如果返回了指向该局部变量的指针，就会得到一个野指针：

int* createNumber() {
int num = 10;
return &num;
}
int main() {
int *p = createNumber();
// 这里p是野指针，因为num已经被销毁
return 0;
}

在createNumber函数中，num是局部变量，当函数返回时，num的内存被释放，而返回的指针p却还指向这块已经无效的内存区域，从而成为野指针。

野指针的危害

程序崩溃

当程序试图访问野指针所指向的无效内存地址时，最直接的后果往往就是程序崩溃。操作系统为了保护系统的稳定性和安全性，会严格限制程序对内存的访问。一旦程序触犯了这个规则，访问了不应该访问的内存区域，操作系统会立即终止该程序的运行。例如，在一个简单的 C 程序中：


#include <stdio.h>
#include <stdlib.h>

int main() {
int *ptr;
*ptr = 10; // 野指针访问，ptr未初始化
return 0;
}

在这个例子中，ptr是一个未初始化的野指针，当执行*ptr = 10;时，程序试图向一个未知的内存地址写入数据，这会触发操作系统的内存访问违规检测机制，导致程序崩溃。

数据损坏

如果野指针恰好指向了一个有效的内存地址，但这个地址并非是当前程序所分配和管理的，那么对其进行读写操作，极有可能损坏其他程序或者系统的数据。想象一下，有多个程序同时在内存中运行，每个程序都有自己的内存空间。如果一个程序中的野指针指向了另一个程序正在使用的内存区域，并进行了写入操作，就可能会覆盖掉该区域原本存储的数据，导致另一个程序出现逻辑错误，甚至崩溃。例如，在一个多线程或者多进程的应用场景中：


#include <stdio.h>
#include <stdlib.h>

int main() {
int *p1 = (int *)malloc(sizeof(int));
*p1 = 10;

int *p2;
// 这里假设p2成为野指针，且指向了p1所指向的内存地址附近
p2 = (int *)((char *)p1 + 4); 

*p2 = 20; // 野指针写操作，可能损坏p1指向的数据或其他数据
free(p1);
return 0;
}

在这个示例中，p2成为野指针并指向了p1附近的内存地址，当对p2进行写操作时，就有可能破坏p1所指向的数据，或者影响到其他正在使用这块内存区域的数据，从而导致难以排查的错误。

不可预测的行为

野指针会使程序产生各种不可预测的行为。由于野指针指向的内存地址是不确定的，每次程序运行时，其指向的位置可能都不一样，这就导致了错误的出现毫无规律可言。有时候，程序可能在运行多次后才出现一次错误，而且错误的表现形式也各不相同，这给程序的调试和定位问题带来了很大困难。例如，一个程序可能在某些情况下看似正常运行，而在其他情况下却突然出现异常，如打印出奇怪的结果、进入无限循环或者产生内存泄漏等。

野指针产生的原因

未初始化的指针

在 C和C++ 中，局部变量和动态分配的内存默认是不会被初始化的。这意味着当我们声明一个指针变量时，如果没有显式地给它赋值，它的值将是随机的，指向一个不确定的内存地址。例如：

int *ptr;
*ptr = 10; // 错误，ptr是未初始化的野指针

在这个例子中，ptr是一个局部指针变量，它在声明时没有被初始化。当执行*ptr = 10;时，程序试图向一个未知的内存地址写入数据，极有可能导致程序崩溃或其他不可预测的错误。
这种未初始化指针的问题，在实际项目中很容易被忽视，尤其是在复杂的代码逻辑中。比如，在一个函数中，有多个指针变量被声明，程序员可能因为疏忽忘记对其中某个指针进行初始化，而后续代码又在不经意间使用了这个未初始化的指针，从而埋下了野指针的隐患。

释放后的内存继续使用

当我们使用delete（在 C++ 中）或free（在 C 语言中）释放了一块动态分配的内存后，虽然这块内存已经被归还给系统，但指向它的指针的值并没有自动变为NULL（或nullptr，在 C++11 及以后版本），此时这个指针就成为了野指针。继续使用这个指针，就会导致未定义行为。例如：

int *p = new int(5);
delete p;
*p = 10; // 错误，p是野指针，指向已释放的内存

在这段代码中，delete p操作释放了p指向的内存，但p本身仍然指向那块已经被释放的内存地址。当执行*p = 10;时，程序试图向一个已经不属于它的内存区域写入数据，这会导致严重的错误。
在一些复杂的内存管理场景中，比如涉及到多个指针指向同一块内存，或者在循环中动态分配和释放内存时，很容易出现忘记将释放后的指针置为NULL的情况，从而引发野指针问题。

超出数组边界

在访问数组时，如果不小心超出了数组的边界，就会导致指针指向不属于数组的内存空间，从而产生野指针。例如：

int arr[5];
int *ptr = arr + 10; // 错误，ptr超出数组边界，成为野指针
*ptr = 30; // 访问野指针，未定义行为

在这个例子中，arr是一个包含 5 个元素的数组，而ptr被赋值为arr + 10，这使得ptr指向了数组arr之外的内存地址。当执行*ptr = 30;时，程序试图向一个未知的内存区域写入数据，这会导致不可预测的结果。
这种超出数组边界的错误，在使用循环遍历数组时特别容易出现。比如，在编写循环条件时，不小心将循环结束条件写错，导致循环多执行了几次，从而访问到了数组之外的内存。

如何避免野指针

初始化指针

在使用指针之前，务必将其初始化为nullptr（在 C++11 及以后版本中）或NULL，或者一个明确的内存地址。这是避免野指针最简单、最直接的方法。例如：


int *ptr = nullptr;
// 或者
int num = 10;
int *ptr2 = &num;

在上述代码中，ptr被初始化为nullptr，表示它不指向任何有效的内存地址，直到后续为其分配了合法的内存。而ptr2则被初始化为指向变量num的地址，这样就确保了指针在使用时指向的是一个有效的内存区域。
1.7.4.2.避免使用已释放的内存
当使用delete（在 C++ 中）或free（在 C 语言中）释放了一块动态分配的内存后，应立即将对应的指针设置为nullptr 。这样可以防止后续代码不小心再次使用该指针，从而避免野指针问题。例如：

int *p = new int(5);
delete p;
p = nullptr;

在这段代码中，delete p释放了p指向的内存，随后p = nullptr将p置为nullptr，确保了p不会成为野指针。如果在释放内存后没有将指针置为nullptr，后续代码中若不小心使用了该指针，就可能导致未定义行为。

数组边界检查

在访问数组元素时，一定要确保索引值在有效的范围内，避免超出数组边界导致野指针问题。可以利用数组的长度或大小来进行边界检查。例如：

int arr[5];
int index = 10;
if (index >= 0 && index < sizeof(arr) / sizeof(arr[0])) {
// 安全地访问数组元素
arr[index]; 
} else {
// 处理索引越界的情况，比如抛出异常、打印错误信息等
std::cerr << "Index out of range" << std::endl;
}

在上述代码中，通过if语句检查index是否在数组的有效范围内。如果index合法，则可以安全地访问数组元素；否则，会输出错误信息，提示索引越界。这样可以有效地避免因数组越界而产生的野指针问题。

NULL到底是什么？

在 C 语言中，NULL通常被定义为一个空指针常量，其值为 0 。在 C 语言的头文件stddef.h中，其定义形式为：

#define NULL ((void*)0)

这种定义方式将NULL表示为一个void*类型的指针，值为 0 。之所以使用void*类型，是因为在 C 语言中，void*类型的指针可以隐式转换为其他任何类型的指针，这样就使得NULL可以被赋值给各种类型的指针变量，用于表示该指针不指向任何有效的内存地址。例如：


int *p1 = NULL;
char *p2 = NULL;

在上述代码中，p1和p2分别被初始化为NULL，表示它们当前没有指向任何有效的内存区域。
在 C++ 中，虽然NULL仍然被使用，但它的定义与 C 语言有所不同。在 C++ 中，为了适应其更严格的类型检查机制，NULL通常被直接定义为 0 。这是因为在 C++ 中，void*类型的指针不能像在 C 语言中那样自由地隐式转换为其他类型的指针。如果将NULL定义为(void*)0，在进行指针赋值时可能会引发编译错误。所以，在 C++ 的头文件中，NULL的定义通常如下：


#ifdef __cplusplus
#define NULL 0
#else
#define NULL ((void*)0)
#endif

例如，在 C++ 中定义指针并初始化为NULL：

int *ptr = NULL;

这里的NULL就是值为 0 的常量，用于表示指针ptr当前没有指向有效的内存地址。
使用NULL来表示空指针会存在一些潜在的问题。由于NULL本质上是 0，这就导致在某些情况下，它可能会与整数类型的 0 产生混淆，尤其是在函数重载的场景中。例如：


#include <iostream>

void func(int num) {
std::cout << "调用了func(int): " << num << std::endl;
}

void func(char* ptr) {
std::cout << "调用了func(char*): " << ptr << std::endl;
}

int main() {
func(NULL); 
return 0;
}

在上述代码中，当调用func(NULL)时，编译器可能会将NULL解释为整数 0，从而调用func(int num)函数，而这可能并非开发者的本意。
为了解决这个问题，C++11 引入了一个新的关键字nullptr 。nullptr专门用于表示空指针常量，它的类型是std::nullptr_t，这是一种与所有指针类型都不兼容的类型。nullptr只能被隐式转换为指针类型或布尔类型，不会与整数类型产生混淆。例如：


#include <iostream>

void func(int num) {
std::cout << "调用了func(int): " << num << std::endl;
}

void func(char* ptr) {
std::cout << "调用了func(char*): " << ptr << std::endl;
}

int main() {
func(nullptr); 
return 0;
}

在这段代码中，当调用func(nullptr)时，编译器会明确地将nullptr识别为空指针，从而调用func(char* ptr)函数，避免了使用NULL时可能出现的歧义。
因此，在 C++11 及以后的版本中，建议使用nullptr来代替NULL表示空指针。