Python 内存安全吗?



由于Deno是新的Node.js竞争对手,Rust的内存安全特性已经在很多新闻文章中被提及,其中一篇特别指出Rust和Go具有良好的内存安全特性,Swift和Kotlin也是如此,但后两者并未广泛用于系统编程。

Safe Rust 是真正的 Rust 编程语言。如果你所做的只是编写Safe Rust,你将永远不必担心类型安全或内存安全。你永远不会忍受悬而未决的指针、释放后使用或任何其他类型的未定义行为。

这激起了我的兴趣,让我了解Python是否可以被视为内存安全的,如果是或否,安全还是不安全?

从一开始,维基百科上关于内存安全的文章甚至没有提到Python,而关于Python的文章似乎只提到了内存管理。 我最接近找到答案的是丹尼尔的这个:

维基百科文章将类型安全与内存安全相关联,这意味着无法访问相同的内存区域,例如整数和字符串。通过这种方式,Python是类型安全的。不能隐式更改对象的类型。

但即使这样似乎也只是暗示了两个方面之间的联系(使用维基百科的关联,这再次值得商榷(,并且没有关于Python是否可以被视为内存安全的明确答案。

维基百科列出了以下内存安全问题的例子:

Access errors: invalid read/write of a pointer
Buffer overflow - out-of-bound writes can corrupt the content of adjacent objects, or internal data (like bookkeeping information for the heap) or return addresses.
Buffer over-read - out-of-bound reads can reveal sensitive data or help attackers bypass address space layout randomization.

Python至少试图防止这些。

Race condition - concurrent reads/writes to shared memory

在具有可变数据结构的语言中,这实际上并不难做到。(函数式编程和不可变数据结构的倡导者经常使用这一事实作为对他们有利的论据(。

Invalid page fault - accessing a pointer outside the virtual memory space. A null pointer dereference will often cause an exception or program termination in most environments, but can cause corruption in operating system kernels or systems without memory protection, or when use of the null pointer involves a large or negative offset.
Use after free - dereferencing a dangling pointer storing the address of an object that has been deleted.
Uninitialized variables - a variable that has not been assigned a value is used. It may contain an undesired or, in some languages, a corrupt value.
Null pointer dereference - dereferencing an invalid pointer or a pointer to memory that has not been allocated
Wild pointers arise when a pointer is used prior to initialization to some known state. They show the same erratic behaviour as dangling pointers, though they are less likely to stay undetected.

没有真正的方法可以阻止某人尝试访问空指针。在 C# 和 Java 中,这会导致异常。在C++,这会导致未定义的行为。

Memory leak - when memory usage is not tracked or is tracked incorrectly
Stack exhaustion - occurs when a program runs out of stack space, typically because of too deep recursion. A guard page typically halts the program, preventing memory corruption, but functions with large stack frames may bypass the page.

C#、Java 和 Python 等语言中的内存泄漏与手动管理内存的 C 和 C++ 等语言的含义不同。在 C 或 C++ 中,由于未能释放分配的内存,会出现内存泄漏。在具有托管内存的语言中,您不必显式取消分配内存,但仍然可以通过意外地在某处维护对对象的引用来执行非常相似的事情,即使在不再需要该对象之后也是如此。

这实际上很容易使用 C# 中的事件处理程序和长期集合类之类的东西;我实际上从事过内存泄漏的项目,尽管我们使用的是托管内存。从某种意义上说,使用具有管理内存的环境实际上会使这些问题更加危险,因为程序员可能会有一种虚假的安全感。根据我的经验,即使是经验丰富的工程师也经常无法进行内存分析或编写测试用例来检查这一点(可能是由于环境给了他们一种虚假的安全感(。

堆栈耗尽在Python中也很容易做到(例如,无限递归(。

Heap exhaustion - the program tries to allocate more memory than the amount available. In some languages, this condition must be checked for manually after each allocation.

仍然很有可能 - 我很尴尬地承认我个人已经在 C# 中做到了这一点(尽管还没有在 Python 中(。

Double free - repeated calls to free may prematurely free a new object at the same address. If the exact address has not been reused, other corruption may occur, especially in allocators that use free lists.
Invalid free - passing an invalid address to free can corrupt the heap.
Mismatched free - when multiple allocators are in use, attempting to free memory with a deallocation function of a different allocator[20]
Unwanted aliasing - when the same memory location is allocated and modified twice for unrelated purposes.

不需要的别名实际上在Python中很容易做到。这是Java中的一个例子(完全披露:我写了接受的答案(;你也可以在Python中轻松做一些非常相似的事情。其他的由Python解释器本身管理。

因此,内存安全似乎是相对的。根据您认为的"内存安全问题",实际上很难完全预防。像Java,C#和Python这样的高级语言可以防止这些错误中的许多最严重的错误,但还有其他问题很难或不可能完全预防。

最新更新