Python中的堆排序是什么?

堆排序是一种基于二叉堆数据结构的排序技术。为了进行堆排序,您需要熟悉二叉树和二叉堆。

什么是完全二叉树?

完全二叉树是一种树数据结构,其中除最后一层外的所有级别都被完全填充。最后一层必须从左侧填充。

什么是二叉堆?

二叉堆是二叉树的一个特例。二元堆有两种类型 -

  • Max Heap - 每个级别的父节点大于其子节点。

  • Min Heap - 每个级别的父节点都小于其子节点。

完全二叉树的数组表示

二叉堆可以表示为一个数组,因为它节省空间。如果父节点存储在索引I处,则左子节点可以通过2 * i + 1计算,右子节点可以通过2 * i + 2计算。假设索引从0开始。

堆排序算法

  • 从完整的二叉树构建最大堆。

  • 删除根并用堆中的最后一个元素替换它,将堆的大小减少 1,然后再次从剩余节点构建最大堆。

  • 重复步骤 2,直到我们只剩下 1 个节点。

从完整的二叉树构建最大堆

这是从完全二叉树构建最大堆的代码,其中两个子节点与根进行比较。如果较大的元素不是根,则将较大的元素与根交换。这是一个递归过程。小于其子节点的当前根不断与其较低的子树进行比较,除非它到达其正确位置。

下面的代码从一个完整的二叉树构建一个最大堆,它基本上是我们想要排序的数组。

def heapify(arr, n, i):
   # 在 root 和 children 中找到最大的
   largest = i
   l = 2 * i + 1
   r = 2 * i + 2
   if l < n and arr[i] < arr[l]:
      largest = l
   if r < n and arr[largest] < arr[r]:
      largest = r
   # 如果根不是最大的,与最大的交换并继续堆化
   if largest != i:
      arr[i], arr[largest] = arr[largest], arr[i]
      heapify(arr, n, largest)

堆排序

此时,我们拥有最大堆。现在我们需要做以下几件事。

  • 用堆中的最后一个元素交换根。

  • 将堆的大小减少1。(这意味着最大的元素已经到达最后一个位置,我们不需要考虑那个元素)。

  • 重建最大堆,不包括最后一个元素。

  • 重复上述步骤,直到我们只剩下 1 个元素。

for i in range(n-1, 0, -1):
   # 交换
   arr[i], arr[0] = arr[0], arr[i]

   # 堆化根元素
   heapify(arr, i, 0)

Python 中堆排序的完整程序如下 -

def heapify(arr, n, i):
   # 在 root 和 children 中找到最大的
   largest = i
   l = 2 * i + 1
   r = 2 * i + 2
   if l < n and arr[i] < arr[l]:
      largest = l
   if r < n and arr[largest] < arr[r]:
      largest = r
   # 如果根不是最大的,与最大的交换并继续堆化
   if largest != i:
      arr[i], arr[largest] = arr[largest], arr[i]
      heapify(arr, n, largest)

def heapSort(arr):
   n = len(arr)
   # 构建最大堆
   for i in range(n//2、-1、-1):
      heapify(arr, n, i)
   for i in range(n-1, 0, -1):
      # 交换
      arr[i], arr[0] = arr[0], arr[i]
      # 堆化根元素
      heapify(arr, i, 0)

arr = [1, 12, 9, 5, 6, 10]
heapSort(arr)
n = len(arr)
print("Sorted array is")
for i in range(n):
   print(arr[i], end=' ')

时间复杂度 - O(n logn)