一、题目

剑指 Offer 41 数据流中的中位数

题目详细描述

如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。

例如,

1
2
3
[2,3,4] 的中位数是 3

[2,3] 的中位数是 (2 + 3) / 2 = 2.5

二、分析

详细分析

  1. 传统方法

    求一个数据流的中位数,咋一看很简单。我们下意识的会想到直接用排序的方法,在每次查找中位数的时候,进行排序(快排,堆排,冒泡等皆可),利用中位数下标定位并返回中位数结果。但是这种方法对于频繁的求中位数,需频繁进行排序,时间复杂度太高,会超出时间限制。

  2. 堆堆求中位数方法

    数据结构准备

    在这里插入图片描述

    • 因为要求中位数,我们将数据分为两份,分别放在两个堆中。(利用堆顶具有该数据中最大或者最小值,也就是将整个数据流的分界线找到)

      1. 大数据堆:较大的数据,放在小顶堆(保证堆顶是大数据中最小值)

      2. 小数据堆:较小的数据,放在大顶堆(保证堆顶是小数据中最大值)
        在这里插入图片描述

      注意大数据堆和大顶堆的区别,大数据堆指的是存放两部分中较大的数据。上面看懂了可以忘掉大顶堆小顶堆,知道大数据堆和小数据堆即可,避免混淆

  • 如何添加元素

    1.当两个堆长度相等时,向大数据堆添加元素num(向小数据堆添加也可,同理)。添加时需注意得先向小数据堆添加num,由小数据堆重新得到堆顶最大值,将该值压入大数据堆。此举是为了保证新添加的元素先进入小数据堆,再由小数据堆选拔出最大值,送入大数据堆,保证两个堆顶依然是数据流的分界线

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-sMizPHmC-1637656336026)(D:\桌面\添加元素举例.png)]

    2.当两个堆长度不等时,也就是大数据堆长度大于小数据堆。向小数据堆添加元素。同理,先向大数据堆添加,由大数据堆选拔出最小元素送入小数据堆。保证两个堆顶依然是分界线。

  • 如何获取中位数

    1.当两个堆长度相等时。

    1
    return 0.5 * (maxHeap.top()+minHeap.top());

    2.当两个堆长度不等时,也就是大数据堆长度大于小数据堆。

    1
    return maxHeap.top();

总结方法:

优先队列、堆排序

三、代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
class MedianFinder {
/*
* 题目:剑指 Offer 41. 数据流中的中位数
* 描述:
* 方法:利用两个堆实现
* 实现:
*/
priority_queue<int, vector<int>, less<int>> maxHeap;//大顶堆,存放小数据,大的在栈顶。
priority_queue<int, vector<int>, greater<int>> minHeap;//小顶堆,存放大数据,小的在栈顶。
void MedianFinderB() {

}
/*
*
* 1.建立两个堆,左边小根堆存放大值(栈顶是大值中最小的),右边大根堆存放小值(栈顶是小值中最大的)。左边堆栈顶和右边堆栈顶就是所有值的分界线。
* 2.两边堆长度相等时。向左边堆添加元素,但是需要先添加到右边堆,然后将右边堆栈顶的元素转移至左边堆。
保证左边堆栈顶和右边堆栈顶元素大小顺序是连续的。
* 3.在两边堆长度不相等的时候(一定是左边大于右边)。向右边堆添加元素,但是需要先向左边堆添加元素,然后将左边堆
栈顶最大元素移到右边堆。此时保证左边堆栈顶和右边堆栈顶元素大小顺序是连续的。
*
*
*
*/
void addNumB(int num) {
if (maxHeap.size() == minHeap.size()) {
minHeap.push(num);
int minVal = minHeap.top();
minHeap.pop();
maxHeap.push(minVal);
}
else {
maxHeap.push(num);
int maxVal = maxHeap.top();
maxHeap.pop();
minHeap.push(maxVal);
}
}

double findMedianB() {
if (maxHeap.size() == minHeap.size()) {
return 0.5 * (maxHeap.top()+minHeap.top());
}
else {
return maxHeap.top();
}
}
}