个大小为n的数组,里面的数都属于范围[0, n-1],有不确定的重复元素,找到至少一个重复元素,要求O(1)空间和O(n)时间。
这个题目要求用O(n)的时间复杂度,这意味着只能遍历数组一次。同时还要寻找重复元素,很容易想到建立哈希表来完成,遍历数组时将每个元素映射到哈希表中,如果哈希表中已经存在这个元素则说明这就是个重复元素。因此直接使用C++ STL中的hash_set可以方便的在O(n)时间内完成对重复元素的查找。
但是题目却在空间复杂度上有限制——要求为O(1)的空间。因此采用哈希表这种解法肯定在空间复杂度上是不符合要求的。但可以沿着哈希法的思路继续思考,题目中数组中所以数字都在范围[0, n-1],因此哈希表的大小为n即可。因此我们实际要做的就是对n个范围为0到n-1的数进行哈希,而哈希表的大小刚好为n。对排序算法比较熟悉的同学不难发现这与一种经典的排序算法——基数排序非常类似。而基数排序的时间空间复杂度刚好符合题目要求!因此尝试使用基数排序来解这道面试题。
下面以2,4,1,5,7,6,1,9,0,2这十个数为例,展示下如何用基数排序来查找重复元素。
下标
0
1
2
3
4
5
6
7
8
9
数据
2
4
1
5
7
6
1
9
0
2
(1)由于第0个元素a[0] 等于2不为0,故交换a[0]与a[a[0]]即交换a[0]与a[2]得:
下标
0
1
2
3
4
5
6
7
8
9
数据
1
4
2
5
7
6
1
9
0
2
(2)由于第0个元素a[0] 等于1不为0,故交换a[0]与a[a[0]]即交换a[0]与a[1]得:
下标
0
1
2
3
4
5
6
7
8
9
数据
4
1
2
5
7
6
1
9
0
2
(3)由于第0个元素a[0] 等于4不为0,故交换a[0]与a[a[0]]即交换a[0]与a[4]得:
下标
0
1
2
3
4
5
6
7
8
9
数据
7
1
2
5
4
6
1
9
0
2
(4)由于第0个元素a[0] 等于7不为0,故交换a[0]与a[a[0]]即交换a[0]与a[7]得:
下标
0
1
2
3
4
5
6
7
8
9
数据
9
1
2
5
4
6
1
7
0
2
(5)由于第0个元素a[0] 等于9不为0,故交换a[0]与a[a[0]]即交换a[0]与a[9]得:
下标
0
1
2
3
4
5
6
7
8
9
数据
2
1
2
5
4
6
1
7
0
9
(6)由于第0个元素a[0] 等于2不为0,故交换a[0]与a[a[0]]即交换a[0]与a[2],但a[2]也为2与a[0]相等,因此我们就找到了一个重复的元素——2。
下标
0
1
2
3
4
5
6
7
8
9
数据
2
1
2
5
4
6
1
7
0
9
import junit.framework.Assert;
import org.junit.Test;
public class ExampleUnitTest {
int findMoreThanOne(int[] data) {
if (data == null) {
return -1;
}
for (int i = 0; i < data.length; i++) {
if (data[i] == i) {
} else {
while (data[i] != data[data[i]]) {
int temp = data[data[i]];
data[data[i]] = data[i];
data[i] = temp;
}
if (data[i] == data[data[i]]){
return data[i];
}
}
}
return -1;
}
@Test
public void addition_isCorrect() {
int data = findMoreThanOne(new int[]{1,2,1,0});
Assert.assertEquals(data, 2);
}
}