贪心算法的定义:
贪心算法是指在对问题求解时,总是做出在当前看来是最好的选择。也就是说,不从整体最优上加以考虑,只做出在某种意义上的局部最优解。贪心算法不是对所有问题都能得到整体最优解,关键是贪心策略的选择,选择的贪心策略必须具备无后效性,即某个状态以前的过程不会影响以后的状态,只与当前状态有关。
解题的一般步骤是:
1.建立数学模型来描述问题;
2.把求解的问题分成若干个子问题;
3.对每一子问题求解,得到子问题的局部最优解;
4.把子问题的局部最优解合成原来问题的一个解。
一.区间问题
给定N个闭区间[ai,bi],请你在数轴上选择尽量少的点,使得每个区间内至少包含一个选出的点。
输出选择的点的最小数量。
位于区间端点上的点也算作区间内。
输入格式
第一行包含整数N,表示区间数。
接下来N行,每行包含两个整数ai,bi,表示一个区间的两个端点。
输出格式
输出一个整数,表示所需的点的最小数量。
数据范围
1≤N≤105,
−109≤ai≤bi≤109
输入样例:
3
-1 1
2 4
3 5
输出样例:
2
证明
证明ans<=cnt :cnt 是一种可行方案, ans是可行方案的最优解,也就是最小值。
证明ans>=cnt : cnt可行方案是一个区间集合,区间从小到大排序,两两之间不相交。
所以覆盖每一个区间至少需要cnt个点。
#include <iostream>
#include <algorithm>
using namespace std;
const int N = 100010;
int n;
struct Range
{
int l, r;
bool operator< (const Range &W)const
{
return r < W.r;
}
}range[N];
int main()
{
scanf("%d", &n);
for (int i = 0; i < n; i ++ ) scanf("%d%d", &range[i].l, &range[i].r);
sort(range, range + n);
///遍历整个区间集合
int res = 0, ed = -2e9;
for (int i = 0; i < n; i ++ )
if (range[i].l > ed)
{
res ++ ;
ed = range[i].r;
}
//如果当前的这个点不能覆盖这个区间,就更新ed的值
//如果可以覆盖这个区间,就pass
printf("%d\n", res);
return 0;
}
给定N个闭区间[ai,bi],请你在数轴上选择若干区间,使得选中的区间之间互不相交(包括端点)。
输出可选取区间的最大数量。
输入格式
第一行包含整数N,表示区间数。
接下来N行,每行包含两个整数ai,bi,表示一个区间的两个端点。
输出格式
输出一个整数,表示可选取区间的最大数量。
数据范围
1≤N≤105,
−109≤ai≤bi≤109
输入样例:
3
-1 1
2 4
3 5
输出样例:
2
1、将每个区间按右端点从小到大进行排序
2、从前往后枚举每个区间,初始选定end值为无穷小
若当前区间中包含该点end,则直接跳过
否则,选择当前区间的右端点
证明:
(1)找到cnt个点,满足题意情况,则最优解Ans <= cnt
(2)找到cnt个点,即找到cnt个区间,且区间从左到右依次排好,且没有相同的交集,则说明可能有区间没有被这cnt个点覆盖过,所以最优解Ans >= cnt
则Ans == cnt,证毕
#include <iostream>
#include <algorithm>
using namespace std;
const int N = 100010;
int n;
struct Range
{
int l, r;
bool operator< (const Range &W)const
{
return r < W.r;// 使sort()按右端点升序排序
}
}range[N];
int main()
{
scanf("%d", &n);
for (int i = 0; i < n; i ++ ) scanf("%d%d", &range[i].l, &range[i].r);
sort(range, range + n);// 按右端点升序排序
int res = 0, ed = -2e9;// ed为无穷小
for (int i = 0; i < n; i ++ )
if (ed < range[i].l)
{
// 找到一个无法由当前点覆盖的区间
res ++ ; // 在数轴上放入新的点
ed = range[i].r; // 更新数轴上点的个数
}
printf("%d\n", res);
return 0;
}
给定N个闭区间[ai,bi],请你将这些区间分成若干组,使得每组内部的区间两两之间(包括端点)没有交集,并使得组数尽可能小。
输出最小组数。
输入格式
第一行包含整数N,表示区间数。
接下来N行,每行包含两个整数ai,bi,表示一个区间的两个端点。
输出格式
输出一个整数,表示最小组数。
数据范围
1≤N≤105,
−109≤ai≤bi≤109
输入样例:
3
-1 1
2 4
3 5
输出样例:
2
从前往后枚举每个区间,判断此区间能否将其放到现有的组中
1.如果一个区间的左端点比最小组的右端点要小,ranges[i].l<=heap.top() , 就开一个新组 heap.push(range[i].r);
2.如果一个区间的左端点比最小组的右端点要大,则放在该组, heap.pop(), heap.push(range[i].r);
每组去除右端点最小的区间,只保留一个右端点较大的区间,这样heap有多少区间,就有多少组。
步骤:
1.把所有区间按照左端点从小到大排序
2.从前往后枚举每个区间,判断此区间能否将其放到现有的组中
3.heap有多少区间,就有多少组
1. priority_queue<int, vector<int>, greater<int> > q; // 小顶堆
2. priority_queue<int, vector<int>, less<int> > q; // 大顶堆
#include <iostream>
#include <algorithm>
#include <queue>
using namespace std;
const int N = 100010;
int n;
struct Range
{
int l, r;
bool operator< (const Range &W)const
{
return l < W.l;
}
}range[N];
int main()
{
scanf("%d", &n);
for (int i = 0; i < n; i ++ )
{
int l, r;
scanf("%d%d", &l, &r);
range[i] = {
l, r};
}
sort(range, range + n);
priority_queue<int, vector<int>, greater<int>> heap;//我们的小根堆始终保证所有组中的最小的右端点为根节点
//用堆来存储组的右端点
for (int i = 0; i < n; i ++ )
{
auto r = range[i];
if (heap.empty() || heap.top() >= r.l) //如果当前队列为空,或者区间的端点小于小根堆的根(当前组的最小右端点)
heap.push(r.r);//那么这个区间就是一个大佬,和所有组都有仇,自己单开一组
else
{
heap.pop();//如果大于组当中的最小右端点,说明它至少肯定和这个组没有交集,没有交集那就把它归到这一组离
heap.push(r.r);//既然大于我们小根堆的根,也就说明把它该归到小根堆根所代表的这一组,根就失去了作用
//我们将跟去掉,用新的t.r来放入小根堆里,小根堆替我们自动找到所有组当中为所有组的最小右端点,并作为新根
}
}
printf("%d\n", heap.size());//我们就是用size来表示的组的
return 0;
}
给定N个闭区间[ai,bi]以及一个线段区间[s,t],请你选择尽量少的区间,将指定线段区间完全覆盖。
输出最少区间数,如果无法完全覆盖则输出-1。
输入格式
第一行包含两个整数s和t,表示给定线段区间的两个端点。
第二行包含整数N,表示给定区间数。
接下来N行,每行包含两个整数ai,bi,表示一个区间的两个端点。
输出格式
输出一个整数,表示所需最少区间数。
如果无解,则输出-1。
数据范围
1≤N≤105,
−109≤ai≤bi≤109,
−109≤s≤t≤109
输入样例:
1 5
3
-1 3
2 4
3 5
输出样例:
2
#include <iostream>
#include <algorithm>
using namespace std;
const int N = 100010;
int n;
struct Range
{
int l, r;
bool operator< (const Range &W)const
{
return l < W.l;
}
}range[N];
int main()
{
int st, ed;
scanf("%d%d", &st, &ed);
scanf("%d", &n);
for (int i = 0; i < n; i ++ )
{
int l, r;
scanf("%d%d", &l, &r);
range[i] = {
l, r};
}
sort(range, range + n);
int res = 0;
bool success = false;//判断是否成功,初值为失败
for (int i = 0; i < n; i ++ )
{
int j = i, r = -2e9;//如果每次不把r更新为-2e9的话,st和r相等,可能不会出现r<st的情况,如果无法覆盖的话,就会一直循环
while (j < n && range[j].l <= st)//双指针算法来更新左端点小于st的线段中,能够到大的最远位置
{
r = max(r, range[j].r);
j ++ ;
}
if (r < st)//当前右端点的最远位置不能到达下一线段的左端点,一定不能覆盖
{
res = -1;
break;
}
res ++ ;
if (r >= ed)
{
success = true;//只有从这个出口出去才被视作成功覆盖
break;
}
st = r;//更新下一次的st,i
i = j - 1;
}
if (!success) res = -1;
printf("%d\n", res);
return 0;
}
二.Huffman树
AcWing 148. 合并果子
在一个果园里,达达已经将所有的果子打了下来,而且按果子的不同种类分成了不同的堆。
达达决定把所有的果子合成一堆。
每一次合并,达达可以把两堆果子合并到一起,消耗的体力等于两堆果子的重量之和。
可以看出,所有的果子经过n-1次合并之后,就只剩下一堆了。
达达在合并果子时总共消耗的体力等于每次合并所耗体力之和。
因为还要花大力气把这些果子搬回家,所以达达在合并果子时要尽可能地节省体力。
假定每个果子重量都为1,并且已知果子的种类数和每种果子的数目,你的任务是设计出合并的次序方案,使达达耗费的体力最少,并输出这个最小的体力耗费值。
例如有3种果子,数目依次为1,2,9。
可以先将1、2堆合并,新堆数目为3,耗费体力为3。
接着,将新堆与原先的第三堆合并,又得到新的堆,数目为12,耗费体力为12。
所以达达总共耗费体力=3+12=15。
可以证明15为最小的体力耗费值。
输入格式
输入包括两行,第一行是一个整数n,表示果子的种类数。
第二行包含n个整数,用空格分隔,第i个整数ai是第i种果子的数目。
输出格式
输出包括一行,这一行只包含一个整数,也就是最小的体力耗费值。
输入数据保证这个值小于231。
数据范围
1≤n≤10000,
1≤ai≤20000
输入样例:
3
1 2 9
输出样例:
15
**Huffman树:**给定N个权值作为N个叶子结点,构造一棵二叉树,若该树的带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman Tree)。
#include <iostream>
#include <algorithm>
#include <queue>
using namespace std;
int main()
{
int n;
scanf("%d", &n);
priority_queue<int, vector<int>, greater<int>> heap;
while (n -- )
{
int x;
scanf("%d", &x);
heap.push(x);
}
int res = 0;
while (heap.size() > 1)
{
//取出最小的两个元素
int a = heap.top(); heap.pop();
int b = heap.top(); heap.pop();
res += a + b;
heap.push(a + b);//将它们的和入队
}
printf("%d\n", res);
return 0;
}
三.排序不等式
有 n 个人排队到 1 个水龙头处打水,第 i 个人装满水桶所需的时间是 ti,请问如何安排他们的打水顺序才能使所有人的等待时间之和最小?
输入格式
第一行包含整数 n。
第二行包含 n 个整数,其中第 i 个整数表示第 i 个人装满水桶所花费的时间 ti。
输出格式
输出一个整数,表示最小的等待时间之和。
数据范围
1≤n≤105,
1≤ti≤104
输入样例:
7
3 6 1 4 2 5 7
输出样例:
56
算法分析
安排他们的打水顺序才能使所有人的等待时间之和最小,则需要将打水时间最短的人先打水
证明:
#include <iostream>
#include <algorithm>
using namespace std;
typedef long long LL;
const int N = 100010;
int n;
int t[N];
int main()
{
scanf("%d", &n);
for (int i = 0; i < n; i ++ ) scanf("%d", &t[i]);
sort(t, t + n);
reverse(t, t + n);
LL res = 0;
for (int i = 0; i < n; i ++ ) res += t[i] * i;
printf("%lld\n", res);
return 0;
}
四.绝对值不等式
在一条数轴上有 N 家商店,它们的坐标分别为 A1~AN。
现在需要在数轴上建立一家货仓,每天清晨,从货仓到每家商店都要运送一车商品。
为了提高效率,求把货仓建在何处,可以使得货仓到每家商店的距离之和最小。
输入格式
第一行输入整数N。
第二行N个整数A1~AN。
输出格式
输出一个整数,表示距离之和的最小值。
数据范围
1≤N≤100000
输入样例:
4
6 2 9 1
输出样例:
12
核心要点 — 分组
要点: 将第一个和最后一个结合,第二个和倒数第二个结合····
共分为两种情况:
- 奇数个商店,中位数
- 偶数个商店,中间两个之间
f(x) = |x[1]-x| + |x[2]-x| + |x[3]-x| + ... +|x[n]-x|
这是一个绝对值不等式
求这个函数的最小值
f(x) = (|x[1]-x| + |x[n]-x|) + (|x[2]-x| + |x[n-1]-x|) + ... //分组的思想
我们取出其中一组 |x[1]-x| + |x[n]-x|
就是在x[1]和x[n]所在直线上找出一点x,使得这一点到两端点的距离和最小
这样可以看出x取在x[1]和x[n]之间比较优
此时原式==x[n]-x[1]
所以第一项的最小值就是( x[n]-x[1] )
所以第二项的最小值就是( x[n-1]-x[2] )
......
所以f(x) >= (x[n] + x[n-1] + x[n-2] + ... + x[mid]) - (x[1] + x[2] + x[3] + x[mid])
当且仅当x取到最中间的两个数之间的时候等号成立
也就是说,当x取到x[]序列的中位数的时候不等式取到最小值
所以,对于这道题来说
我们首先把所有商店的坐标排个序
然后找出中位数即可
如果是奇数个商店,那中位数就是最中间的商店
如果是偶数个商店,那中位数在最中间的两个商店之间,
取这两个商店的任意一个都是答案(因为是整形嘛)
作者:Shadow
链接:https://www.acwing.com/solution/content/5744/
来源:AcWing
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
#include <iostream>
#include <algorithm>
using namespace std;
const int N = 100010;
int n;
int q[N];
int main()
{
scanf("%d", &n);
for (int i = 0; i < n; i ++ ) scanf("%d", &q[i]);
sort(q, q + n);
int res = 0;
for (int i = 0; i < n; i ++ ) res += abs(q[i] - q[n / 2]);
printf("%d\n", res);
return 0;
}
五、推公式
AcWing 125. 耍杂技的牛
农民约翰的N头奶牛(编号为1…N)计划逃跑并加入马戏团,为此它们决定练习表演杂技。
奶牛们不是非常有创意,只提出了一个杂技表演:
叠罗汉,表演时,奶牛们站在彼此的身上,形成一个高高的垂直堆叠。
奶牛们正在试图找到自己在这个堆叠中应该所处的位置顺序。
这N头奶牛中的每一头都有着自己的重量Wi以及自己的强壮程度Si。
一头牛只撑不住的可能性取决于它头上所有牛的总重量(不包括它自己)减去它的身体强壮程度的值,现在称该数值为风险值,风险值越大,这只牛撑不住的可能性越高。
您的任务是确定奶牛的排序,使得所有奶牛的风险值中的最大值尽可能的小。
输入格式
第一行输入整数N,表示奶牛数量。
接下来N行,每行输入两个整数,表示牛的重量和强壮程度,第i行表示第i头牛的重量Wi以及它的强壮程度Si。
输出格式
输出一个整数,表示最大风险值的最小可能值。
数据范围
1≤N≤50000,
1≤Wi≤10,000,
1≤Si≤1,000,000,000
输入样例:
3
10 3
2 5
3 3
输出样例:
2
解题思路:
首先假设我们策略的答案是res,最优解的答案是cnt;
那么一定有 cnt<= res;
那么现在我们就需要去得到一种策略使得res <= cnt。那么我们的 res == cnt,也就的到了最终的答案。
假设我们用我们的策略已经对牛的顺序进行了安排(我们目前还不知道这个策略是什么)
解题过程:
#include <iostream>
#include <algorithm>
using namespace std;
typedef pair<int, int> PII;
const int N = 50010;
int n;
PII cow[N];
int main()
{
scanf("%d", &n);
for (int i = 0; i < n; i ++ )
{
int s, w;
scanf("%d%d", &w, &s);
cow[i] = {
w + s, w};
}
sort(cow, cow + n);
int res = -2e9, sum = 0;
for (int i = 0; i < n; i ++ )
{
int s = cow[i].first - cow[i].second, w = cow[i].second;
res = max(res, sum - s);//风险 = 上面的重量-当前的承受
sum += w;
}
printf("%d\n", res);
return 0;
}