斜率优化学习笔记

斜率优化学习笔记

概论:对形如(dp[i]=min(dp[j]+c[i]*c[j]))类型的转移方程的优化,其中有关于((i,j))的乘积项的式子。

例题:洛谷P2365 任务安排

题目描述

(N)个任务排成一个序列在一台机器上等待完成(顺序不得改变),这(N)个任务被分成若干批,每批包含相邻的若干任务。从时刻0开始,这些任务被分批加工,第(i)个任务单独完成所需的时间是(T_i)。在每批任务开始前,机器需要启动时间(S),而完成这批任务所需的时间是各个任务需要时间的总和(同一批任务将在同一时刻完成)。每个任务的费用是它的完成时刻乘以一个费用系数(F_i)。请确定一个分组方案,使得总费用最小。

例如:(S=1);(T={1,3,4,2,1});(F={3,2,3,3,4})。如果分组方案是({1,2})({3})({4,5}),则完成时间分别为({5,5,10,14,14}),费用(C={15,10,30,42,56}),总费用就是153。

输入输出格式

输入格式:

第一行是(N(1<=N<=5000))

第二行是(S(0<=S<=50))

下面N行每行有一对数,分别为(T_i)(F_i),均为不大于100的正整数,表示第(i)个任务单独完成所需的时间是(T_i)及其费用系数(F_i)

输出格式:

一个数,最小的总费用。


先考虑(O(N^2))的做法

因为分的批数是不定的,所有我们为了避免算后面的时候要用到前面分了多少批这个状态,我们采用费用提前的思想,在处理前面时把(S)产生的费用给计算了。

方程:(f[i])代表前(i)个任务分成若干批产生的最小费用

转移:(f[i]=min_{i=0}^{i-1}(f[j]+t[i]*(c[i]-c[j])+S*(c[n]-c[j])))
其中,(t,c)分别是任务时间和费用的前缀和的数组

考虑将状态转移方程化简:
(f[j]=(S+t[i])*c[j]+f[i]-t[i]*c[i]-S*c[n])
注意:我们这里把(min)去掉了,是把(j)的取值集合所映射的(f[j])(c[j])分别作为函数的(f(x))(x)

那么这个一次函数的斜率(k)就等于((S+t[i])),而截距(b)等于(f[i]-t[i]*c[i]-S*c[n])

我们想让这个(f[i])最小,那么其实就等价于(b)最小,在坐标系中,如果我们拿一个已知斜率的直线向上滑动,当它第一次碰见取值集合内的点((c[j],f[j]))时,就取到了它的最小值

1.考虑什么时候一个点可以取到最小值

通过手玩我们发现(对于这个手玩真的是最好的理解方式了)

对于点(J_2),当以(x)为关键字排序后的两个相邻的点(J_1)(J_3)(在此题中对应(c[j])的单调性)

当斜率(k_1<k_0<k_2)时,此点就是最优转移点

2.考虑什么时候一个点可能可以取到最小值,什么时候一定不能

如下图,当斜率(k_1<k_2)时,(J_2)是有机会的,此时三个点下凸

当斜率(k_1>=k_2)时,(J_2)不会有一点机会,此时三个点上凸

此时我们就可以用单调队列维护一个点集了,其中相邻点的斜率(k)必定是递增的

当需要做出决策的时候,我们二分这个点集,找到最优转移点。

针对于此题,我们发现每个决策点的斜率(S+t[i])是单调递增的,那么我们可以直接维护队首,保证每次从队首转移。即当当前斜率大于队首与第二个点之间的斜率时,就出队。

统计完答案后再用二元组((f[i],c[i]))更新队尾的元素,然后将它放进去


Code:

#include <cstdio>
#include <cstring>
const int N=5010;
int f[N],t[N],c[N],n,S,q[N],l,r;
int main()
{
    scanf("%d%d",&n,&S);
    for(int i=1;i<=n;i++)
    {
        scanf("%d%d",t+i,c+i);
        t[i]+=t[i-1];
        c[i]+=c[i-1];
    }
    memset(f,0x3f,sizeof(f));
    f[0]=0;
    l=1,r=1;//注意此时已经把0作为元素放入了q[1]中去了
    for(int i=1;i<=n;i++)
    {
        while(l<r&&f[q[l+1]]-f[q[l]]<=(S+t[i])*(c[q[l+1]]-c[q[l]])) l++;
        f[i]=f[q[l]]+t[i]*c[i]+S*c[n]-c[q[l]]*(S+t[i]);
        while(l<r&&(f[i]-f[q[r]])*(c[q[r]]-c[q[r-1]])<=(f[q[r]]-f[q[r-1]])*(c[i]-c[q[r]])) r--;
        q[++r]=i;
    }
    printf("%d
",f[n]);
    return 0;
}


2018.7.16

原文地址:https://www.cnblogs.com/butterflydew/p/9319788.html