群里一个算法题

  题目:

  某同学拿到一组数列 $ a_1, a_2, cdots , a_n $,他想知道存在多少个区间 $ [l, r] $ 同时满足下列两个条件:

    1. $ r - l + 1 = k $;

    2. 在 $ a_l, a_{l + 1}, cdots , a_r $ 中,存在一个数至少出现 t 次。

  要求要做的就是输出满足条件的区间个数

  input

    第一行输入三个整数 $ n, k, t (1 leqslant n, k, t leqslant 10^5) $

    第二行输入 n 个整数, $ a_1, a_2, cdots, a_n(1 leqslant a_i leqslant 10^5) $

  output

    输出区间个数。

  Example

  input

5 3 2
3 1 1 1 2

  output

3

  hint

  样例中,因为区间 $ [1, 3] $ 中 1 出现了 2 次,区间 $ [ 2, 4] $ 中 1 出现了 3 次, 区间 $ [3, 5] $ 中 1 出现了 2 次,所以一共有 3 个区间满足条件。

  这是在群里看到的一个题,感觉应该是一个dp题,但由于我太渣,推半天转移方程推不出来。。。决定先写一个暴力的试试,或者感觉可以维护一个区间树、树状树或者线段树。。。

  方法一:暴力算法太暴力,摒弃了。。。

  方法二:下面是一个简单的模拟算法。。

#include <iostream>
#include <minmax.h>
const int N = 100001;
using namespace std;
int main()
{
	int n, k, t, dp;
	int a[N], b[N];
	while (~scanf_s("%d %d %d", &n, &k, &t))
	{
		dp = 0;
		memset(b, 0, sizeof(b));
		for (int i = 0; i < n; i++)
		{
			cin >> a[i];
			b[a[i]]++;
			dp = max(dp, b[a[i]]);
		}
		if (k == 1) cout << n << endl;
		else if (t == 1) cout << n - k + 1 << endl;
		else if (k == n) if (dp == t) cout << "1" << endl;
			else cout << "0" << endl;
		else
		{
			dp = 0;
			for (int j = 0; j < n - k + 1; j++)
			{
				memset(b, 0, sizeof(b));
				for (int i = j; i < k + j; i++)
				{
					int c = ++b[a[i]];
					b[0] = max(b[0], c);
				}
				if (b[0] >= t) dp++;
			}
			cout << dp << endl;
		}
	}
	return 0;
}

  测试效果:

5 4 4
3 1 1 1 2
0
5 4 4
1 1 1 1 1
2
5 4 4
2 1 1 1 1
1
5 4 3
3 1 1 1 2
2
5 5 4
3 1 1 1 1
1
5 5 4
3 1 1 1 2
0
6 3 2
2 1 1 2 1 2
4
6 3 3
2 1 1 2 1 2
0
6 4 2
2 1 1 2 1 2
3
6 4 3
2 1 1 2 1 2
1

  算法分析:

  算法处理了几种情况的边界问题,以加快对边界情况的效率。(下面算法不考虑 memset() 的时间费用)

  case 1.显然当区间 $ k = 1 $ 时,$ t = 1 $ 才符合输入条件,如果 $ t eq 1 $ , 则不存在这样的区间满足条件。时间复杂度 $ O(1) $;

  case 2.当 $ t = 1 $ 时,我的答案是输出按 $ k $ 划分的区间个数即可,这是显然的。所以答案是 $ n - k + 1 $ 。时间复杂度 $ O(1) $;

  case 3.当 $ k = n $ 时,我们只需要知道给出的 $ n $ 个数中是否存在一个出现次数等于 t 的数,如果存在则输出 1,不存在输出 0 。时间复杂度 $ O(1) $;

  case 4.当 $ k = t $ 时,我们就只需要判断每个 $ k $ 区间中,是否存在一个数的出现次数等于 t,如果存在则 +1 。 时间复杂度 $ O((n - k) cdot k) = O(n cdot k) $

  case 5.其他情况,即 $ n eq k eq t eq 1 $ 时,我用了一个 $ O((n - k) cdot k^2) $ 的算法来移动区间并计算 dp。

  case 4.其他情况,一个时间复杂度为 $ O((n - k)cdot k) = O(n cdot k - k^2) = O(n cdot k) $ 的算法,空间复杂度 $ O(n) $。

  有趣的是,题目要求输入的 $ a_i geq 1 $ 所以,我可以放心的使用 $ b[0] $ 来记录每个区间出现最多的数的次数。

  方法三:树状数组。

  思路:将重复出现的数用 1 表示在树状数组中,只出现过一次的就置为 0,然后区间查询即可。

  算法复杂度

    空间复杂度:$ O(n) $。常数比前一个算法大一点儿。

    时间复杂度:预处理部分花费 $ O(n) $ 开销,每次需要检查所有区间,最外层循环 $ n - k $,然后,每个区间查询利用树状数组的 `query()` 开销 $ O(lgk) $,故而整体的开销为 $ O(n cdot lgk) $。

  代码:

#include <bits/stdc++.h>
using namespace std;
#define lowbits(x) (x&(-x))
const int N = 1000010;
int id[N], has[N], fenwick[N];
void upd(int n, int k, int x){while (k <= n) fenwick[k] += x, k += lowbits(k);}
int sum(int k)
{
    int ans = 0;
    while (k > 0) ans += fenwick[k], k -= lowbits(k);
    return ans;
}
int ask(int l, int r){return sum(r) - sum(l - 1);}
int main()
{
    int n, k, t, dots;
    memset(fenwick, 0, sizeof(fenwick));
    memset(has, 0, sizeof(has));
    cin >> n >> k >> t;
    for (int i = 1; i <= n; i++)
    {
        cin >> id[i];
        if (!has[id[i]])
            has[id[i]] = i;
        else {
            if (!fenwick[has[id[i]]])
                upd(n, has[id[i]], 1);
            upd(n, i, 1);
        }

    }
    dots = 0;
    for (int i = 1; i <= n - k + 1; i++)
        if (ask(i, k + i - 1) >= t) dots++;
    cout << dots << endl;
    return 0;
}

  

原文地址:https://www.cnblogs.com/darkchii/p/9602184.html