学习笔记:舞蹈链 Dancing Links

这是一种奇妙的算法用来解决两个问题:

  1. 精确覆盖问题:给定一个矩阵,每行是一个二进制数,选出尽量少的行,使得每一列恰好有一个 (1)
  2. 重复覆盖问题:给定一个矩阵,每行是一个二进制数,选出尽量少的行,使得每列至少有一个 (1)

模板一般需要有两个:① 数据结构(十字链表)② dfs 框架

其中 ① 对于两个问题都是一样的,而 ② 不同问题不同框架。

精确覆盖问题

1. 如何存储这个矩阵:十字链表

由于 (0) 的信息冗余,我们只存 (1),不存 (0),复杂度可以做到和 (1) 的个数相关,这样就处理掉了那种稀疏图(行列很大,但 (1) 的个数很少的情况)。

十字链表 QWQ

  1. 对于所有 (1) 的位置建立节点。

  2. 看一下每个节点上下左右应该连向谁,这里十字链表是一个循环链表。举个例子,如果 ((x, y)) 上面没有节点,那么循环到最底下,然后再往上走,直到走到第一个 (1)

实际到代码实现,我们可以按行创建:

  1. 预备信息
const int N = 具体问题中 1 最多的点数。
int n, m, U[N], D[N], L[N], R[N], idx, s[N], hh, tt, X[N], Y[N];
/* 
n 为行数,m 为列数,U/D/L/R[i] 分别表示 i 节点上下左右的节点。
idx 为当前用了的点数, s[i] 表示第 i 列为 1 的有多少行。
hh, tt 用于加入点时两个端点。
X[i], Y[i] 表示 i 号点的 x, y 坐标
*/
  1. 首先第一行是哨兵(全 (1)),并且 ((0, 0)) 加入一个节点以便后续快速找到现在还有多少个 (1)
void inline init() {
	for (int i = 0; i <= m; i++)
		L[i] = i - 1, R[i] = i + 1, U[i] = D[i] = i;
	L[0] = m, R[m] = 0, idx = m;
}
  1. 每一次加入一行。然后考虑左右两个点 (hh, tt),每次动态把一个 (1) 插入到 (hh, tt) 之间。
void inline add(int x, int y) {
	X[++idx] = x, Y[idx] = y, s[y]++; 
	L[idx] = hh, R[idx] = tt, L[tt] = R[hh] = idx;
	U[idx] = U[y], D[idx] = y, D[U[y]] = idx, U[y] = idx;
	// 注意 U[y] = idx 必须在最后,因为其他东西需要用到之前的 U[y],即 idx 上面那个店。
	hh = idx;
} 
// 读入 n * m 的矩阵并按行加入
for (int i = 1; i <= n; i++) {
	hh = idx + 1, tt = idx + 1; // 可以理解为第一行第一个点左右都是自己。
	for (int j = 1, x; j <= m; j++) {
		scanf("%d", &x);
		if (x) add(i, j); // 如果 i, j 为 1,加入 (i, j)
	}
}

按行插入有趣的是,你只需要把它搞成一个循环链表就行了,甚至你随便左右的顺序也是可以过的,只要保持在同一行循环链表的性质就可以。

for (int i = 1; i <= n; i++) {
	hh = idx + 1, tt = idx + 1;
	len = 0;
	for (int j = 1, x; j <= m; j++) {
        scanf("%d", &x);
        if (x) d[++len] = j;
    }
    random_shuffle(d + 1, d + 1 + len); // 233
    for (int j = 1; j <= len; j++) add(i, d[j]);
}

QAQ

  1. 删除第 (p) 列及其关联的所有行。删除列的时候,只需要删除第一行对应的列,原因在于我们 dfs 时找是通过第一行的哨兵找;删除行的时候,只需要把行对应列的位置删掉(这列的 (s) 信息就不管了,反正以后也不用了),行相互作用是不需要删的,原因是不影响,且我们需要用行的信息恢复现场.jpg
void del(int p) {
	L[R[p]] = L[p], R[L[p]] = R[p];
	for (int i = D[p]; i != p; i = D[i]) {
		for (int j = R[i]; j != i; j = R[j]) {
			s[Y[j]]--, U[D[j]] = U[j], D[U[j]] = D[j];
		}
	}
}
  1. 按插入顺序撤销第 (p) 列,注意这里按照时间逆序操作即可,相互不影响的时间顺序可以改变。
void resume(int p) {
	L[R[p]] = p, R[L[p]] = p;
	for (int i = U[p]; i != p; i = U[i]) {
		for (int j = L[i]; j != i; j = L[j]) {
			s[Y[j]]++, U[D[j]] = j, D[U[j]] = j;
		}
	}
}

2. dfs 框架:针对精确覆盖问题。

每次任意选择未被选择的一行,判断能不能选。

剪枝:

  1. (1) 的个数最少的列。枚举这一列选哪个行。如果我们选择了这一列,接下来就不需要考虑这一列的影响了,所以我们可以把这一列删掉(十字链表的操作)。
  2. 选择一行,实际上是把这行所有 (1) 的列都选了,即删掉这些列,然后这些列关系到的行也都没了,把这些行也干掉,禁止套娃。有些人可能认为这会造成无休止的删,但实际上只会影响两次,为什么能,即选择一行 (Rightarrow) 删掉对应列 (Rightarrow) 废掉对应列的行,废掉和选择是不一样的,废掉就不会影响其他列了。

经过这两步,我们可以理解为,(dfs) 到当前的数据结构上都是没选的列和行,相当于每次选一行把问题转化成了更小规模,即选择一行,把与这行冲突的行删掉,并且删掉对应列,通过十字链表,我们做到了快速删除/查找。

bool inline dfs() {
	if (!R[0]) return true;
	int p = R[0];
	for (int i = R[0]; i; i = R[i])
		if (s[i] < s[p]) p = i;
	if (!s[p]) return false;
	del(p);
	for (int i = D[p]; i != p; i = D[i]) {
		ans[++top] = X[i];
		for (int j = R[i]; j != i; j = R[j]) del(Y[j]);
		if (dfs()) return true;
		for (int j = L[i]; j != i; j = L[j]) resume(Y[j]);
		--top;
	}
	resume(p);
	return false;
}

时间复杂度

约为 (O(c ^ n)),其中 (c) 是一个接近 (1) 的常数,(n) 为矩阵中 (1) 的个数。随机数据的话 (n) 到上万级别也没啥问题。(又是一个玄学复杂度的算法)。

例题

题目 (Rightarrow) 模型的转化,可以把每一个决策当成一行,限制当成一列,如果一个限制恰好一次那么就可以精确覆盖。

模板题

#include <iostream>
#include <cstdio>

using namespace std;

const int N = 5505, M = 505;

int n, m, U[N], D[N], L[N], R[N], idx, s[N], hh, tt, X[N], Y[N];

int ans[M], top;

void inline init() {
	for (int i = 0; i <= m; i++)
		L[i] = i - 1, R[i] = i + 1, U[i] = D[i] = i;
	L[0] = m, R[m] = 0, idx = m;
}

void inline add(int x, int y) {
	X[++idx] = x, Y[idx] = y, s[y]++; 
	L[idx] = hh, R[idx] = tt, L[tt] = R[hh] = idx;
	U[idx] = U[y], D[idx] = y, D[U[y]] = idx, U[y] = idx;
	hh = idx;
} 

// 删除第 p 列

void del(int p) {
	L[R[p]] = L[p], R[L[p]] = R[p];
	for (int i = D[p]; i != p; i = D[i]) {
		for (int j = R[i]; j != i; j = R[j]) {
			s[Y[j]]--, U[D[j]] = U[j], D[U[j]] = D[j];
		}
	}
}

void resume(int p) {
	L[R[p]] = p, R[L[p]] = p;
	for (int i = U[p]; i != p; i = U[i]) {
		for (int j = L[i]; j != i; j = L[j]) {
			s[Y[j]]++, U[D[j]] = j, D[U[j]] = j;
		}
	}
}

bool inline dfs() {
	if (!R[0]) return true;
	int p = R[0];
	for (int i = R[0]; i; i = R[i])
		if (s[i] < s[p]) p = i;
	if (!s[p]) return false;
	del(p);
	for (int i = D[p]; i != p; i = D[i]) {
		ans[++top] = X[i];
		for (int j = R[i]; j != i; j = R[j]) del(Y[j]);
		if (dfs()) return true;
		for (int j = L[i]; j != i; j = L[j]) resume(Y[j]);
		--top;
	}
	resume(p);
	return false;
}

int main() {
	scanf("%d%d", &n, &m);
	init();
	for (int i = 1; i <= n; i++) {
		hh = idx + 1, tt = idx + 1;
		for (int j = 1, x; j <= m; j++) {
			scanf("%d", &x);
			if (x) add(i, j);
		}
	}
	if (!dfs()) puts("No Solution!");
	else for (int i = 1; i <= top; i++) printf("%d ", ans[i]);
	return 0;
}

16 * 16 数独

行数:设空出的格子有 (n) 个,那么每个格子可以填 (16) 个字母,共 (n * 16) 行(决策)。

列数:即限制,每个格子恰好一个数字 (n+) 每行每列每个十六宫格每个数都出现恰好一次 (3n) (= 4n)

每行恰好 (4)(1),即格子的位置 (1),行列十六宫格位置 (1)

这样总点数是 (n imes 64 le 16384) 个格子,这题暴力强剪枝可过,所以 Dacing Links 显然也能过

#include <iostream>
#include <cstdio>
#include <cstring>
using namespace std;

const int N = 17, S = 4, P = 16385, M = N * N * N;

int n, m, U[P], D[P], L[P], R[P], X[P], Y[P], s[P];
int idx, ans[M], top, tot, hh, tt;
// 各自限制的状态编号

bool st[N];

char a[N][N];

struct Selection{
    int x, y;
    char c;
} e[M];

void inline clear() {
    n = idx = tot = top = 0, m = 1024;
    memset(s, 0, sizeof s);
}

void init() {
    for (int i = 0; i <= m; i++)
        L[i] = i - 1, R[i] = i + 1, U[i] = D[i] = i;
    L[0] = m, R[m] = 0, idx = m;
}

void inline add(int x, int y) {
    X[++idx] = x, Y[idx] = y, s[y]++;
    L[idx] = hh, R[idx] = tt, R[hh] = L[tt] = idx;
    U[idx] = U[y], D[idx] = y, D[U[y]] = idx, U[y] = idx;
    tt = idx;
}

void del(int p) {
    L[R[p]] = L[p], R[L[p]] = R[p];
    for (int i = U[p]; i != p; i = U[i]) {
        for (int j = R[i]; j != i; j = R[j]) {
            s[Y[j]]--, D[U[j]] = D[j], U[D[j]] = U[j];
        }
    } 
}

void resume(int p) {
    L[R[p]] = p, R[L[p]] = p;
    for (int i = D[p]; i != p; i = D[i]) {
        for (int j = L[i]; j != i; j = L[j]) {
            s[Y[j]]++, D[U[j]] = j, U[D[j]] = j;
        }
    } 
}

bool dfs() {
    if (!R[0]) return true;
    int p = R[0];
    for (int i = R[0]; i; i = R[i]) 
        if (s[i] < s[p]) p = i;
    if (!s[p]) return false;
    del(p);
    for (int i = U[p]; i != p; i = U[i]) {
        ans[++top] = X[i];
        for (int j = R[i]; j != i; j = R[j]) del(Y[j]);
        if (dfs()) return true;
        for (int j = L[i]; j != i; j = L[j]) resume(Y[j]);
        top--;
    }
    resume(p);
    return false;
}

int main() {
    while (~scanf("%s", a[0])) {
        clear();
        for (int i = 1; i <= 15; i++) scanf("%s", a[i]);
        // 把限制总状态数抠出来
        init();
        for (int i = 0; i < 16; i++) {
            for (int j = 0; j < 16; j++) {
                int l = 0, r = 15;
                if (a[i][j] != '-') l = r = a[i][j] - 'A';
                for (int k = l; k <= r; k++) {
                    hh = idx + 1, tt = idx + 1;
                    e[++n] = (Selection) { i, j, (char)(k + 'A') } ;
                    add(n, (j + 1) + i * 16), add(n, 16 * 16 + i * 16 + k + 1);
                    add(n, 16 * 32 + j * 16 + k + 1), add(n, 16 * 48 + (i / 4 * 4 + j / 4) * 16 + k + 1);
                } 
            }
        }
        dfs();
        for (int i = 1; i <= top; i++)
            a[e[ans[i]].x][e[ans[i]].y] = e[ans[i]].c;
        for (int i = 0; i < 16; i++) printf("%s
", a[i]);
        puts("");
    }
    return 0;
}

重复覆盖问题

基本搜索框架:IDA*,层数不能太多)

跟精确覆盖问题的区别就是,考虑选择一行,只会把它关联的所有列删掉,并不会套娃删行,这是因为同一列下 (1) 的行同时选并不冲突。

但这样会慢很多,需要加一个 IDA*。

估价函数是:

  • 枚举没选的列,选上所有的行,股价函数 (+1)

这种方法可以看作把这列的所有行并起来算成一个行了,这个东西经过大量经验表明整挺快。

注意,这里删的时候是把对应列在在那些行里删掉。

#include <iostream>
#include <cstdio>
#include <cstring>

using namespace std;

const int N = 10005, M = 505;

int n, m, U[N], D[N], L[N], R[N], idx, s[N], hh, tt, X[N], Y[N];

int ans[M], top, dep, d[M];

bool st[N];

void inline init() {
    for (int i = 0; i <= m; i++)
        L[i] = i - 1, R[i] = i + 1, U[i] = D[i] = i;
    L[0] = m, R[m] = 0, idx = m;
}

void inline add(int x, int y) {
    X[++idx] = x, Y[idx] = y, s[y]++; 
    L[idx] = hh, R[idx] = tt, L[tt] = R[hh] = idx;
    U[idx] = U[y], D[idx] = y, D[U[y]] = idx, U[y] = idx;
    hh = idx;
} 

// 删除第 p 列

void inline del(int p) {
    for (int i = D[p]; i != p; i = D[i])
        L[R[i]] = L[i], R[L[i]] = R[i];
}

void resume(int p) {
    for (int i = U[p]; i != p; i = U[i])
        L[R[i]] = i, R[L[i]] = i;
}

int inline h() {
    memset(st, false, sizeof st);
    int cnt = 0;
    for (int i = R[0]; i; i = R[i]) {
        if (st[i]) continue;
        cnt++;
        for (int j = D[i]; j != i; j = D[j])
            for (int k = R[j]; k != j; k = R[k]) st[Y[k]] = true;
    }
    return cnt;
}

bool inline dfs() {
    if (top + h() > dep) return false;
    if (!R[0]) return true;
    int p = R[0];
    for (int i = R[0]; i; i = R[i])
        if (s[i] < s[p]) p = i;
    if (!s[p]) return false;
    for (int i = D[p]; i != p; i = D[i]) {
        ans[++top] = X[i];
        del(i);
        for (int j = R[i]; j != i; j = R[j]) del(j);
        if (dfs()) return true;
        for (int j = L[i]; j != i; j = L[j]) resume(j);
        resume(i);
        --top;
    }
    return false;
}

int main() {
    scanf("%d%d", &n, &m);
    init();
    for (int i = 1; i <= n; i++) {
        hh = idx + 1, tt = idx + 1;
        for (int j = 1, x; j <= m; j++) {
            scanf("%d", &x);
            if (x) add(i, j);
        }
    }
    dep = 1;
    while(!dfs()) dep++;
    printf("%d
", dep);
    for (int i = 1; i <= dep; i++) printf("%d ", ans[i]);
    return 0;
}
原文地址:https://www.cnblogs.com/dmoransky/p/13834814.html