1A2B猜数字

知乎链接
维基百科

问题描述

又名猜数字。
一方准备从0到9十个数字里抽出4个数,随机排列,另一方同样以这样的方法回应四个数。位置相同数字相同为A,数字出现,位置不同为B,然后计数。
例1234
5678-0A0B
9012-0A2B
4321-0A4B
1243-2A2B

分析

这个问题关键在于估算备选答案带来的收益。比如题中说的4位数,那么每次决策都有10000种。不同的决策带来的信息量是不同的。我们所期望的是信息量快速增加。所以关键在于如何定义一个决策带来的收益(信息量)。

可以使用熵,熵是描述事物混乱程度的度量。但是我觉得用下面这种方式更好:

如果我猜数字x,你给出的答案(几个A几个B)最多有n*n种,将当前的可行解当做小球放入n*n个盒子。我需要考虑你给出答案之后,期望能够排除掉多少个可行解,排除掉的可行解的个数越多越好。记c1,c2,c3,c4..... C_{n*n} 分别表示你的答案对应的可行解的个数,这些数字之和(也就是可行解的个数)记为N。

那么,我猜数字x,你给出答案1的概率为 $frac{c_1}{N} $,这时剩余可行解的个数为$ c_1 $

你给出答案2的概率为$ frac{c_2}{N} $,这时剩余可行解的个数为$ c_2$

......

综上可知,我猜数字x,期望可行解的个数为$ frac{c_1}{N} imes c_1+frac{c_2}{N} imes c_2+...+frac{c_n}{N} imes c_n $

我们想要的是最优决策,最优决策之后,能够最大限度地缩小可行解范围。经过以上定义,就可以枚举全部决策,找到最有答案。

如果是4位数,需要建立一个10000*10000的大表。还是用3位数来说明一下吧。

n = 3
a = [[0] * 10 ** n for _ in range(10 ** n)]
valid = [1] * (10 ** n)


def bit(x, k):
    # 获取数字x的第k为数字
    return x // (10 ** k) % 10


def dif(x, y):
    # 计算x和y的dif结果,也就是p个数字位置数值都相同,q个数字数值相同位置不同
    p, q = 0, 0
    x_set = set()
    y_set = set()
    for i in range(n):
        if bit(x, i) == bit(y, i):
            p += 1
        else:
            x_set.add(bit(x, i))
            y_set.add(bit(y, i))
    q = len(x_set.intersection(y_set))
    return p * n + q


# 初始化数组
for i in range(10 ** n):
    for j in range(i + 1):
        a[i][j] = a[j][i] = dif(i, j)


def get_profit(cnt):
    """
    c1,c2,c3  N=c1+c2+c3  有c1/N的概率取c1,剩下的不确定度为c1(也就是不确定数字的个数)
    所以期望不确定度为:ci*ci/N
    这个概念类似基尼系数
    :param cnt:
    :return:
    """
    return -sum(i * i for i in cnt)


def if_guess(x):
    # 如果猜测x,会有多大的好处
    cnt = [0] * (n * n + 1)
    for res in range(n * n + 1):
        for i in range(10 ** n):
            if valid[i]:
                cnt[a[x][i]] += 1
    return get_profit(cnt)


def get_strategy():
    # 获取当前局面下的策略
    best_number = -1
    best_profit = 0
    for i in range(10 ** n):
        if valid[i]:
            profit = if_guess(i)
            if best_number == -1 or profit > best_profit:
                best_profit = profit
                best_number = i
    return best_number


def update(guess, ans):
    # 根据我的猜测和他的回答,更新当前备选答案
    for i in range(10 ** n):
        if valid[i]:
            if a[guess][i] != ans:
                valid[i] = False


def over():
    # 游戏是否结束
    return len([i for i in valid if i]) == 1


def read_eval():
    real_ans = 891
    while not over():
        x = get_strategy()
        print("guess", x)
        res = dif(real_ans, x)
        print("your ans", res // n, res % n)
        update(x, res)
        input()


read_eval()

原文地址:https://www.cnblogs.com/weiyinfu/p/9141287.html