大多数人的意见就是正确的？美科学家开发出纠错新算法-科技世界网

院校

科技世界网 > 科技院校 > 教研成果

大多数人的意见就是正确的？美科学家开发出纠错新算法

2017-02-10 09:46:36 来源：科学网

内容摘要

群众智慧不靠谱怎么办？美国科学家开发出纠错新算法，这种新算法更有效地找出正确答案的比例高出了21%至36%。它更加善于回答“是”与“非”的问题。

正确的答案并非总是最受欢迎的那一个。大多数人的意见也有不正确的时候，美国麻省理工学院的科学家就根据这一现象开发出一种新的纠错算法。

但在有些情况下，这一经典理论将面临着分崩离析的危险。如果你问一群人，费城是不是美国宾夕法尼亚州的首府，大多数人都会错误地回答“是”。这是因为他们知道这样一组事实——费城是宾夕法尼亚州的一座大型城市，而省会城市往往是巨大的。但另一群更少的人会给出正确的答案：哈里斯堡。

由剑桥市麻省理工学院社会科学家Drazen Prelec率领的一个研究小组在日前出版的《自然》杂志上报告称，一种新的算法可以帮助正确的答案从人群中脱颖而出，即便最流行的答案是错误的也没有关系。

在这项研究中，科学家要求试验受试者回答一组给定的问题。随后研究人员要求这些受试者猜测其他人会怎样回答这些问题。新的算法之后便会寻找那些“出人意料流行”的答案，抑或是比大多数受试者所认为的更加流行的答案。在大多数情况下，超出预期的答案往往是正确的。

大多数人的意见就是正确的？美科学家开发出纠错新算法科技世界网

Prelec表示：“在社会中，我认为有这样一个假设，即平均意见一般是正确的，这是受到过去对群众智慧的统计参数所支持的。”他说：“但这不是证据应有的工作方式。这里有具备专门知识的专家，比如医生。这让我们了解了这些知识。”

Prelec和他的同事向由20名到51名受试者组成的不同小组询问了各种各样的问题。这些问题有时是简单的地理知识，例如省会城市的名称；有时则要求受试者评估艺术的价值，以及要求皮肤科医生诊断皮肤损害。

Prelec说，大多数情况下，与其他方法（例如依靠最流行的答案或者根据信心给答案排名）相比，这种新算法更有效地找出正确答案的比例高出了21%至36%。它更加善于回答“是”与“非”的问题，例如费城是哪里的首府，而不是评估艺术的价值。

加利福尼亚大学尔湾分校认知科学家Mark Steyvers指出：“这是一项非常聪明的技术，也是对投票的人来说非常简单的一种方式。”

Steyvers指出，在现实生活中，人们互相询问彼此的背景和能力，从而用来确定其信息的有效性。他说，但是在匿名投票的情况下，Prelec的方法是依据专业知识来确定观点的好方法。

然而Prelec和Steyvers都警告称，这一算法并不能解决生活中遇到的所有难题。它只适用于真实的话题，即人们不得不以老式的方式找出政治和哲学问题的答案。

科学家首次打造出可“自检查、自纠错”的量子电路

要实现量子计算的梦想，就必须先克服一些困难，比如保持存储系统的稳定——即克服量子计算信息的基本单元(量子位/qubit)所固有的不稳定性。好消息是，来自美国加州大学伯克利分校的物理学家们，已经打造出了一个突破性的电路，它能够不断地自我检查、以保持量子存储始终处于无差错的状态。

量子信息很容易遇到由环境所引发的错误，比如宇宙射线、或者一个位置的量子相干(quantum coherence)崩溃，这意味着包含一个量子位的信息很容易丢失。

此外，由于量子纠缠态的特殊性，任何试图复制信息的行为，都会对它造成即时的破坏。

不过，身为一名研究生的UC Berkeley约翰·马蒂尼物理实验室研究员Julian Kelly表示：“量子计算的一个最大挑战，就是量子比特本身出现了问题(inherently faulty)。所以如果你在里面存储了一些信息，它们是会被忘记的”。

该团队并未尝试维持一个量子比特(比方说将其诱捕到硅的同位素中)，而是通过某种基于算法的方式来实现。

不同于传统计算机，量子计算机不使用二进制(0和1)来存储数据，因为它还拥有另一种“叠加态”(superpositioning)，即它既可以是0、也可以是1。

尴尬的是，尽管这一特性让它在计算能力方面拥有显著优点，但量子位也有一个显著的缺点，那就是量子位很容易出现“翻转”(flipping,状态随机地改变)，而且在不稳定的环境中会更加严重。

大多数人的意见就是正确的？美科学家开发出纠错新算法科技世界网

Kelly说到：“这使得我们很难处理信息，如果它消失了的话”。为了解决这个问题，他们想出了全新的错误检测和校正方法——将信息同时存储在多个量子位上。

该团队的想法是：“我们打造了一套包含9个量子比特、然后可以查找错误的系统。网格中的量子位负责维护其邻位信息(通过重复的误差检测和校正)，如此一来，相应的信息就可以保存得比任何单独的量子位都更长久更准确”。

这么做的必要之处在于，量子态存在于量子比特之中：你可以知道一个粒子的位置，也可以衡量它的动量(momentum)，但却不能同时使用。

该校博士后研究员Rami Rarends称：“你不能衡量一个量子态，不能给期望它仍然是个量子。测量的行为会将量子比特锁定到一种单一的状态，而它也失去了成为叠加态的能力”。

为了做到这点，该校科学家兼工作人员Austin Fowler使用了所谓的“表面代码”(Surface code)，以提供有关错误的信息。

通过反复测量矩阵中每个量子位与其相邻数据的相互作用，测量值的变化就暗示了空间和时间上出现了错误。

简而言之，该代码借用了“奇偶校验值”(parity information)来检测原始数据的任何变化。

在这种状态下，如果偏振状态被施加到了一组量子位上，那么这些量子位就会被传送到系统中的其它地方，而任何极化变化都可以通过原始状态和传输过来的量子状态的比对而得知。

最终，我们可以拉出足够的信息来检测错误，但又不会因为“偷窥”而破坏底层的量子态。

截至目前，该团队的研究已经证明了可将一个量子位的“翻转”错误给否定掉。不过他们希望下一步能够解决其它量子位“退相干”(decoherence)问题，比如对“相位翻转”错误进行“互补”。

Martinis团队的高级研究人员们现在也有与Google进行合作，以便进一步探索该技术和研究量子计算的应用。相关论文已经发表在《自然》(Nature)杂志上。

几分钟“搞定”蛋白质分子3D结构机器学习新算法加速药物研发进程

加拿大多伦多大学的科研人员最新研制出了一套新的机器学习算法，能生成微小蛋白质分子的3D结构。研究人员指出，新算法有望彻底变革药物的研发进程以及我们对生命的理解。

　　研发人员之一、多伦多大学的博士生阿里·普勒贾尼解释称，确定蛋白质分子的3D原子结构对于理解它们的工作原理及其对药物治疗产生何种反应至关重要。

　　药物会附着到特定蛋白质分子上，改变其3D形状及工作方式。理想的药物一般被设计成某种特定形状，使其仅附着到某个特定的蛋白质或与疾病相关的蛋白质上，而且在其附着到体内其他蛋白质上时不会出现副作用。

大多数人的意见就是正确的？美科学家开发出纠错新算法科技世界网

鉴于蛋白质比光波波长还小，如果不使用复杂技术，如冷冻电子显微镜（Cryo-EM）技术，无法直接看见它们。Cryo-EM技术使用高能显微镜，从不同方位将冷冻蛋白质的样本拍摄出成千上万张低清晰度图像，但用这些低清晰度2D图像拼接出正确的高清3D结构非常困难。

　　而新算法使用显微图像重建了蛋白质分子的3D结构，提供了一种更快速、有效地获得正确蛋白质结构的方式。研究人员称，现有技术需要花费数天甚至数周，借助多台计算机才能生成一个3D结构，而新方法借助单台计算机几分钟就能搞定，有望极大地推动新药研发。

　　多伦多大学计算和数学科学学院院长戴维·弗利特解释说：“新方法主要解决了获得3D结构的速度和数量方面的问题。”

　　普勒贾尼表示：“我们希望这一方法能大大加快新药研发进程，并让我们能从原子层面加深对生命的理解。”

Facebook田渊栋：德州扑克上战胜人类的AI究竟用的是什么算法？

最近听说我的母校卡耐基梅隆大学德州扑克的AI Libratus以很大的优势赢得了与职业玩家的比赛，非常兴奋。在同时期，还有一篇来自加拿大阿尔伯塔大学（Univ of Alberta）的文章介绍了DeepStack，同样在3000局的比赛中击败了几位职业玩家。这样在非对称信息游戏上人类再一次输给了AI。

当然有AlphaGo的先例，这个对广大吃瓜群众的冲击可能没有那么大。但我个人觉得非对称信息博弈的实用价值更大些。因为非对称信息博弈的应用范围非常广泛，涵括我们每天遇到的所有决策，上至国家战略，下至日常琐事，全都可以以同样的方法建模。

非对称信息博弈难在哪里？

一方面是因为对于同样的客观状态，各个玩家看到的信息不同，因此增加了每个玩家状态空间的数目和决策的难度；

另一方面即使在同样的状态数下，解非对称信息游戏所需要的内存也要比解对称信息要多得多，这个主要是对于对称信息博弈来说，只要记得当前局面并且向下推演找到比较好的策略就可以了；但对非对称信息博弈，只记得当前（不完整的）局面是不够的，即使盘面上的情况相同，但对手之前的各种招法会导致事实上局面不同，只有把它们全都罗列出来进行分析，才能保证想出的应对策略不被别人利用。

比如说玩石头剪刀布，在看不到别人出招的时候轮到自己出招，如果别人一直用石头剪刀布各1/3的混合策略，那自己就会发现好像怎么出招收益都是0，于是每次都出石头，但是这样的话，对手就可以利用这个策略的弱点提高自己的收益。所以一个好的算法就要求，基于别人已有策略得到的新策略尽可能地少被别人利用(low exploitability)。

这次的游戏是Head-up unlimited Texas Hold'em，直译过来是两人无限注德州扑克。所谓两人就是一对一的零和游戏，不是多人游戏。所谓无限注，就是在加筹码的时候可以任意加（比如著名的把全部筹码都押上的All in），而限注（limited），是指在加筹码的时候只能加一个固定的数字（通常是前两轮和大盲注一样，后两轮是大盲注两倍）。

大多数人的意见就是正确的？美科学家开发出纠错新算法科技世界网

两人有限注德州扑克（HULHE）因为玩家的选择比较少可以暴力计算，已经在2015年被Univ of Alberta解决，得到的策略离纳什均衡点非常近了（见这篇文章，发上了Science，AI叫Cepheus，用的方法是CFR+）。

这次CMU和Alberta用的方法，也和之前的类似，都是Counterfactual regret minimization (CFR)的变种。这次的主要贡献在于：

DeepStack用上了Continuous Resolving，即动态地解子游戏以避开存储海量策略时内存不足的问题，还有值网络；

CMU用了endgame solving以细化状态空间和策略空间，当然他们的文章似乎还没有公布，细节还不明朗（比如说剪枝应该是用上的）。

CFR的思路非常简单，从随机策略开始，每次优化一个玩家的策略以提高其收益并反复迭代，最后取平均策略作为最终策略。每次优化用的是悔恨值最小化（Regret minimization）的办法，所谓悔恨值就是事后最优选择的收益，减去当时选择的收益，悔恨值最小化就是把到目前为止的累计悔恨值拿过来，看哪一步累计悔恨值高，以后就多走这一步，至于多走的概率，有各种算法（比如说Regret Matching和Hedge）。

对于两人零和游戏，可以证明CFR会收敛到纳什均衡点，也就是“反正我就这么一招，你怎么也破不了”这样的终极招数。所以计算机现在使用的算法，最终目的并不是要利用对方弱点获得胜利，而是找出神功以达到无人可敌的境界。当然要达到这个境界，训练过程中仍然是不断找对方弱点让自己变强。

CFR是个带有理论界的通用算法，说它可以解决一切的非对称信息博弈问题也不为过。但是世界上自然没有免费午餐，在跑CFR的时候，每次都要遍历一次游戏所有可能的状态，而任何一个稍微复杂点的游戏都有指数级的状态，所以运行时间上肯定是不能接受的。

这就有很多折中办法，比如说状态量化（认为2到9都是小牌用同一个策略处理），剪枝（对方不太可能走这一步，那就不用再搜索下去了），随机采样（采样一些路径以代替全部的游戏分支），函数拟合（比如说用值网络来代替深层搜索），等等。

总的来说，CFR和几年前的RL很像，都是传统AI的带理论界的老方法，都是在现实问题中有指数复杂度，都是现在渐渐开始深度学习化，所以我相信以后会有更广阔的发展。

（如需转载，请注明来源自科技世界网）

关键字相关信息：

图说科技

科技热榜