记得读书的时候,我的老师曾经提到过当年他为什么选择计算机视觉和人工智能这个方向。 他说,他曾经参加过人工智能之父明斯基的讲座。 老先生上来就问了一个问题: How human brain works? 做AI的人, 其实终极目标一直是如何做出像人一样聪明的机器,这是一个历史使命, 要代代穿传。 创始人时代做不出, 就传给我的老师那一代, 之后再传给我们。 我写这篇文章的目的是想说, 也许或许我们不用再往下传了, 我们这一代就能解掉这个问题。 以下是详解。
这篇文章要不要写, 我其实犹豫了很长时间, 脑子里有很多想法, 模模糊糊有些答案,但是并不确切。 写文章应当能经得起历史考验。 万一错了, 被打脸会很丢人。想来想去还是把不成熟的想法写下来, 读者君们一起思想碰撞, 会进步的更快, 想的更明白。
先说为什么我觉得我们这一代能解决掉AI的问题,并不是我们比前辈们聪明, 归根结底是计算能力,我们赶上了好时候。 大脑的计算能力是多少, 有各种估测数字。 什么时候计算机的计算能力超过大脑, 也有各种估测。 其实这些数字都是胡扯, 你连大脑是怎么计算的都还没搞清楚的, 怎么评估计算能力? 那种算算神经细胞个数,然后把神经细胞当作一个计算单元来统计的都是伪科学。但是为什么我还是敢说我们这一代能遇上计算机计算能力超过大脑? 因为有摩尔定律, 就算估计不准,差了2个数量级, 也不过是十年功夫的事情。 基本上, 我的个人预测(胡猜),与人体同等重量的计算机计算能力超过人脑, 大约在2018-2019年。 这里耍了个流氓, 没有拿大脑的重量和计算机比, 大脑和人体的重量差了几十倍, 对摩尔率来不过不到十年功夫。
计算能力是物质基础, 硬约束, 没有计算能力都是空想。 有了计算能力, 可以谈算法了, 也就是软件。 大脑是怎么工作的? 这里面关键是工作的原理, 就像造飞机一样, 研究了鸟以后, 科学家发现了伯努利原理, 造出了跟鸟的飞行方式不一样的飞机。 AI的伯努利原理是什么?
要想从功能上模仿大脑,回避不开的问题是如何理解人类智能。 大脑的功能又多又复杂, 一眼望不到边, 从何入手。 怎么建立理论框架。 解题的思路在心理学, 心理学一直是研究人的。 心理学三大门派, 精神分析,行为主义, 人本主义都对人是什么有自己的理解和研究方法。 自心理学之父冯特之后心理学已经研究人有快两百多年了。其中以佛洛依德的提出的, 本我, 自我, 超我的模型最流行。 本我是动物性, 是生存本能, 是条件反射层面的东西。 自我是逻辑, 是理性判断和分析, 超我是社会性, 是道德和思想。 这个思路, 正可以用来指导AI, 目前AI做到的东西, 大致也可以这样分。 以下分开来说:
本我:语音,视觉都是自我层面的东西,对应于潜意识。 人类生存的基本技能, 我们还没学会,但是可以 一个一个技能做, 慢慢来。深度神经网络发明之后,大大提高了大家做出这个层面东西的信心。 究其原因, 本我是对外部世界的基本理解和直接反馈, 解决的问题是如何从外部世界抽出概念这个关键的东西。 并做出相应的直接反馈,那么我们要学习一个从外部表象, 比如语音, 图像, 到内部概念的映射关系。 深度神经网络学这个映射大大的有效。 为什么会这样?
MIT的几个物理学家最近有个理论给出了解释。 他们说自然世界是建立在简单的物理规律之上的(这些规律甚至大部分都是线性的)。不同的线性规律相互作用,产生了非线性,比如双线性插值就是个简单的例子。 有了非线性, 加上耗散结构自组织,最后就能形成了五彩缤纷的现实世界。所以归根接地,世界就是一个大的分层网络产生的, 用分层网络来理解,做这个逆向过程,当然有效。 这样同样可以解释为什么大脑也这么厉害, 大脑的分层神经元结构不也是干这个的?
自我: 有了映射关系, 我们可以从外部世界走到内心世界了, 但是本我的内心世界很简单, 就是一些状态,和对应的简单逻辑, 比如分了多少类, 每一类该怎么做。 AI一开始做的玩具世界,就是搞搞类似的逻辑, 所以用LISP语言描述这个就可以。 当年计算能力不够, 玩不了外部世界到内部世界的映射, 前辈们只好玩玩具模型, 积木世界,也真是不容易。 也愈加佩服他们的聪明才智。
但是对应人的自我, 这些简单的状态和逻辑是远远不够的, 这里面有几个关键的东西要弄明白, 什么是知识? 什么是通用知识? 什么是记忆?最最重要的是,什么是自我意识?
先说知识, 搞知识表示的人研究这个很久很久了, 语义网络, 概念层次网络, 还有个语义互联网的RDF标准, 在他们看来,知识是一种概念直接的联系, 语义联系,确定性关系。 比如RDF标准,核心是一个三元组, 从一个概念,到另外一个概念,加上中间的链接关系, 就是知识。 RDF折腾了十几年了, 仍然只有有限的应用。 为什么不成功?各种解释原因都有, 在我看来, 是走错了路。 知识是确定性的关系吗?大错特错, 知识从来就是不确定的, 动态变化的, 所以要表示知识,不能用确定性网络, 要用概率网络, 也就是贝叶斯网络。 这里就不展开了。
有了知识,就可以谈谈通用知识。 所谓通用智能, 大家说计算机笨,AI笨,一般指责最多的就是这个。 计算机就是工具嘛,智能干一些特定的事情,而且还做不好。 这种指责其实相当没有道理, 刚开始学说话的小孩,学一个词都不容易, 你问他为什么不会作诗? 从知识到通用知识,是一个慢慢积累的过程, 这里面有没有过不去的门槛,量变引起质变。 仅此而已。
再说什么是记忆? 其实人的记忆很复杂,有短期记忆, 有长期记忆, 有短期记忆到长期记忆的转化过程, 人要睡觉, 除了让身体各个器官休息以外,最重要的就是要干这个: 把一天接触到的东西整理下来,变成长期记忆。 这个过程中没有自我意识的干扰。 有的时候, 转换出了点小问题, 就会做梦, 展开说可以是另外一篇文章。 这里点到为止。 那么记忆怎么来理解,关键在动态, 在时间。 与记忆相关的都是时间,我们记住了新东西,慢慢的就忘了旧的。 要模拟这个,知识表示的贝叶斯网络每个状态都得有动态属性, 动态贝叶斯网络。哈哈, 我的博士论文就是写这个的,瞎猫碰上死耗子,小得意一下。
最后要说自我里面最关键的东西, 自我意识。这里就不谈概念了, 就说说心理学认为自我意识是怎么来的? 一言以蔽之,学出来的!自我意识是从孩童开始逐渐发展起来的概念, 小孩子刚生下来是分不清楚内外部世界的, 慢慢的才知道”我“和其他东西是不一样的。 既然大脑可以学, AI也可以学, 具体怎么学, 因为设计到高层次的东西, 在我们还没解决知识和记忆之前, 提这个有点早, 但基本上可以推测这个跟增强学习相关。
超我:有了本我和自我,其实大部分人的智能就有了,尤其是有了自我意识的东西, 必须承认它已经是一个“类人”了。超我这种文化和道德层面的东西, 在于AI个体之间如何连接,如何建立关系。 我们做出了一个AI, 两个AI, 几百上千个有自我意识的AI之后,他们之间如何组织成社会。 Startrek这个片里的想象是borg人, 所有的AI个体公用一个大脑。 是不是这样, 值得商榷。 这个很重要, 人类简史里说, 智人之所以打遍天下无敌手,就是有了精神世界,创造了共同想象物,可以大规模群体分工,一致行动,直至建立庞大复杂的社会组织。 AI会怎么样,AI如何定位,AI和人的关系如何,这个交给未来学家,哲学家,社会学家。 涉及价值观,每个人都可以有不同的想象。
文章到此就可以收尾了。 有两个小问题再补充下, 一个是创造力,一个是自由意志。这也是讨论智能时候口水最多的两个问题。 创造力从哪里来,自由意志是什么? 很多人说这个归结为量子效应,这种说法很高大上。 我的个人观点,没那么深,大脑利用的全部科学,就在十九世纪的物理学里, 用不到二十世纪的物理学。 有热噪声就够了。 能坚持看到这里,也不容易,谢谢读者君。再见!