飞刀又见飞刀-盛宴的尾声

这一篇本来应当是对今年头三个月文章的回顾。 打算整理文章时, 看到自己网站上那个3d打印系列的遗迹。加上昨天和某同学的聊天。 不禁想再扯一遍当年自己玩3d打印的经历,以及从中可以引发的思考或者再思考。现代社会节奏之快, 没过两年, 已有白头宫女在,闲坐说玄宗的感觉。
一篇文章要有历史感, 应当从源头说起。 3d打印或者说增材制造, 源头在上个世纪80年代。 应当说这个技术是在计算机成熟应用到制造行业之后, 自然而然出现的。在那个年代的计算机普及狂潮推动下, 设计行业大范围的开始使用计算机辅助设计CAD, 把原来纸上画模型的过程, 变成了计算机里的数字模型。 伴随而生的又有所谓CAM, 计算机辅助制造,当时的含义是用计算机控制过去要人工控制的机床,自动完成零件的加工和制造。 这两类技术在现在已经是生产环节的标配, 早已成熟到大家已经不提什么计算机辅助了,因为没有不用计算机辅助的。用计算机控制机床是相当麻烦的, 传统的零件加工过程是拿一个金属大疙瘩(通常是铸出来的), 用各种刀、砂上去削魔, 车,钻,铣,磨。 要加工,要考虑怎么固定零件,要考虑怎么下刀, 一不留神,刀毁件亡。然而3d打印所谓增材制造, 是把这个过程反过来, 从零开始变出这个零件。 我们都知道, 无数点构成了线,无数线构成面,无数面构成了3维物体。 这个过程就是增材制造的过程。

而增材制造特别是FDM这项具体技术的发明, 又可以归功于一个人, 斯科特,克朗普(Scott Crump)。克朗普早年学习机械工程,在UW读的本科,UCLA读硕士。 毕业以后长期从事机械行业工作。曾经参与创立过一个压力传感器公司。大约在1989年, 和老婆一起创立了第一个也是直到今天都是行业内最大公司的stratasys。

传说中,克朗普发明3d打印或者说FDM, 是因为女儿想要一只青蛙, 于是他找了一个塑料胶枪, 手工给女儿挤出来了一个塑料青蛙。 挤青蛙的过程就是前面说的点,线,面,体, 一点点, 一层层的来。 在挤青蛙的时候克朗普或许在想, 这样能挤出青蛙,也一样能挤出别的什么东西。 然而同样的技术,我为什么不弄点更有意义的玩意呢?于是他和老婆商量,在征得同意后用1万多美元(当时是一大笔钱)买了一台工作站,加上自己年在机械行业积累的本事,潜心研究如何能直接吧电脑里的3d模型变成实物。 其实说白了就是一支可以在三维空间x,y,z轴运动的胶枪, 可以一层一层的挤出各种各样的模型。

Stratasys成立以后, 克朗普为了搞研发, 卖掉了所有的家产, 折合二十几万美元用来创业。 并且做出了第一台标价13万美元的原型机。 然而这台机器一时没有找到买主(当时大家都不明白这是什么, 找到肯花这么大钱的人一定不容易)。克朗普意识到他需要更多的钱, 于是找了一家风投, 把35%的公司股份,作价120万美元卖给了Battery Venture。Battery Venture 是技术风投界恐龙级别的公司, 现在已经是第11轮了。公司投资的历史上是一长串明星公司apple,intel,yahoo, google等等。在这个表单里可能 stratasys 还列不到前面三十位。

克朗普拿到投资以后, 又熬了2年多, 才推出了公司第一个成功产品, 第一台FDM打印机3d modeler。 这台机器终于可以在市场上销售了,公司也可以活下去。此后20年,克朗普的夫妻店一直掌控着公司的发展, 90年代,00年代风起云涌的二十年, startasys 1994年上市成功。 随后又收购了IBM的快速成型专利和一个十几个人的工程师小组, 巩固了自己在FDM这个胶枪行业的领先地位。

时钟一下子就翻到了2007年, 英国的巴斯(bath)大学,有一个教授,安得伦.暴牙(Adrian Bowyer)发起成立了Reprap开源组织, 力推3d打印或者说FDM的制造。巴斯大学的机械制造在英国和全球都享有盛誉。暴牙教授当然也是业内顶级人物。他成立reprap组织的公开信念是要最终完成机器可以自己造机器的梦想。 我个人理解是他对当时stratasys把一个塑料胶枪卖到几万美元十分不满,因为自己专业的学生经常会借助这类机器做些模型,学校就要被stratasys痛宰一刀,凭啥卖那么贵? 理应自己动手,搞一个开源项目。

(暴牙教授和第一代reprap)

在2007年, 想控制一个塑料胶枪在3维空间运动比克朗普的年代可容易多了。 然而也不是想象中那么简单, 因为材料的融合是个动态过程, 塑料的挤出要和胶枪的运动配合好, 一层一层能做出要人满意的结构, 需要足够的精度, 合适的温度, 适当的材料。 特别是要有能够处理3d模型把它变成胶枪运动轨迹的软件。 这一切在当时都还是零。

借助精力充沛,无处发泄只好搞创造的大学生和开源群体Reprap一代一代迭代自己的软硬件, 而到了2009年, 暴牙教授的得意门生,  Zach Smith , 软件工程师Adam Mayer,  和一个美国创客, 同时还在西雅图公立学校当老师的Bred Pettis聚在一起, 成立了3d打印史上风云一时的Makerbot公司。三人组合里, Adam Mayer负责软件和日常管理, zach smich负责技术, Bred pettis负责市场和销售。

(makerbot三个创始人, 左起,Bred Pettis, Zach Smich 和 Adam Mayer)

在2009年, reprap社区已经用金属轴,丝杠造出了可以工作的原型。 然而开源社区的通病是用户体验不好。 Geek们愿意钻研技术, 却不肯做一些能让自己的东西被大众接受的无聊事情。 这个把产品推给大众的机会就留给了makerbot。 借助开源reprap社区提供的软件, makerbot自行设计利用复合板激光切割拼接的结构搭建的更像商业成品的机器。 并在随后推出了第一代成品cupcake cnc。

我曾经在2010年1月的ces上看到过他们三个展出这台机器。ces展出有很多厅, 除了通常被大厂名牌占据的几个主厅之外, 在一些角落,或者主厅楼上还有一些便宜位置留给五花八门的创业公司。 makerbot当时就有一张小桌, 摆着自己的cupcake在现场打印。 我当时就很感兴趣, 跟pitts聊天。他说他们的产品可以邮购, 999美元, 但是排队的人太多, 就是你现场给钱, 估计也要6月才能收到货。 当时还没有所谓众筹网站, 等半年实在有点等不起, 加上当时第一代产品的现场打印质量也实在差强人意, 于是就此作罢。

自2010年ces首秀之后, Makerbot的第二代产品Thing-O-Matic在2010年9月发布, 并在随后的ces大获成功。这个奇怪的名字是因为机器上有个自动传输带的设计0-matic 意指automatic, 可以一次批量生产一批零件。

这里要解释一下, fdm类型的3d打印最恼人的问题就是要打好第一层, 因为第一层涉计到塑料胶枪头运动轨迹和打印平台的相对三维位置, 当机器搭建精度不够时,误差都累计在这里。 同时第一层还需要合适的材料让挤出来的塑料能够牢固贴服的粘在支撑板上。 为此有各种各样的办法, 包括在thing-o-matic开始引入的加热平台。 另外一个问题是fdm的耗时很长, 一下就是好几个小时, 甚至一天, 人不可能在旁边一直盯着。 而随便做个什么,通常是要一次做几个东西, 如果想缩短这个过程,最好能自动连续打印。 这需要把打好的东西从平台上拿走。 减少那种让人设个闹钟,等半夜打完时爬起来换零件的苦恼。 thing-o-matic为此设计了一个卷动的平面,东西打印完,一卷动,就可以把打好的移除, 自动开始打下一个。

然而理想很丰满,现实很骨感。 想批量打印的理想和牢固打印第一层本身是冲突的。第一层打不好, 如果机器不停下来,那就是一场灾难。 所以thing-o-matic这个设计实际上是失败的。 没学会走路之前不要跑。 thing-o-matic因为全开源设计, 和详细的安装指导文档, 是国内开始流行3d打印概念之后, 各个3d打印创业公司仿制最多的一台, 我自己也有一个仿制板。然而国内仿制时基本都拿掉了这个自动传输带的设计。 我曾经尝试过自己添加, 试过各种卷动材料之后, 发现还是不搞为好。

一个不成熟的设计, 能放在卖出的商品上,这是开源社区产品的特点。 好在这个设计本身不是大事, 把它拿掉不用就好了。2011年9月makerbot推出了第三代机器, 可以说这一类机器里最成功的设计replicator。这个机器在国内被大量仿制, 直到今天在某宝一搜3d打印,最先跳出来的还是这一类。

replicator奠定了makerbot成功的基础, 然而也显出了不和谐的端倪。 因为thing-o-matic被大量山寨, makerbot在replicator上有所保留, 包括电路版设计和固件。 给山寨厂制造了小小的困难。 但是这样的做法跟开源精神是违背的, replicator太成功, 以至于makerbot在02年9月发布的第四代产品replicator 2只是在此基础上做的小改进, 机器框架从木板变成了金属板, 还有一些提升打印质量的小变化。 上一代产品的成功,和本身的开源带来了严重的商业问题, replicator 2的新机器虽然更专业, 但是金属框架本身不能简单diy, 已经抛弃了开源群体。

早在replicator2发布之前, 2012年夏天makerbot就决定他们的新版打印平台软件不再开源。 这导致makerbot创始人的分裂。 还记得暴牙教授的得意门生Zach Smith吗? 他是makerbot技术研发的主心骨, 同时也是一个坚信开源的人。 replicator2基于商业的闭源决策让他十分伤心。 写过文章抱怨说:makerbot从开源社区里拿了那么多东西, 挣到了钱,不回馈社区他不不能接受,为此他要抗争。 抗争的结果当然是zach smith被扫地出门。 还有大约100多人随后离开。

技术负责人离开的影响不是立竿见影。 2013年反到是makerbot的巅峰之年, replicator/replicator  组合从diy市场上探到了准专业甚至专业市场。 看上去就像是商业领域里经典的颠覆性创新理论的样本。而stratasys这种占领专业市场卖高价产品获取超额利润的恐龙公司正是被颠覆的对象。 于是心急火燎的3d打印发明人stratasys出手用4亿美元收购了makerbot。 Bred Pitts 自然是赚的盆满钵满, 而一年前被扫地出门的zach smith分文未得。

技术负责人离开后恶果在一年之后才显现, 2013年makerbot推出第五代产品, 其中最大的改进是所谓智能挤出机。 挤出机就是那个塑料胶枪, 这是fdm打印的关键部件, 也是最容易出问题的地方, 因为各种原因很容易就会发生堵头现象。而没有反馈机制的机器还会傻乎乎的按照既定程序运行下去,打印出一场又一场悲剧。makerbot的初衷是好的, 让机器可以自动监控这个过程, 一旦有问题, 就停下来, 等人处理好问题后,还可以自己恢复, 不至于前功尽弃。

然而因为技术团队的动荡,这个所谓第五代的智能挤出机各种毛病不断, 所谓监控的结果, 就是监控到堵上然后罢工。 在makerbot用户论坛里能看到有人抱怨买回机器3个月,一个东西都没成功打出来。 这样的失败产品当然遭到了大面积的退货。 不知买了makerbot的克朗普是怎么滋味。 Bred Pitts当然也得负责, 拿着自己的臭钱滚的有多远就多远。2014年 Pitts不在当ceo。 不过这种滚蛋, 比没拿到臭钱就滚的zach smith可爽的太多。 2015年, makerbot几次大裁员,应当已经不剩什么人了,现在已经听不到什么声音。

开源和商业一直是一对矛盾体, 开源3d打印公司的领军地位交给了一家欧洲公司ultimaker。 ultimaker是国内山寨厂仿的第二多的机器, 他们仍然是坚持在完全开源, 只是开源通常是在机器卖出半年到一年内, 靠时间差和不断推出的新产品来存活。 这样做法未必符合商业原理,能坚持下来并不容易, 值得敬仰。

​3d打印的热潮已经散去, 媒体基本不再关注这个领域的进展。 stratasys并购了一大堆公司, 仍然处在行业的领先地位。 还有另外一个3d system公司也并购了一大堆公司,这最大的两个公司控制了大约1半市场, 基本上是双寡头局面。但这应当不是结局。

Gatner公司有个很著名的技术要经历hyper curve曲线发展的理论。 按照hyper curve,技术发展有积累期, 爆发期,消退期,和成熟期四个阶段。但是站在历史的长河中,这样的四个阶段可能有点简单, 真正的技术发展是复杂的, 大阶段里也有小阶段。总体的波折前进是常态。

(技术发展和媒体关注度曲线飞猪修改版)

金庸和古龙两个武侠大家, 最著名的小说都是三部曲。 金庸的是射雕,神雕, 倚天屠龙。古龙的是多情剑客无情剑, 边城浪子,和九月鹰飞。 多情剑客无情剑开创性的树立了“小李飞刀,例不虚发”的神话地位。 边城浪子和九月鹰飞里小李飞刀同时代的人物几乎都变成传说。 边城浪子主要是讲小李飞刀的徒弟叶开和阿飞第二傅红雪。九月鹰飞的主角是叶开和上官金虹的女儿。古龙已经在重复自己。到了所谓古龙口述的飞刀又见飞刀, 不是算不算古龙写的李坏再次重复了自己的祖先一遍。 第一次是正剧, 第二次是闹剧, 第三次是狗血连续剧。 飞刀又见飞刀还被拍成了一个比狗血更狗血的连续剧。

3d打印也是如此, 第一代技术的发明是正剧, 二十年后的开源消费产品,所谓可能的颠覆性创新,更像是一场闹剧。而国内的各路山寨,都可以归为狗血连续剧。

说了这么多,3d打印或者说增材制造本身并无问题。3d打印的核心优势是可以一视同仁对待简单和复杂, 打印一个实心立方体和一个复杂中空结构的发动机的时间是等价的。 能够充分利用这一点的地方就是3d打印的用武之地。 只是因为过度宣传, 公众把这件事情理解成了用肉打印一头猪出来。 期望之下当然是失望。

在3d打印退潮后,我那个blog不再更新。最后提到,是不是VR的春天来了? 然而VR的春天没有来,或者说如同帝都的春天一样十分短暂,还没感受到就结束了。然而别担心,人间春常在, 我们还有人工智能呢。

 

 

 

 

从表示到分布-有关深度学习记忆和效率的思考

三月是春天, 然而两会以后,北京的春天没有一个蓝天。 这一个星期都不见春日暖阳,最近两天是接连不断的冷雨。雨一直下,浇不灭人工智能大发展的火焰。因为当前全球经济滞涨,技术进步据说解决这个问题唯一救命稻草(还有战争)。 而眼前能看到的技术进步, 以第四次技术革命(人工智能)为甚 。之前的新能源和生物基因都被玩坏了。还能怎么样呢?深度学习作为这一波人工智能大潮的核心驱动力量, 已经被炒作的热的不能再热了。本文也在这个热点里继续掺和一下,来谈谈作者自己最近的思考。

成为热点的好处之一是资本聚集。资本就是钱, 金钱能带来的是眼球,因为媒体的呐喊助威, 不管你愿不愿意, 大家多多少少都知道了深度学习,是所谓很多很多层的神经网络, 知道了深度学习能下围棋赢世界冠军, 知道卷积神经网络识别图像能过人, 还知道这后面是凋参技能。

一种被更广泛宣传的观点是深度神经网络是个黑箱,首先要大规模收集数据, 然后开动大规模计算,再雇几个会凋参的博士, 网络就出来了。 所以要比拼深度学习哪家强,变成了那家数据强, 系统效率高,博士名声大。 这三项关键技里, 系统很复杂, 属于商业机密,一般不太好比较。雇博士可是手到擒来,于是博士们水涨船高。相关专业的刚毕业博士据在国内已经开到了百万年薪。而据(传)说领军人物的年薪则动辄是八位数字。是否真能值回票价,一时半会儿还看不出来。但是要玩尾巴摇狗(请自行搜索), 那是值得不能再值了。

再有就是看谁数据多,数据就是商业价值。算算数是投资人的核心技, 所以看数据收集了多少年,多少TB,有无专有的数据来源,  决定了公司就能值多少钱。

但是按照作者观点,真正推动深度神经网络或者人工智能的不断进步, 不能看有多少资金投入, 而要看有多少研究人员的深入思考。思想的深度决定事物的高度。 这是光注意短视的金钱涌动所永远不能触及的。

最近一段时间有关深度神经网络的研究工作, 最让人赞赏的还是deepmind。 从对创办人的访谈可知, deepmind一开始就志存高远, 一直想做类人智能,因此并不忙于凋参变现,常常对深度神经网络往往有独到的理解。比如最近就有一篇谈网络学习如何拥有记忆的话题。

有关学习和记忆, 从去年开始写文以来已经反复提过多次。总结之前的理解, 记忆并不是存储,而是一种计算, 是和学习过程紧密连接起来的,更关键的,记忆是一个动态和静态结合的过程。人都是边学边记得, 学会了,就记住了。

而当前神经网络学习和应用的过程是分开的, 一批数据进去, 网络学好,就拿去应用了。 应用的时候是固定的网络,当然也不存在学和忘。 而训练的过程,更是反其道而行之,所谓transfer learning迁移学习, 拿训练好的一个网络,给一个新的任务, 可以通过凋参很快适应那个新任务,之前的当然就忘掉了。

而Deepmind这篇文章,就试图解决这个所谓遗忘的问题。 他们通过找到深度学习网络对之前任务的最重要的部分,包括对应的连接结构和部分关键参数。在学新任务的时候有意识的保留这一部分,可以做到在学会新任务的同时, 并不丢弃做旧任务的能力。也就是所谓学会了不忘, 这样可以说网络就有了记忆。

网络有了记忆可以让人浮想联翩。 因为在现实应用中, 网络并不总是100%好使,总会碰到一些出错的例子。 这个时候就需要对网络做调整。而这个调整要做到结识新朋友,不忘老朋友。那么Deepmind这篇文章方法似乎就可以借鉴。

然而事物的发展通常不是水到渠成。这里面最大的问题,是这样的出错的例子, 实在太少 。众所周知,深度网络学习严重依赖大量的数据。如果只有几个样本就想学会,那就是大写的不可以! 怎么办, 一种思路是利用对坑式网络, GAN, 我用生成网络去生成一大堆近似样本呗。 这样可以吗? 有没有更直接的方法能让网络在小样本上高效率学习?

要回答这个问题,必须要打开深度网络的黑箱。其实deepmind有关网络记忆的那篇已经在试图在拆分黑箱了,需要把网络中重要的部分挑出来。 而打开黑箱,首先要理解深度学习网络到底是在做什么?所谓看问题的角度, 和可能影响了最终的成败。

传统的说法,深度学习网络,尤其是CNN, 学习的是一种从输入到输出的映射。把深度理解为一种函数拟合。 而多层网络, 因为引入了非线性, 不管多么复杂的函数映射,都可以拟合出来。 这在理论上是没有问题上, 然而在现实中这么玩,因为碰到非线性数学工具就不好使。 一下就玩不动了。没有数学理论指明方向,只好出动凋参大军,搞水漫金山或者瞎猫碰上死耗子战术。

可瞎猫总能逮到耗子, 这就不得不让人怀疑哪里出了问题。我们说,可能是思考问题的角度出了问题, 不能用映射来理解问题,那样就玩不下去, 要用统计的角度来理解。  而对于统计来说, 一切都只是分布而已。

我们都知道,这个世界是基于统计的, 因为世界是由一些基本粒子(现在分到了夸克)组成的。 每个粒子的性质都是一模一样的, 他们的相互作用一开始也不是特别复杂,基本都可以认为是线性的, 就算不是线性, 用泰勒展开一阶近似也差不到哪里去。而粒子的结构本身又是分层的,比如基本粒子组成了原子,原子构成了分子, 分子和分子之间有各种化学反应。 到原子还只有一百个,到分子简直有无穷多, 化学更是变换莫测。 复杂性一下就出来了。 所以三生万物, 三层网络就可以生成世界。当然这都属于胡说,别较真。理解基本思路是简单构成的复杂就对了。

神经网络比世界的基本粒子更简单, 通常情况下只有两种。 一种线性的,只做组合, 一种做简单的非线性映射。 我们说线性部分提供表示能力, 非线性部分构成复杂。每一层网络节点都只是把初始分布映射为边际分布。而每一层做线性映射的神经元张成线性子空间。神经网络就是用非线性映射联结线性子空间构成的高维空间来描述输入数据的分布。 因为每一个线性子空间提供了数据分布的边际分布,每一个线性子空间都是观察输入分布的一个窗口。 线性子空间的各种结构分析方法–线性代数和矩阵分析方法都可以得到应用。

用边际分布来表示最终的联合分布,就是朱松莼老师交给我们的云上打洞理论,而神经网络的效率,要看这些洞打的好不好, 最终取决于这些边际分布的熵的某种组合。

从概率分布的角度出发, 可以利用几何方法来研究。请参见顾险峰老师看穿机器学习的黑箱系列文章。学习所谓最优传输映射问题的凸几何解释。顾老师说逼近一个概率分布比学习一个映射容易的多。而逼近一个概率分布,解空间包含无穷多映射,构成一个无穷维李群。

期待这个方向的深入思考和理解能带来更多突破。最近给自家娃买了一本德国手绘百科全书,他看的津津有味。那本书每一页是一个主题,比如房子各种不同的样本,每一种只有一张图, 比如非洲的树屋,或者爱基斯摩人的雪屋。我相信他看过这张图片,如果下次有机会亲自见得树屋和雪屋,一定能认出来。深度学习也应该或者说必须做到这一点,大家试图理解无穷维李群过程中死掉的堆积如山的脑细胞才是值得的。

人从那里来-人是什么系列外篇之二

在本系列文章中, 我们主要回答人是什么这个问题。 很多人都知道小区保安经常会问三个哲学终极问题,  你/我是谁?  你/我从那里来? 你/我要到哪里去? 保安不是哲学家是因为他问的是你, 哲学里面是问我。 在前面系列文章里解释了我是谁之后,这里简单说说我从哪里来的问题。供大家参考。

老子说, 道生一, 一生二, 二生三,三生万物。 现代科学认为, 我们目前生存的宇宙来源与一场大爆炸。 什么是大爆炸, 就是从一个奇点在极短的时间内迅速膨胀, 生成了宇宙。 较起真来, 这一句话里有三个关键概念, 奇点,时间,膨胀(空间)。

首先说奇点, 奇点就是无穷大, 无穷就是道。道可道, 非常道, 我们当前的数学碰上了无穷也基本说不出什么来。 从计算的观点看, 无穷还是有不同, 这是题外话。这里先不展开了。不谈道, 我们知道道生一, 无穷生有穷就好了。

然后就出现了时间。  时间又是什么? 有一本著名的科普读物, 时间简史。 这里不重复说明了。从计算的观点, 可以认为时间是复杂系统在墒增原理作用下, 单向演化的一种方式。

最后是空间, 时间也好, 空间也好, 一有定义, 就是有限度的。 按照相对论哲学, 空间是一个相对的概念, 有参照物, 才可以有空间。 另外讨论空间,一个关键属性是维度。 这个脱开数学又没法简单解释。也只好点到为止。

但是有个概念必须说明, 我们已知的空间里充满了物质, 这些物质中包含有一部分能看到的物质,  还有一部分看不到的叫做暗物质。 玄学爱好者们最喜欢这些暗物质暗能量的提法, 因为在他们看来, 有了暗能量就有了鬼神的空间, 此外宣称自己能够连通暗能量就可以作法, 可以无所不能。 玄学爱好者们最喜欢的现代物理的另外一个概念就是量子, 他们稀里糊涂的觉得量子学说里面的各种不确定性, 超距作用,量子纠缠有可以让他们无所不能。 不管你信不信, 反正我是不信。 为什么?

因为对量子概念最大的误会,就来源与对量子是什么的理解上。 量子这个名字应当是来源于能量单位的提法, 这个名词让人觉得量子是个确定性的东西。实际上在微观世界一切都是不确定的, 都只是一个分布。 学过bayesian理论的人容易理解, 量子给了一个先验, 只有我们开始观测, 基于我们自己和量子的分布不再独立, 量子就有了后验分布,也就是物理学描述的各种属性。 这个世界的确定性来源于不确定性。 好像我也没太解释清楚。 也只能说这么多了。

我们从量子出发, 这个世界是由大量的量子构成的, 也就是建立在大量的简单模型就可以描述的分布构成的联合分布的基础上的。 从各种量子的独立分布到互相之间发生作用的联合分布, 世界从不确定到我们观察到的确定后验分布,是做了积分, 所以忽略了很多细节。依照时间, 实际上有各种分布到分布的inference计算发生。 从计算的观点看, 组成了一个复杂系统。

复杂系统摒弃了还原论。 也就是说就算搞明白了局部, 也把握不了整体。 从局部,特别是微观来看, 我们可以有精确的模型, 量子力学是很准的,why? 不是测不准吗?   不解释。 然而大量量子发生交互作用产生的各种自然现象, 我们就没办法用一个模型来描述了。 有模型的真实含义就是其实可以变简单。 复杂系统不能简单化。 只能用另外一个复杂计算来逼近。 绕来绕去, 好像没有说清楚, 总之我们要体会, 搞清楚局部,也搞不清楚整体, 永远无法精确的用模型描述整体,是我们世界普遍存在的规律。 世界是复杂的, 这是理解世界的第一规律。

第一规律跟时间相关, 下面一个关键概念是墒, 墒是描述乱序的量, 越乱墒越大。 热力学第二定律说, 一个孤立系统, 也许我们当前宇宙就是, 墒会自然增大, 过程不可逆。 因此热力学第二定律告诉我们时间的终点是一个处处混乱也就是处处一致, 的热寂宇宙。反过来说, 加个负号,负墒就是描述信息的量, 负墒越大, 信息越多。我们看到的世界,特别是生命的世界, 是多姿多彩的。 很有规律,也很有信息量, 这又是怎么来的呢?

大爆炸之后的宇宙, 无穷生有穷, 有极大的负墒,在宇宙热寂之前。处处存在着负墒聚集的,也就是远离平衡态的能量聚集的点, 恒星,太阳。 太阳逃不脱热力学第二定律, 早晚会死。 但在死之前,散发着光和热,牺牲自己,温暖大家。 给地球上相比太阳来说很微小的生命构成的生态系统, 提供了源源不断的负墒。

不管是一个生命个体,比如说你,  还是个体构成的一个种群, 比如说人类, 还是由地球上全部生命构成的生态系统, 都是墒减的。 这可以类比为一个新陈代谢的过程, 也就是通过汲取大量的负墒,利用一部分, 释放一部分, 就可以生长(人是从一个单细胞长出来的),可以从简单到复杂,越来信息量越大,约来约多姿多彩。这又是怎么一回事呢? 不是神, 是进化论!

进化论的核心思想是物竟天择。个体通过遗传变异产生多样性, 依据环境适应来选择。 进化论其实解释不了自己, 也就是多样性。 我们又需要用一点点复杂系统理论。现在科学的不同分支, 复杂系统研究的远平衡态自组织, 非平衡态热物理, 研究生态系统新陈代谢的代谢生态学都说的是一类事情。他们发现主导系统的演化的有一些共通的规律。

归根结底是所谓的最大流原理, 把一个系统当作能量,或者信息(负墒)在其中流动的网络。 比如生态系统, 每个个体是一个节点。整体构成生态网络。 系统的演化方向, 是让网络整体的流量最大。 系统在网络中传输能量/信息的整体效率最高。虽然整体上都是最大流原理,但是因为具体系统最大化的目标,或者说墒,或者说能量函数,有各种不同的形式。具体到特定系统又有不同。

比如进化论的生存竞争就是一种, 就个体来说, 需要增加自己的能量传输效率。 因为每个时间点网络里总的传输能量是有限的, 当某个节点增加了传输能量效率, 必然会导致有另外一个节点减少了传输的能量,甚至没有能量(灭绝)。怎么增加能量传输效率呢? 就是要快!天下武功,唯快不破!谁快谁活,慢着死。 但就整体来说, 生态系统的复杂程度, 要依托于环境, 也就是环境提供的可以被利用的负墒的多少。能利用的负墒越多, 生态系统就可以越复杂。

以上要快要快要更快原理,正式的说法叫做最快就生存(suvival of fastest)。2007年科普作家John Whitfield写过一篇很有名的文章”Suvival of likeliest” 说的就是这个。

生物和环境其实也是互动的。 就网络整体来看, 就算没有看到其中的节点生物个体的竞争。 进行新陈代谢的网络的传输能量也会越来越高。 前面讨论的生存竞争是粗的管子才能留下。 还有一种是速度越来越快。通过竞争,所有管子里流动速度都更快了。 大家一起都成长了。 系统会自动加速。

除了管子变粗, 速度加快, 更重要的是,系统中会自动生出新管子,整体网络的结构会越来越复杂。如此一来, 人会成长, 生态系统也多样化, 世界也多姿多彩了。

可能到这里有人会问, 为啥会有最大化原理, 系统不是会热寂吗? 其实放在整体想一想, 所谓自组织的生态系统, 是寄生在一个负墒流上的, 负墒流之所以出现, 是能量在传递, 是负墒减小, 墒增加热力学第二定律的标准过程。 而最大流, 可以加速这种负墒的传递, 那么从整体系统的角度上讲, 可以让热寂的速度更快一点。 正是要加快死亡的整体过程, 才有所谓生命的诞生。 反者, 道之动。 世界就是这么辩证的啊!

因为各种最大化效率的行为存在, 个体竞争, 生存选择,遗传变异,从简单到复杂, 我们有了理解复杂系统的第二原理, 最大流原理。 也就是各种系统, 本质都是效率。

你也许不同意, 建立在如此简单的规律基础上的复杂系统演化, 就能出现人这样的高级货。 不是不要还原论吗? 如果你认同计算宇宙的观点, 认为整个世界就是一场计算, 那么确实可以从简单的规律生成各种各样的复杂。 Wolfram 已经用他了计算游戏模拟了这个过程。 稍等, 我们进行的可不是确定性计算, 是从分布到分布的统计推断, 终归还是没有那么简单,谢谢阅读!

 

 

 

 

 

 

什么是意识–人是什么系列之五

经过前面文章的一系列铺垫, 我们终于可以开始谈到最关键的内容了, 也是古往今来所有的哲学家和心理学家都试图弄明白的:人的意识。我们离真正弄明白意识还有一点点距离, 但并不是很遥远。 本人预测摘下这颗科学的皇冠将是在我们的有生之年发生的事,敬请期待。以下是正文。

在继续意识的探索之前, 先来简单回顾一下这个系列文章里我们都说过什么:我们谈到了心理学有三大流派, 从弗洛依德到马斯洛都对人有一套层次理论。我们谈过了学习是怎么一回事, 发展心理学里婴儿如何从感观开始到建立逻辑思维直到发展出自己的完整意识-包括一个基于想象的世界。我们还提到了大脑的功能分区, 已知不同分区代表不同的功能, 特别是有关逻辑的高级货在左脑。最后我们还谈了谈记忆,    知道记忆有短期长期之分,有涉及到人的意识的, 和无意识的之分。前者又有描述型和情景型之分。 重复一遍弗洛伊德的定义, 意识之外, 有可以进入意识的前意识, 和不能进入意识的无意识, 统称为潜意识。 根据以上这些, 我们能怎么来理解人的大脑如何工作呢?

本文给出的解释, 一切的一切来源于进化论和自然选择。 我们的大脑中包含与意识相关的内容有多重不同的成分。可以从低级到高级进行层次划分, 而意识在进化的最后才出现,大自然造物里的皇冠名符其实。 以下按照这个思路,来依次介绍。

最底层的,也就是不管高等,低等动物都有的,是生命维持系统。 就算是海兔这么简单的生物,也表现出了学习,记忆和各种复杂的行为。 这是生存的技术。 维持这一层的神经系统在人的脊椎内,通过脑干连接到大脑。 很多条件反射类的基本行为和控制, 都不通过意识, 可以自动产生, 类似膝跳反射这样的东西。 一般是靠意识干预不了也注意不到的。在马斯洛的心理学理论里, 这一层在最底层。 都属于无意识。

一个人每时每刻都在做各种各样的决定, 从早上开始, 我要起床吗, 穿什么衣服, 要吃饭吗?我们要做的决定太多, 有些是意识到,有些是意识不到的。 其中无意识的决定有两个来源, 其一是你接受到了外在的感官刺激,外在刺激会唤起记忆中的某些成份, 还记得那些的程序性记忆吗,比如开车,骑车等等? 如果唤醒的是程序性记忆, 那么不需要通过意识,人下意识的就会做出行为。其二,感官刺激还可能唤起情绪系统。情绪系统会自动影响你的行为。 那个房间是白色的(感官刺激),我应该走进去还是躲开(情绪系统)?情绪的产生机制主要取决于你先前的经历,也有一部分直接来源于遗传。 比如有研究表明, 人怕蛇之类的生物, 是天生的。 从来没见过蛇的人, 见到蛇一样的活物,会无意识的躲开。归根结底, 其中一些情绪产生是为了让人避开危险,获得马斯洛理论的第二层, 安全。

在情绪系统中, 厌恶和恐惧是相对重要的两种。而厌恶是人类独有的情绪。 脑科学研究认为,这些情绪发生作用, 都要通过大脑中的杏仁核。 而杏仁核又是大脑中处理疼痛的部分。 有意思的是, 曾经有实例,病人受到了脑损伤, 破坏了自己的情绪系统, 从此不能正确的理解别人的情绪。 看到一个吃东西呕吐的演员, 会评论对方在愉快的进食。看到布满蟑螂的食物, 没有任何厌恶。什么都能吃,当然也就可能吃到不好的东西。 一个没有情绪保护的人,很可能就会因为吃到什么坏东西而丧命。所以情绪也是自然选择出来的机制。

随着生物的进化发展, 特别是基于种群的竞争出现, 高等动物生活在一个群体里, 大家需要交流沟通,这是情绪系统又一个主要功能。 现代研究证明, 人的神经系统有专门负责人脸的部分, 可以快速理解别人的表情,而所谓情绪也可以在人和人之间迅速传播。比如打哈欠就会传染。这叫做共情。通过共情, 两个生物之间直至整个群体可以协调各自的行为。 类似的情绪传播不光是人有, 黑猩猩等少数高等动物也有。

在杏仁核之外, 人有一套所谓镜像神经系统来理解和模仿对方的情绪。 在婴儿室里, 一个小朋友开始哭, 周围的小孩会哭声一片。 有意思的是, 如果给单独一个婴儿播放自己的哭声录音, 他不会哭, 播放别的小孩的哭声, 他就会跟着一起哭。 同样的机理,也让你在电影院里观看演员表演时哈哈大笑, 或者哭的稀里哗啦。有研究表明, 患了自闭症的小孩, 无法理解旁人的情绪, 很可能就是镜像神经系统存在缺陷。

随着人开始长大, 意识的产生, 理智的介入, 我们开始控制自己的情绪。有实验证明刚出生不到两天的婴儿, 就会模仿表情。 比如对着婴儿吐舌头, 婴儿也会吐舌头,而出生3个月之后, 这些简单的模仿反倒是不见了。

对一个成年人来说控制自己的情绪,需要连续的注意力。 这并不是很容易的一件事情, 一旦走神, 原发情绪会不自觉的出现。 而人的镜像神经系统又对体察情绪非常敏感, 因此当一个真正的好演员,也不容易。 情绪还可以被药物控制, 还记得海兔那一节的的5-羟色胺吗? 当这种成分在体内的浓度提高时, 可以平复情绪, 减少攻击性等行为。 因为生物进化, 从原始动物,到高等动物到人, 新的高级货不断出现, 但是原始的机制也仍然在起作用。

人的行为中,涉及到无意识行动的很大一部分, 都是情绪系统在起作用。我们甚至可以把马斯洛的第三层,归属与爱也放在这一类中。情绪可以进入意识, 所以属于前意识。

讨论完包括无意识和前意识的潜意识, 终于可以开始讨论意识了。 跟意识相关的词, 包括精神世界, 自我, 理性, 注意等等。 心理学中对意识的定义:意识是一个注意连续转移的动态的流。  作为一个人,我们生活中各种各样的行为都是连续发生的。 有些来源于外界的某个输入,有些可以来源于自身的记忆, 记忆通常是伴随特定的外部刺激出现的, 偶尔在没有外部刺激时, 人还可以胡思乱想。按照一般结论, 存在所谓自由意识, 也就是说面对同样的外部输入, 人可能会有不同的思考, 和完全不同的行为。

按照前面的讨论, 我们知道大脑功能有分区,在意识之外, 其实大脑的不同的功能部分一直在运作。 通过五感,形、声、闻、味、触接收各种外部连续的输入信息。 而这输入连接到的神经中枢也一直在运作。甚至可以依照情绪系统或者程序性记忆控制人的行为。 这些本来都属于潜意识部分。 而潜意识在适当的时候, 如果引起了注意就进入了意识。 比如当一条蛇出现时, 潜意识让人在0.5秒内自动跳开,而随后的几秒,引起了注意, 人才知道, 我看到了一条蛇。

我们都知道意识只有一个, 人不能分心。神雕侠侣里的周伯通和小龙女都可以一手画方,一手画圆。周伯通是自己琢磨的,小龙女是学会的,  归根结底, 他们主要就是反复练习。 练习是一个学习过程,通过练习, 建立了潜意识中的程序性记忆。 而潜意识能并行, 也就自然可以一心二用了。

从潜意识到意识, 接收到的各种信息, 到底那个才能引起人的注意?这涉及到一个决策机制,也就是一个开关。 这个开关在那里? 现在脑科学研究已经搞明白了, 脑干!

我们中学生理课都应该学过, 脑干控制人的心跳,呼吸等基本的生命维持系统。 生理课没说的是, 脑干不光维系生命, 还调结饥饿,内分泌,繁殖,攻击,自杀,学习的奖赏机制,安慰机制。也就是如其名, 脑干是维持人的生理和心理动机的核心。通常大脑控制不了也意识不到脑干的行为。切断脑干,人立毙。

反过来, 正是脑干向大脑提交原始触发信号。脑干连接到基地前脑和下丘脑。这两个部分用于唤醒并激活随后的各种意识活动。 如果这个线路出了故障, 人将永远唤不醒, 丧失全部意识。下丘脑同时也控制睡眠, 在其中一种叫做乙酰胆碱的神经递质可以引发注意和记忆活动。 抑制了乙酰胆碱, 人就要睡觉或着表现为昏死过去。

丘脑大概象核桃那么大,其中有两个核,左右一边一个,如果有其中一个损坏,人还能醒过来, 如果两个都损伤,人就变成植物人了。   丘脑上面是扣带回, 扣带回上面是连接大脑左右半球的胼胝体。 胼胝(音偏之)在中文里原来是老茧的意思, 不知道怎么会起这么个名字。扣带回之上的大脑功能开始分区。因此除了这些关键部分之外,大脑某一部分损坏, 只是损坏某些功能, 并不会失去意识。

回到大脑的分区理论, 我们曾经说过, 大脑的处理其实很慢, 尤其是神经电信号的传递,因此一组神经元要聚合在一起,传输距离最短才会有最优的效率。 这也是大脑为什么有功能分区的理由。 大脑的功能有分区, 各个模块都可以独自完成功能, 并行处理。

可能正在看文章的你,这会儿在关注手机,也许你又开始走神, 觉得明天上班起床太早, 这时你抬起手揉了揉眼,身体累了换个姿势。这些都是不同的功能模块在起作用。 做过并行计算的都知道,计算之间要同步和协调。 大脑在做各种不同的处理,是怎么来同步和协调各个模块,并且最后形成唯一的意识流呢?

解开这个问题的钥匙正是注意。意识是注意不断转移的一条时间流, 而注意是潜意识中不同功能模块,包括来源于外部输入的,和来源于记忆的,通过某种竞争机制,最终胜出的那一个。 这是自下而上的注意形成机制。一但注意形成, 会自上而下给各个模块发送信号, 调结并影响这些模块的功能。这一切都是在丘脑可扣带回中自动连续完成的。丘脑和扣带回位于大脑半球所在球的球心, 因此到各个皮层模块近似等距, 这也是决策中枢该有的地位。

现在我们解决了意识的产生, 剩下最后一个问题是自我。 我们把自己看作一个整体, 与外界世界分离开。 所谓物质世界, 精神世界。 从一元论到二元论, 那个决定那个在哲学里吵了几千年。 抛开这些纯粹的思辨不谈。按照前面意识是不同功能模块竞争产生的理论, 意识中又是怎么形成自我的呢?

在加扎尼加的研究中给出了很有意思的启发。 因为他研究的是裂脑人, 当两个大脑半球断开后, 病人通常智力不会受影响。 但即使两个大脑半球生理上几乎一样,大脑也会有不同分区处理不同功能, 而人的高级思维, 只在左脑有。因此对于裂脑人可以设计一些有趣的实验来研究人的意识。

比如对一个裂脑人, 给他看两张图片, 左脑看到鸡爪,右脑看到雪景(分别对应右眼和左眼,视神经是交叉的)。之后让病人从一堆图片中挑选关联图片, 左手对应右脑抓起来铲子,右手选择了鸡。从鸡爪到鸡很容易解释,然而左脑不知道右脑看到的是雪景, 他又得解释为什么自己左手抓了铲子。左脑从来不会说我不知道,他必须给出解释。 通常裂脑人会说, 哦,我拿了铲子因为鸡舍很脏,要打扫鸡舍啦。 类似的实验还有很多, 比如给右脑看一个搞笑图片, 病人开始笑, 但是左脑不知道。 当问起病人为什么要笑时, 他还是要给出一个回答: 你们这些人太逗了!

看上去很可笑是吧, 左脑就象一个逗逼, 要用逻辑推导解释一切, 所有感官接收到的事情, 或者自己的记忆, 都必须符合逻辑。在左脑的世界里, 所有的事物都要根据逻辑联系在一起。 而当这种整合完成之后,你意识到什么了吗? 你的内心世界中, 自我出现了!

因为左脑通过逻辑解释连接了一切, 所以产生了自我。 一个有意思的事情是, 我们的感觉器官, 比如说视网膜, 采集光信号, 传导给视觉中枢。 如果视网膜损坏, 我们会知道自己瞎了, 看不到东西。 如果是视觉中枢部分损坏, 病人根本意识不到自己只能看到一部分, 反而觉的一切正常。 同理对裂脑人来说, 如果跟左手相关的感觉神经中枢被切断。 运动神经中枢仍然可以控制左手。 但是对于病人来说, 他不觉的这只手是自己的一部分,会认为是别人的手。只有相关的神经中枢参与了注意产生的决策过程, 并进入意识帮助左脑用逻辑整合过。 我们才会觉得与之关联的感受或者肢体是自我的一部分。

再重复一遍皮亚杰的学习理论, 我们知道人从婴儿开始, 先建立起来感觉, 然后开始学习各种概念,也就是语言, 随后有了把概念联系起来的逻辑。只有到这一步, 孩子才开始有了自我。 最后一步, 在逻辑的基础上, 我们可以有想象中的世界。

从意识到自我, 我思故我在!

这一篇没有以某个人来举例, 因为我觉得至此大家应当明白人的特殊性, 以及其实并无什么特殊。

 

 

学习和记忆-人是什么系列之四

上一篇题外话从计算的角度说了说什么是记忆。这一篇我们回到心理学,来看一看心理学是怎么理解记忆的。 这个话题相对来说又好写,又难写。因为心理学特别是认知心理学以及随后的交叉学科认知神经科学里面有大量的关于记忆的研究内容和结果。 可以说是关于脑研究的最主要方向之一。写一本书都不困难,自然搜集内容写一篇文章很容易。 然而要在一篇网文有限的篇幅内抓住如此之多研究结果,也是一件非常困难的事情。 这里只能搜集一些看上去比较重要的结论,如果忽略了一些关键结论,请见谅。以下是正文。

从心理学研究之父冯特定义了心理学的实验研究方法开始, 记忆的机制就是被研究最多的内容之一。 因为与记忆相关的行为非常容易做实验。 大部分读书学习的人都听过艾宾浩斯遗忘曲线, 或者说是学习曲线。艾宾浩斯也是德国人,几乎跟冯特一个时代, 早在1885年就通过研究自己写了一本书, 叫做“关于记忆”。他观察了自己背诵一个无意义的字母表的过程,看到底自己要用多久才能把这个表背下来。 发现了一些有关遗忘的规律。这就是著名的艾宾浩斯遗忘曲线。直到今天,我们仍然借助这条曲线来帮助学习特别是背诵单词。 考过英文的都懂。

艾宾浩斯之后, 各路学者开展对记忆的研究。因为记忆永远是跟学习结合在一起的, 所以大家都是通过学习来研究记忆。 比如著名的条件反射, 就是最早的相关研究之一。 巴甫洛夫发现, 通过把两个没有关联的事件摇铃和喂食放在一次刺激狗, 狗会自动建立这两者之间的关系。 这就是所谓accosicate learning关联式学习。  不光可以通过摇铃让狗流口水, 如果光摇铃不喂狗,时间长了狗就生气, 不对是刺激反应消退。相关的行为可以总结为以下规律:

  • 习惯化。当一个弱刺激,不产生生理威胁的刺激,反复出现, 同样刺激相关的影响就会弱化。如芝兰之室,久而不闻其香。
  • 敏感化。 一个刚刚受了强刺激的被试,伴随的弱刺激,就算是无害刺激,也会产生强烈的反应。
  • 条件反射。不管这两个刺激之间有没有关联,只要反复同时出现,就会自动建立关联。训练条件反射就是这个道理。

这些早期研究可以说是叩开了学习和记忆基本规律的大门。 相关的过程被总结为记忆三个步骤,获得,巩固, 再现。光从字面上就能理解。

在学习和记忆的过程中,到底大脑是怎么记住的东西的呢。 受到条件发射的启发,加拿大生理学家Donard Hebb在1949年出版的自己的书里面, 提出了著名的Hebb学习规则:当两个刺激同时出现时, 其间的联系会被强化。Hebb认为学习就发生在神经元的突触连接上, 具体表现为两个神经元同时兴奋的时候, 之间的突触连接会被强化。 这里插个题外话,hebb的实验里,人一定需要外界的刺激才能正常生活, 如果把外界的刺激关闭, 比如把人关在一个小黑屋里,时间一长,脑子就会胡思乱想,直到发疯。那些拿关小黑屋惩罚儿童的父母你们自己体会下。

Hebb只是凭自己个天才洞见提出了一种假说。这种假说真正得到验证要等到诺贝尔奖金获得者Eric Kandel对海兔的研究工作。因为人,或者高等动物的神经系统实在太复杂,很难从细胞的水平研究。Kandel找到了一种相对简单的生物, 海兔,开展自己的研究。

海兔可以被当作是海里的蜗牛, 它的神经系统一共有2万个神经元,分成9个组团,或者说是神经节。但就算如此低级的生物, 它的外部行为也是很复杂的,进食,运动,呼吸,心律,产卵,喷墨等等。Kandel小组观察了上述行为很长时间,最后觉得太复杂了, 每个行为都会涉及到一大堆神经元的激活。要想准确研究生物学习到底在细胞水平上发生了什么了。 需要找到只有一个神经元参与的外部行为。 这听上去似乎不太可能, 但是Kandel找到了。 海兔的腹神经节是上述9个组团之一, 有大约2000个神经细胞,涉及心律,呼吸等。Kandel最终找到了一个行为, 缩腮反射,只涉及到一个神经元。真正的两万里挑一。

什么是缩腮反射篇幅所限,在这里就不详细解释了。 总之, kandel观察到, 在海兔的神经系统中, 有24个感觉神经元,接受外部皮肤刺激, 对皮肤的某一点刺激, 会激活其中6个,这个6个把刺激传给另外6个运动神经元,引发海兔对刺激做出收缩反映。终于是个个位数了。 因此可以仔细观察。

跳过研究过程,其实是个漫长的历时数年的实验过程。直接给结论,之前提到的三种学习规律, 习惯化,敏感化,条件反射,都在细胞突触上得到了体现。 习惯化表现为突触电位减小,敏感化则相反。而条件反射的建立,需要两种刺激强刺激和弱刺激满足严格的先后关系,最后也表现为突触连接的强化,而且比敏感化更强。通过以上研究, kandel证明了hebb是对的, 学习就是通过积累经验,改变突触化学连接上的强度和效率,最后导致了生物行为的改变。 说白了学习就是化学调参。

我们从海兔回到人, 相比海兔的2万个神经细胞, 人的100亿个神经细胞当然要复杂的多。 按照我们这个认识什么系列的习惯, 要介绍一个人的生平。就记忆来说,虽然有如此之多的天才和大拿来参与研究,比如提出7+2的米勒等,都不选他们来介绍。我们来介绍一个特别的人,一个被试。现有的记忆理论,基本上都是建立在对这个特殊被试的研究基础之上的。 各路学术大拿都纷纷排队研究他, 也就是H.M。

H.M不是卖衣服的, 他是认知心理学上最著名的被试, Henry Moliason名字的缩写。如同让加扎尼加明白大脑左右半球功能不同的裂脑人一样, H.M也是一个严重癫痫病患者。 H.M出生在1926年, 7岁的时候, 因为骑车摔跤受到了脑损伤,引发了癫痫病。随着他的长大, 癫痫病症状越来越严重, 从间歇性发作到痉挛直至无法控制。 按照当时医生的习惯作法。就是对着脑子来一刀。H.M在1953年 27岁时被切掉了大脑两侧的颞叶,包括海马的大部分。

H.M是一个天性随和幽默的人, 喜欢看电视,玩填字游戏。在手术之后, 他的癫痫病治好了。初看起来一切正常, 但是随后发现,他学不会新知识了。 也就是只有短期记忆,而无法建立长期记忆。 之后直到2008年,他82岁去世前, H.M作为被试被各种专家研究。自己则快乐的过完了一生。他平时的工作生活就是玩自己喜欢的填字游戏, 然后让专家们观察他的脑部活动。在去世后,他的大脑被送到了UCSD做3d切片研究,直到2014年,完成了全部3d模型的重建。

通过对H.M的研究和观察, 专家发现, 他并不是学不会所有的新东西, 他还是能够通过训练,掌握一些新的过程性的技能。 H.M被切除的部分海马, 是大脑中最古老的部分之一, 几乎所有的生命, 包括低级的海兔, 都有类似的海马回。 而海马,被认为是短期记忆,通向长期记忆的路径。 好了我们听到了各种有关记忆的名词,为了避免混乱。 这里统一梳理一下。

首先, 人的记忆机制并不是单一的, 而是有多种工作方式不同的部分。 最简单的划分,从hebb的研究工作中来,可以分为与刚刚发生事情相关的短期记忆和除此之外的长期记忆。而短期记忆随后又被分为,在1秒时间内,直接来自于视觉,听觉之类输入的感官记忆。和引起注意之后进入意识可以维持数秒的level 1记忆。 长期记忆可以被分为,通过训练获得,在学会之后不通过注意就可以自动运转的过程性记忆。和需要意识主动参与的记忆。 而有意识主动参与的长期记忆, 有可以继续被分成, 表示概念符号的涉及语言的记忆陈述性记忆, 和与一个具体场景相关的情景型记忆。 通过大脑科学的研究, 这5种不同的记忆形式。涉计到的具体神经回路和工作机制都不同。

比如H.M 并不是不能建立所有的长期记忆, 他还是可以通过训练,获得过程性记忆. 所谓过程性是一种意识之外自动运转的主要和运动相关的机制, 比如骑车,打球,开车,打拳。长期训练后,都是一些自动化的反应, 通过反复练习,不需要意识介入,就叫学会了。

在来自感官的刺激进入意识之后, 有了所谓工作记忆。 也就是著名的7+-2理论, 人能够短时间内记住7个左右的组块。 这七个组块是由输入和记忆中高阶的所谓概念联合得到的。 比如一串数字201711151033,12个数, 猛一看记不住, 但是把它分解成2017年, 1月, 15日, 10点, 33分, 变成了设计概念的5个组块, 人就很容易短时间内记住。

进驻意识的东西都在大脑的新皮层里, 其中与概念是与语言相关的部分,比如你会用一段文字来描述或者回忆事情, 这些功能都在左脑的特定部分,是进化中最后获取的能力。 而与情景相关的, 比如一个场景的图示, 左脑和右脑都有, 但是右脑能力更强一些。你可以回忆起一些特定场景, 主要跟右脑相关。

进化最后获取的能力虽然高级, 但是资源很有限。 超强记忆的秘密, 在于开发右脑, 也就是充分利用情景记忆。 一个有意思的是, 人对感觉的记忆能力很弱,不管是音乐,食物都是尝试过很快就忘记了, 要当音乐家,美食家,红酒专家,需要长期的训练。 大家想想为什么。

没有进入意识的东西, 属于进化初期大脑中就有的, 涉及脑干,小脑丘脑,海马回等回路。 特别是海马回是从短期到长期记忆转化的关键部位。

现在我们回到海兔, 看看在细胞水平不同的记忆是怎么发生的。 海兔当然没有大脑皮层, 以及与意识。概念相关的这些高级货。 但是海兔有类似海马回的东西,也有短期记忆和长期记忆之分。 前面提到过, 对于海兔来说, 通过刺激, 海兔可以改变突触化学连接的强度,从而改变自己的行为。 而实际上,突触连接,涉及到感官神经细胞的释放, 和运动神经细胞的接受, 一开始的所有改变都发生在感官神经细胞的释放部分。 所谓强和弱,取决于感官细胞释放的神经递质,谷氨酸, 的多少。

在感官细胞和运动细胞之间, 还有一组中间神经元, 感官细胞除了直接刺激运动细胞之外,还会同时传送一个很慢的电位给所谓中间神经元, 这个慢电位可以持续数分钟。而所谓中间神经元,接受刺激后,会在适当时间释放神经递质5-羟色胺。这种物质可以用来调节谷氨酸作用的强弱。也就是说实际上有两种回路, 一种是从感官细胞到运动细胞直接传递的叫做介导回路,另外一种是从感官细胞到中间细胞,通过控制直接转递的强弱来影响行为的叫控制回路。 所谓短期记忆, 直接改变谷氨酸的释放强度。 而长期记忆, 与中间神经元的调控作用相关。

Kandel通过研究发现, 甚至不需要中间神经元, 只要按照一定规律给神经回路注入5-羟色胺, 就可以影响谷氨酸的释放水平。 最后让突触的连接长时维持,比如长达数日之久。 而在细胞里存在着两种蛋白, CREB-1, CREB-2, 一种用来激活,一种用来抑制。 一旦刺激反复呈现, 超过某种阈值, 让CREB-2失活, 细胞间就建立了永久联系, 也就是所谓形成了长期记忆。 而如果刺激足够强大, 一次就可以突破阈值, 建立长期记忆, 这就是所谓闪光灯式记忆。

在随后的研究中, Kandel还进一步发现, 新突触连接的形成, 还可以进一步细分为两种,所谓启动和维持, 是两种不同的机制。这些变化都涉及到基因转录, 都需要细胞核的介入。突触的形成需要一种信使RNA, 按照Kandel的比喻, 是王子吻醒了睡美人.所谓王子,也是一种特异蛋白CPEB,用来激活转录RNA。而前面提到的5-羟色胺的刺激,正是用来激活CPEB。 CPEB一经激活,就变成了自我复制形态。CPEB激活mRNA, mRNA用来合成两种蛋白酶, 一种蛋白酶A帮助CREB-1, 一种蛋白酶MAP使的CREB-2失去活性。 顺带提一下, 关键的钥匙,特异蛋白CPEB, 与一种阮病毒类似。 细思恐极。

至此,我们在分子水平上, 搞明白了短期记忆,和长期记忆全部的形成机制。 总结一下, 短时记忆调节突触连接的强度, 长时记忆需要形成新的突触连接,改变了结构。 长时记忆的两种, 前面提到的习惯化和敏感化, 一种体现在突触连接的减少, 一种体现在新的突触连接的生成。 以上提到的谷氨酸和5-羟色胺 在人的大脑中,特别是海马回中,发生的同样的作用。

搞明白的记忆的种类,和分子水平的机制之后, 我们终于可以开始谈谈意识。 所谓大脑新皮层支撑的, 人所以为人的东西。 下一篇见!

 

 

 

人:让我们独一无二的科学解释–人是什么系列之三

今天主要安利(做广告)一本书, Human:The science behind what makes us unique,  中文译名:人类的荣耀。  在英文著作里, 如果作者敢用一些简单的名词当书名, 通常说明这本书非常了不起。  书名里的单词越少, 说明这本书越牛逼, 书名敢叫 Human, 讲人是什么, 说明作者对自己作品的内容相当的自信。 所以这本书的中文译名应当就叫人, 或者人类。 译者自作主张加了荣耀两个字, 有画蛇添足之嫌。 吐槽模式结束, 下面进入正文。
按照“人是什么”系列的一贯作风, 在具体说一说书的内容之前, 先介绍一下这本书的作者,认知神经科学的先驱和主要贡献者, Michael S. Gazzaniga, 迈克尔.加扎尼加。可能很多人对这些脑科学,生物化学, 脑神经科学, 脑生理学, 生理心理学,认知心理学等一大堆容易混淆的学科名词感到迷糊。其实也没有那么难理解,这里就先梳理一下。

研究脑和人的学科, 一类是自底向上的脑神经科学。  从底层开始, 是分子生物化学, 主要观察细胞里面的化学反应, 研究分子的层面; 在此之上研究细胞整体行为的是神经细胞学。再上一层可以对细胞组成一个个不同功能集团进行研究, 而从生物层面,有神经生理学, 神经解剖学等等。 以上研究方法主要是面向动物, 因为都是破坏性的。 另一方面从底层来看动物和人, 其实没有什么区别。

但是要研究人独特的东西, 特别是人的意识活动, 总不能破坏人吧(其实是有一段黑历史,主要靠研究战争和殖民地里不当人的人, 并且当年的相关学科曾经飞速发展过 )。碰巧在上世纪中叶之后我们有了非破坏性的观察脑部活动的手段, 包括PET 同位素成像和fMRI核磁共振等, 以上手段和一种通过外部扫描来重建三维的技术CT 结合, 就可以得到大脑的三维影像,并可以据此观测大脑的活动。于是就有了用fMRI和PET来研究大脑的脑神经科学。

另外一路研究手段是自顶向下研究人的,也就是这个系列文章讨论的心理学。 心理学一开始就把人当作一个整体来研究。 但是因为人太复杂, 很容易就抓不住头脑,开始似是而非,甚至胡说八道。 中医理论就是犯了这种方法论的错误。

要科学研究, 就得有能控制的实验。 而心理学的研究, 按照心理学女博士的说法, 主要靠三种手段:

  • 第一种就是研究自己, 自己的想法自己最清楚, 心理学大牛们没事就研究自己, 包括弗大夫在梦的解析里解析了自己好多梦。
  • 第二种是问别人, 各种心理学的问卷,量表,访谈都是在干这个的。 这样拿回来的数据, 很有可能有系统性的偏差, 这里先不展开, 有机会再说。 总归不是那么那么的靠谱。我自己的工作,用户体验研究主要依托的就是这类手段, 所以其实我在否定自己, 请各路高抬贵手,不要爆击。
  • 第三种就是观察统计人的行为, 行为学派就典型代表。给人各种刺激, 观察他们的反应, 然后就能得出结论。 行为学派因为有效, 能出结果, 曾经长期占领心理学界。 只从外部观察,把人当作黑箱的想法相当的极端,这一派的人也都比较极端,容不得别家的说法。 一极端, 就有反弹。所以现代的心理学特别是认知心理学都要研究人的内部活动。 长期以来, 这种研究依托脑电这类非常粗糙的技术手段。 得出的各种结论非常经不起考验。 这么多年都过来了, 也真不容易。

而从上到下的心理学, 和从下到上的脑神经科学终于遇到一起了, 两者的交叉就是所谓认知神经科学,cognitive neuroscience, 这是一门试图通过研究神经的生物过程来理解脑认知的学科。主要从上下两个层面来试图搞清楚大脑的功能性活动。 所以俺们研究AI的, 应当多多跟踪这个学科的进展。

这一梳理就收不住, 按照快消费时代的阅读,感觉这篇文章要结束。 下面还是回到加扎尼加。 他有一本叫做双脑记的书, 从自身经历来讲述自己的科学研究。 开篇就写到要告别弗大夫, 你过时了, 我们懂的比你更多。 哎, 又想跑题, 收住!

加扎尼加也是上帝的宠儿,他是弗大夫去世那一年出生的(冥冥之中有天意),  从小在加州长大, 有个外科手术医生的老爸(他一家子都是医生,他外祖父是洛杉矶著名的整形医师)。据说也是个从小就在车库里做实验的天才宝宝。 读本科的时候他跑去了美国东北的达特茅斯学院。 加州好大学不少, 他非要横穿美国跑到东岸, 不知是不是年轻时候的叛逆。 总之,他叛逆期一结束,就回到了加州。 学术生涯的一开端, 就在加州理工师从曾经得过诺贝尔奖的罗杰.斯佩里大师攻读博士学位。

加州理工是个规模不大的标准精英学校,陈天桥两口子刚捐了一亿美元给他们,主要是为了这个学校的脑科学研究。  这个学校当年就可谓群星闪耀,牛人众多。 据说别闹了,费曼先生就经常来加扎尼加的实验室串门。 有一回去捉拿逃跑的实验动物, 加扎尼加差点撞倒了量子化学的创始人鲍林先生。 总之天天听大师教诲的学生也必然非同反向。 加扎尼加当时做的事情主要就是研究一个心理学历史上非常有名的被试:裂脑人,威廉.詹金斯。

威廉.詹金斯是个美国伞兵, 二战时有一次参加在德国的敌后跳伞行动, 落地时被德国人包围, 被一个德国军官用枪托打到后脑,打翻在地。 当时的德国已经是强弩之末, 不久之后威廉就被解救出来送回美国。 然而此时他的得了严重的癫痫,已经没法靠药物控制。 按照当时的医疗手段, 只能做裂脑手术(把大脑左右半球中间的连接体切开)。

裂脑人威廉在治病的同时, 被他的医生约瑟夫.博根介绍到了加扎尼加老师斯佩里大师的实验室。 于是加扎尼加开始了对裂脑人的研究。 据他自己说, 当时他每天都和斯佩里大师探讨至少两个小时, 生活中唯一有意义的, 就是老师, 思考, 和裂脑人实验。

现在我们都知道大脑两个半球, 左右脑的功能不同, 各种左右脑训练在社会上泛滥。 当年可从没有人这么想过。自斯佩里和加扎尼加开始。 通过一系列实验, 他们意识到了大脑两个半区功能的不同,和裂脑人的医生一起, 三个人发表了一系列研究报告, 并据此提出了左右脑分区的学说。斯佩里更是拿到了诺贝尔奖。

加扎尼加毕业以后对自己的裂脑人研究并不满意, 他一直试图理解大脑是“如何产生意识”这一个关键问题。 为此他开始广泛的游学交流和碰撞, 特别是碰到了另外一个著名的心理学家, 提出了记忆7+2理论的乔治米勒, 两人共同创建了认知神经科学。

加扎尼加不光博古通今,研究范围广阔, 还特别善于写故事。 他把自己的理论思考,以及各个学科的进展通过写作科普读物的形式介绍给公众。 Human, 就是在2006年写的一本科普著作。 也是有关人是什么,从各个角度探讨, 包罗万有的一本书。 从面向大众的书籍里面, 我还没见过另外一本涉猎更广,更有深度的书。能够相提并论的都没有。 因此强烈推荐大家去读读书, 因为加扎尼加的文笔, 这本书读起来也非常容易。

写文章通常是要开门见山。 而这篇推书的文章竟然三页不说书的内容。因为实在是看书就好,这样才不会错过各种精彩。 但这里还是大概啰嗦一下书里都讲了什么, 供大家参考。

这本书主要讨论的就是人是什么, 人和动物有什么不一样。一共四部分。

开篇试图从生物的角度, 特别是DNA来解释。 比如对比人和黑猩猩, 在人的DNA里只有一小部分不到2%参与遗传编码, 而这2%里, 只有1.4% 人和黑猩猩不同。 但是不要小看这1.4%的不同。 只要一个基因不同, 甚至一个碱基对不同, 就会有很大影响。两个特殊的基因, 小脑症和ASPM基因让现代科学意识到人其实一直在基因层面有进化。

第二部分讨论人的社会性。 很多人知道一个社交的150人原则。 在这本书里说, 黑猩猩的群体规模只有5o人左右, 因为黑猩猩的社交主要靠给对方理毛, 每天黑猩猩之间要用大约20%的时间理毛。 所以这是黑猩猩社交,建立信任的基础。而人会说话, 经过研究发现, 不管多少人在一起, 对话通常是4个人一组的小群体, 一个人说,3个人听。 一对三, 和理毛的一对一比较, 人比猩猩的效率高三倍。 于是黑猩猩能搞定50个黑猩猩, 一个人能搞定150个人。 书中如此这般的启示比比皆是。

第三部分讨论人独特的东西, 比如说美和艺术。 作者说艺术和美不同。 美可以人人有, 艺术是社会层级的产物, 是由社会精英创造, 大众试图模仿的东西。 在现代社会, 艺术强烈的与金钱挂钩, 因为现代社会地位已经由金钱的多寡来代表。

第四部分, 简单的讨论了一下在人的生理限制之上, 还能做什么。 作者持开放的态度,认为人和AI或者其他机器的结合, 可以进一步扩展人的能力和范畴。

以上简单提及了书里面的部分内容,仍然是 挂一漏万。重要的事情要说三遍。 再说一遍,去读书!

(全文完)

 

从弗洛伊德到皮亚杰-人是什么系列之二

昨天写了一篇文章简单说了说心理学的三大门派和核心思想。 本来接下来想谈谈所谓超验和证悟这种玄之又玄的东西。 但是文章写完应者寥寥。心理学女博士评论:对心理学理论讲的太少, 而且不透。 一篇文章当然写不完一个学科一百多年的积累, 本来只是想从三巨头的生平出发,来抓住他们理论的主要脉络。

个人觉得这个文章应当是相对比较好懂的, 不知为何没几个人看。 反省一下, 也许跑的太快了, 大家没有跟上。 因此这次先不谈超验。 回来再看看心理学的另外一类研究, 从教育和发展的观点来看一个人是怎么成长起来的, 也许也会是一个有启发的角度。
还是从弗罗伊德的人格结构, 本我,自我, 超我谈起。 前面一篇文章说过, 马斯洛在此基础上, 做了扩展,变成了他自己的五层理论。 弗洛依德大夫是个悲观主义者, 他看到的是本我和超我的各种冲突。 在他眼里恐怕, 人之初,性本恶。而马斯洛教授是个乐观主义者,他觉得只要满足了这些动物性的欲望, 人就可以追求更高的东西。因为能够自然追求更高层面的东西, 所以是人之初,性本善。 以上的解释有点牵强, 但是可以帮助大家理解。回到弗大夫的理论,做为一个天才人物,他不光是提出了本我,自我,超我,还同时提出了意识本身的层次结构。 他把整体意识分成了三层, 即意识, 前意识, 和潜意识。潜意识又叫无意识。 所谓意识, 是自己能主观注意到的东西, 只是整体意识的很小一部分,类似与露出水面的冰山一角。
大量与心理活动相关的内容,实际上是意识注意不到的,水面下的冰山。 而水面之下的隐藏意识, 又可以分为前意识和潜意识。 前意识是水下冰山里可以进入意识的一部分, 一般人前意识都可以转化为意识。而潜意识是真正看不到的东西, 也许来源于生物的进化和潜藏的记忆。

对一般人来说光凭意识是看不到的潜意识层面的。但是特殊的人不一样, 有人能够看到自己的潜意识,并且利用潜意识, 这就是所谓超验体验的基础。 这个容我们以后专门再说,这里就不展开了。 类似的整体意识层次理论, 也符合现代脑科学的研究和认识。 可见弗大夫的天才, 一下就抓住了事物的本质。

除了意识的分层, 弗洛伊德的人格结构:本我,自我,超我, 还外带一套发展理论。 这就是大家可能早就听说过的力比多驱动, 从口腔期, 肛门期, 生殖器期, 潜伏期,直至青春期真正成熟的发展过程。 弗大夫要治病救人,因此他的学说是用来看病的。他说如果在各个发展阶段力比多被抑制了, 就会生病。 他并不研究正常人是怎么一回事,从正面来看该如何引导这个发展过程。

要正面引导, 也就是所谓教育, 需要介绍另外一个天才人物, 皮亚杰皮老师, 他的一套人格发展理论, 是现代教育方法的基础理论之一。 我们还是从他的生平说起。

皮亚杰比弗洛依德晚一代, 和斯金纳一样,都是在世纪交替时出生的。 他是瑞士人, 父亲是个大学教授, 家境优越。 因此可以说有非常幸福的童年。他很早就接触到了所谓科学研究的方法: 通过细致的观察实验, 来研究事物,并在此基础上,通过系统总结来提出理论。 10岁的时候, 他在公园里玩耍时发现了一只得了白化病的小麻雀。就把麻雀带回了家。天才总是和常人不同,他并没有把麻雀当个玩具, 而是通过观察总结, 写了一篇关于白化病麻雀的论文, 并且在当地的科研期刊上发表了!

这篇文章引起当地自然博物馆馆长的注意, 邀请他主动参与博物馆对标本和生物的研究, 并随后发布了一系列文章。 特别是有关软体动物的文章, 在当时的欧洲动物界引起了很大的反向。 这时,他还是只是一个十几岁的少年。

作为一个学霸, 皮亚杰19岁就大学毕业, 22岁拿到了生物学和哲学双博士学位。 随后去了巴黎游学, 3年之后又拿到了法国科学博士学位。 相比胡适博士的名誉博士,人家皮亚杰拿的可都是真博士。博士拿到手软之后, 皮亚杰又回到了瑞士, 在日内瓦大学独挡一面, 开始创立自己的学说。 此年他25岁。

事业有成, 就当考虑家庭, 安定之后, 皮亚杰结了婚, 并随后的6年间有了两个女儿和一个儿子。 因为皮亚杰有那么多货真价实的博士学位, 他也就同时跨学科担任了好几个学科包括心理学, 社会学, 哲学, 科学史等等的教授。 学霸中的学霸小时候靠观察一只麻雀就能写出有影响力的文章。当他有了孩子之后, 通过对自己的三个孩子更细致的观察, 皮老师发布了一系列关于儿童心理学的论著。 成为了儿童心理学的世界级权威。特别是他本人的跨学科背景, 和自幼年就培养起来的的犀利视角, 让他对从出生,到幼儿,直到成年的儿童发展过程有了更为深刻的理论思考。这比弗大夫的口腔期,肛门期可深度多了。

皮老师曾经担任过国际心理学会主席。 各种心理学的最高奖励拿到手软, 有60多本专著, 500多篇论文, 多个国家的几十个名誉博士,名誉教授, 名誉科学院士。 直到80多岁去世。走完了一个学霸应有的光辉灿烂的一生。 令人羡慕不已。

与弗大夫的学说不同,作为一个科学家, 皮老师的认知发展理论包含大量细节,不是三言两语能够讲清楚的。 这里勉为其难说说一些基本的概念, 建议有机会还是要认真读读皮老师有关儿童心理发展和教育的专著。 才能体会到学霸的深刻思想。

从哲学的角度, 皮老师认为心理发展过程是一个主观和客观交互作用, 共同促进的过程。 其中的核心观点是所谓图示schema。 图示是认知活动的基本单元,  是相对固定的, 在认知活动中会不断重复;  另外又能随之变化发展的模式和结构。以上这段话可能不太容易理解。 拿行为主义来做对比, 行为主义只注重可以观察到的外部输入和输出,认为观察不到的人的内部心理活动是一个黑箱。

而图示的概念是试图结合行为来表征人的内部心理结构。 这样人就不是黑箱,而是由一个一个相对固定的模式或者节点构成的网络。 人的心理活动, 就不单单是输入到输出,而是从输入到图示再到输出的过程。

在人和外部环境互动的过程中, 图示只是相对固定, 实际上是不断调整变化的。可以把这个变化过程当作是适应和学习的过程。 图示由少到多, 由简单到复杂, 不断发展。 皮老师把这个变换发展过程分为两类: 同化和顺应。

所谓同化, 是一个量变的过程, 通过对外部环境的适应来调整已有的图示, 让图示变的更丰富, 更复杂。 顺应则是一个质变的过程, 在顺应中旧有的图示发生了根本性的改变或者产生了新的图示。举个例子,蓉蓉家里养了一只金毛狗, 她出门又看到了博美,京巴,松狮等等各种不同的狗,于是她认识的狗就越来越多,但还都是狗,这就是同化。 有一天她去了动物园, 看到了老虎狮子, 这就不能当狗了, 就要顺应了。 从动物园回来, 蓉蓉就认识了狗, 老虎和 狮子。

同化和顺应是并存的。在此之上, 还有一个平衡的概念。当一个人熟悉了周围环境了, 可以说是平衡了。而环境中出现了新的刺激, 按照原有的认知不能处理, 就不平衡了。比如蓉蓉不认识老虎和狮子,就不平衡。而通过认知活动, 同化和顺应的过程, 能够处理这个新刺激了。 就又平衡了。蓉蓉终于还是学会了辨认老虎和狮子。 从平衡,到不平衡到再平衡就是一个学习的过程。

按照皮亚杰的理论, 智力并不是完全由基因决定的, 在教育学习的过程中, 可以不断变化和成长。 从平衡到再平衡的过程中, 个体要采取动作,要take action, 这是心理发展特别是认知的来源。

人通过探索世界, 通过主动行动,收集反馈来建立自己的认知。  整个发展过程, 大概可以分为以下四个阶段。

  1. 感知运算阶段, 0-2岁。婴幼儿从一出生就会的基本条件反射开始,  慢慢的通过一些动作行为去适应环境。这一阶段,人会从一个仅仅具有反射行为的个体逐渐发展成为对其日常生活环境有初步了解的问题解决者,但是仍然只有基本的直观感知。
  2. 前运算阶段, 2-7岁。幼儿将感知动作内化为表象,建立了符号功能,可以凭借心理符号来进行思维,从而使思维有了质的飞跃。所谓符号对应的就是语言, 会说话了就是不一样。
  3. 具体运算阶段,7-11岁。在本阶段内,人的认知结构由前运算阶段的表象图式演化为运算图式。人开始有了抽象概念,同时也就有了逻辑,但是思维活动还需要具体内容的支持。虽然能够算算术,还是不能脱离数苹果。
  4. 形式运算阶段,从11岁开始一直发展。这个时期,人的思维发展到抽象逻辑推理的水平。思维形式开始摆脱内容。于是人就能够摆脱现实的影响,关注所谓假想的命题,可以对假想的世界作出基于逻辑的和富有创造性的反映。人类发展出了自己想象中的世界。而一旦想象中的世界出现, 就比现实世界更丰富多彩。 我们现代人的生活实际上是主要基于想象世界的。 人类活动的主要部分都是围绕想象世界展开

皮老师的阶段发展理论,可以为儿童教育不同阶段需要注重的内容提供一些参考。 但是现代小孩远比皮老师时代的小孩早熟。 所以相关的年龄阶段划分也仅供参考。 特别是天才,完全不在此列。 皮老师自己10岁就能发表文章, 一定已经进入了形式运算阶段。

抓住皮老师思想的重点, 我们就知道学习是一个练习的过程, 特别是需要反复的练习。而从平衡到再平衡的理论,又解释了如果要有效学习新的东西, 一次不能学的太多。那就会引起混乱。 现代的所谓刻意学习理论,是在此基础上的进一步发展。 刻意学习, 一万小时定律,是我们当下能够掌握的最好的学习方法。因此不管怎么强调都不为过。

有关学习的心理学简介到此结束, 下一篇我们要不要讨论超验呢? 也许要应当先说说无意识, 以及有关梦的心理学解释。 谢谢观赏!

NP=NP? 从计算到智能的终极问题

你是一,也是万! 是刹那,也是永恒!

I’m the Alpha and the Omega,the First and the Last,the Beginning and the End.

 –新约.创世纪

二零XX年, 历史揭开了新的篇章,  计算宇宙中的第一个人诞生了,  这是一个新的纪元. 史称人工智能元年。

如果要写本小说,  我大概会以这样的句子作为开场。人工智能开始火热以来,大众能够接触和理解的文章里各种荒谬和误导太多。而领域内的学者们又忙于写论文。学者精英和公众之间出现了鸿沟。要想通过传播知识在这个鸿沟之上架起桥梁,科普文章是一种方式。而传播学告诉我们, 其实公众更喜欢故事, 如果有一本像样的科幻小说, 可能比多少篇科普文章更有效。所以写本关于人工智能的小说, 是我埋藏很久的一个愿望。  但是个人能力时间所限, 这本小说还得等很久, 或许会胎死腹中。 大部头之外,一些片段思想可以单独谈谈, 今天就来说说有关计算和智能的基本问题。

不知道读者里有多少码农? 学计算机的人,都学过关于计算的一般理论。 知道我们把所有计算机要解决的问题,也就是可计算的问题分为大致两类, 一类是所谓多项式问题P问题, 一类是非多项式问题NP问题。

多项式问题最简单的是0阶,或者1阶线性N, 如果复杂度是2阶的N平方关系,问题规模一大就玩不转了。一阶二阶之间还有个NlogN, 大概是计算机能够愉快玩耍的边界。 因为0阶,一阶过于简单,二阶又有点复杂, 我们观察到的大部分算法和技巧, 都是试图把一个问题搞成NlogN。

而非多项式问题NP问题又有NP,NP hard和NP complete之分, 这两个概念经常会被人误解,一个直观的理解 NP complete问题比NP hard问题更难就是错误的。 正确的理解,首先要知道什么是可计算的问题。

所谓可计算的问题, 就是假设我们找到一个解, 这个解到底对不对, 是可以在P这个量级的计算上判断的, 如果连这一步都做不到, 那干脆什么都做不了。 可以在P计算上判别的问题, 如果问题的求解还找不到一个P算法。 那就是一个NP问题。 而NP complete问题, 就是NP里面最难的一类, 这一类问题是等价的,如果解掉其中一个, 说明所有的NP问题都可以解掉。而NP hard问题不光包括P计算判别的有一类, 甚至可以包括不能在P计算上判别的问题, 这类问题目前根本无从下手。

拿围棋来举个例子。下围棋是很难的,想算出下一步该怎么下,非常非常困难,尤其是一开始布局的时候。 而越到后来,越接近终局,越简单。收官的阶段,计算机早就胜过人了( 因为人容易出错, 计算机不会出错) 到最后 一盘棋下完了,判断输赢是很简单的,谁都会数子。所以下围棋是个典型的NP问题 ,也许还是NP complete的(没查过)。

自NP问题的定义提出以来,无数计算机科学家和数学就试图在证明NP=P。意思是这些看上去很难的问题, NP问题, 实际上没有那么难, 有P多项式的级别的精妙算法。 如果有这样的证明, 所有这些可计算的问题都能计算, 世界将是多么的完美。。。。和无聊啊。

本文站在哲学的高度, 驳斥了P=NP。 NP问题就是没有P解法,世界才如此的丰富多彩。 为什么?

还是从计算理论的核心思想谈起。 我们经常把人比做计算机。 计算机也被叫做电脑。 从计算的角度来看, 这样的类比其实正是抓住了问题的本质。 换一个角度, 我们知道人是很聪明的, 所谓聪明体现在那里,也就是智能是什么,很多人讲不清楚。 我在这里给聪明或者说智能给一个定义, 所谓真正的聪明或者智能就是能够建立数学模型。

我们知道大部分动物都是不会数数的,  单凭直觉, 乌鸦(最聪明的鸟类之一)大概能够数到4, 对乌鸦来说, 他们的世界是0,1,2,3,4,无穷。 而在发明数学之前,人也不是太会数数, 对不会数数的原始人来说,大概也是0,1,2,3,无穷, 比乌鸦还要笨一点。

而一旦发明了数字, 人学会了数数,就走上了与动物不同的不归路。 我们不光学会了数数, 还发明了加减乘除,也就是计算,我们称之为发明了数学。随后计算就变的越来越复杂,数学也就越来越复杂。 而通过物理, 计算和大自然联系了起来。所谓物理, 就是用数学公式来描述大自然的一般规律。  我们认为一个事情有没有理论,是不是掌握发现了其中的规律, 等同于这个事情能不能用数学公式来描述,能不能建立数学模型。 我们管能建立数学模型的,并且用模型能够对事实做出预测的叫做科学。

按照以上说法, 我们把这个世界分为两种, 可能用科学理论精确描述的世界。 不能用科学理论精确描述的世界。 对前一种, 我们非常擅长, 对后一种。。。 我们一直在试图把后一种转化为前一种。 就象大家一直在试图证明P=NP一样。

能够用数学描述的世界只占现实世界的很小一部分。数学理论发展到二十世纪下半段, 发现了所谓混沌现象。 所谓混沌,大概的意思是, 就算我们已经有了数学模型, 按道理就一切尽在掌握中。而实际上, 我们还是掌握不了, 因为混沌是一种非线性系统,其中非常微小的初始条件差别,会导致特别不一样的结果。 要预测未来, 只能一步一步算, 这种计算还要足够足够精确。 时间一久,其实算不过来,也就混沌了。

混沌现象出现,引发了对复杂系统的演化的研究。我们发现 大多数自然,生物,人类社会的现象,都可以归结为一个复杂系统。 所谓复杂系统, 是从系统的局部,或者某一个时刻,能够建立数学模型,但是模型是非线性的,一旦开始演化,整体的结果就不可以预期了。  混沌的世界远比能够数学建模精确描述的简单世界更大(简单是因为只有线性)。

前面把智能,定义为数学建模的能力, 而混沌理论告诉我们,即使建了模也没有多大用处。 那该怎么办? 在计算机出现之前, 大概有两条路。 一条路走上了玄学, 之前我们谈过的周期律就是这类东西。 一条路叫做概率统计。

还是拿围棋来举例说明。从全局来说, 整个围棋世界是有始有终的,从一个空盘开始落字, 到填满棋盘,围棋终将会分出胜负, 棋局就结束了。 理论来说, 围棋是有个最优的唯一下法的。 所谓上帝一局。 但是从计算复杂理论出发,因为只能算, P又不等于NP, 要想明确算出上帝一局,调动全部现有的计算资源也不够。计算能力限制了探索问题的边界, 我们其实没有办法找到这个能够证明是最优的上帝一局。 只有上帝知道。

假设一个智能棋手生活在围棋的世界, 唯一目的就是下棋。这个围棋的棋盘很大很大,当然比现有的围棋棋盘大很多。 而棋手只能看到眼前的一小块棋,看不到边界, 那他会怎么理解世界呢? 影响棋手的聪明程度一个关键是他的记忆能力。因为棋手们会通过总结下棋的历史来试图掌握规律,他能记住多大一段历史,大大影响了他下棋的策略。记忆能力强的,看到的棋局也大,会认为这个世界很复杂。 记忆能力小的,看到的棋局小,极端情况, 假设只能记住之前一步,那么策略可能就是往有空的地方走。根本够不上叫一个复杂系统,或者说没有智能。

而记忆能力比较强的棋手会有什么样的策咯? 我相信他早晚会发现自己处在一个复杂系统中,而且掌控不了全局。只能根据已知的历史和当前观察到的范围做出判断,把全部未知的东西, 当作随机。 这些随机的东西虽然捉摸不定,但是总体上还是有些规律, 于是棋手很可能会发明统计,并且用贝叶斯公式来计算棋局。 他的记忆越多,计算的越多,表现出来的行为模式也就越复杂。 于是就出现了智能。

因此智能的出现可以理解为有记忆和能计算。 智能的门槛是足够包容一个复杂系统。 在此前提下,计算能力越强, 记忆能力越强, 就更智能。对一个智能体来说,能够观察到的世界是有限的, 而世界本身就是一个复杂系统, 因此世界永远是捉摸不定的,随机的。 正是这种随机性, 才让世界如此丰富多彩。

不管你同不同意, 计算的出现,构成了一个新的宇宙。 足够复杂的计算可以被当作这个计算宇宙中的智能体 。计算宇宙中的生命, 叫做人工智能。 P不等于NP, 是这个计算宇宙成立的前提。

以上从哲学观点说明了P不等于NP,

等等, 本文的标题不是P=NP,而是NP=NP? 标题没有写错, 这里想说的是,站在哲学的角度, NP肯定不是P,这个不是问题。(期待学数学的童鞋来暴击)  我们需要搞清楚的,每个NP会不会有不一样?

比如围棋的世界和现实世界等价吗? 我们如果在计算的世界创造了人工智能, 他们的世界和现实世界是有所不同,还是完全一样? 人工智能还能够发明新的世界吗?

Wolfram的答案是, NP=NP,  他说他已经证明了。 我宁愿不同意, 实在不想丰富多彩的各种宇宙都终结于一条规则。

按照我们当下的知识, 我们存在的物理世界也是一个有边界的世界。 与围棋世界没有根本上的不同。 下出来的棋, 就不能收回去,时间只有一个方向。 有边界的棋局早晚会被填满, 而物理世界终将归于热寂。 除非:

NP 不等于NP

其实还有不属于NP的NP hard世界,那个世界完全不可理喻,我们不去玩儿。

谢谢观赏!

 

 

 

 

 

2016年终总结展望:人工智能三愿

终于到了2016年的最后一天,这一年就要过去了,我们终将会还念她。这一年世界很乱,非常乱,一对照就能发现本国的安定,让人觉得十分难得。对一个普通青年来说,最重要的还是生活。因此期望能有更多的平静,整个社会能少些戾气多些思考,最好还能再少一点点雾霾。如果要对2017年写三愿,我希望是:1,保持稳定; 2, 自信一些;3,风再大点。

鞋匠就该评论鞋子。作为一个从事人工智能行业的普通中年,还是老老实实的说自己的本行吧。2016年是非常热闹的一年,这里简单梳理一下这一年的重要进展,然后谈谈对明年的一点点期望。以下是正文。

大家都说2016年是人工智能元年,直观上的感受,人工智能火的不得了。这种感觉对不对?

我们先把时间调到2015年底,看看当时的人怎么预测。在2015年底,谈及人工智能,大家最先能想到的还是语音应用siri,深度学习的种种进展还局限在一个较小的范围内。因此当时的人谈到的都是比较实际的应用:2014年发布的亚马逊音箱销量不错,语音助手类应用看到了新的曙光;无人机市场相当的火爆;最后是各种机器人,工业类的,服务类的,消费类的,不过泛泛而谈的多,认真说的少。science评选的2015年十大突破没有一条和人工智能相关。Science也许太学术,在公众关心的突破科技榜单里,能搭上人工智能这条线且最火爆的是Magicleap。顺带提一下在当时中国的产业界,最热的名词是大数据。

再把时间拉回来,2016年底science的十大突破里Alphago终于上了榜。做为人工智能的里程碑和当仁不让的标志性事件,Alphago的影响怎么拔高都不为过。因为这是一个远远超出绝大多数人常识认知的事情。大家都觉得电脑围棋也就能跟业余高手玩玩,离职业棋手还差十万八千里,突然间就4:1干掉了前世界冠军,而且下出了捉摸不定的妙棋。就好比昨天还在公司年会上卡拉ok的小英,今天就站在了维也纳金色大厅舞台上演出美声独唱专场。这种强烈的反差必定让所有人记忆深刻。

有了Alphago造势,大家忽然就觉得人工智能要无所不能了。 加上六国苦秦久矣,2008危机之后,需要续命的资本主义经济等待的新技术突破迟迟未来。人工智能迅速被抬升到所谓信息技术革命之后又一次技术革命的高度。各种资源疯狂的扑了上来。媒体里,人工智能开始各种琴棋书画,无人汽车一定是个未来产业革命,各种机器人要取代90%以上的现有人类工作,还有VR/AR做为手机之后的下一个可能的硬件平台,都让人浮想联翩。

有推波助澜的,就有唱反调的。 人工智能也被搞出一些黑历史。 年初的时候一个聊天机器人在网上乱说话,据说是种族歧视。聊天机器人其实挺无辜,它只是有样学样,不知道说话要分场合,特别是要看身份,有些话有色人种说是自嘲,白人说就叫歧视,违反了政治正确。还有Tesla的自动驾驶模式出了好几场车祸,死了人,这个确实没有什么可辩解的, Tesla有点冒进了。

古人讲做事要低调,诚不我欺也!Magicleap在2015年最火,2016年就要倒霉。一下就遭人毒手,变成了一个大骗子。其实媒体各种不待见,抓眼球热点事件的心态可以理解,但是一拥而上无脑黑,实在有点过了。毕竟Magicleap做了一些实在事情,而且是不是演出都标明了。 还有一个搞笑的深圳小胖机器人伤人事件。据说是史上第一次机器人起义,其实完全是操作人员操作失误弄出了个乌龙,没有机器人本身什么事。

扫掉表面这一层浮沙,人工智能里还是有不少真金的。 今年比较出色的工作包括,超级深的网络,对抗式学习等等。自然语言处理相关领域也有很大进展。从word2vec的各种衍生工作,到微软刚刚发布能做几十种语言对话翻译的APP。

总结一下:科技发展前进的道路总是有起伏的,何况人工智能这种前路漫漫实属早期的科技,但是只要脚踏实地,前路可期!

在此为新的一年里人工智能行业写下两种愿望:

  1. 不畏波折。
  2. 低调一点。

最后说说人工智能相关的硬件的进展。 今年的人工智能进展炒热了GPU, Nvidia的股票连翻跟头。有人说GPU就是人工智能行业的发动机。从当前的人工智能市场来看,这样说没错。 人工智能发展还在早期拼算法的阶段, 为此在服务端做计算是明智之举。

在服务端做计算,不管是训练还是推断(inference)Nvidia 的GPU在生态系统和投资回报上全面领先。同样是GPU, N家的开发框架CUDA/CUDNN 远远甩开了原来图形卡时代的对手AMD。 计算领域的老大,Intel被打了一闷棍,最近终于缓过劲来了,开始各种收购,反击,口水仗。

服务平台是大公司的主战场。而随着人工智能发展,会逐渐下探到各个行业应用, 计算一定会慢慢迁移到端上。在端上的计算依赖于具体应用,很难被人一统江山,因此从道理上应当是中小公司的用武之地。有很多公司一言不合就要做芯片,瞄着的就是这个方向。但实际上,当前阶段做芯片的风险非常高, 因为算法还在不断发展,算法没有稳定之前,如果做出芯片,算法又有突破,岂不一出生就过时?

话说回来,做芯片也不是全没机会。 从应用出发,如果应用领域够量,而现有的技术算法性能已经可以满足要求,还是可以通过专用芯片的功耗,体积,成本优势来占领市场。语音识别也许就已经出现了这样的机会。

在这里为人工智能行业特别是做硬件,写下第三个愿望:

3.看的准些。

文章的最后,感谢一下鲁迅先生,明眼人知道我在模仿先生的“航空救国三愿”,个人非常喜欢那种文风。

 

 

气说新解: 有关本源问题的探讨

昨天写完周期律,有点意犹未尽, 篇幅所限, 很多东西都没有讲明白。但对于一篇网络文章来说,这样的东西已经有点不合时宜了。估计大部分人看了开头就关掉了。现代社会讲快消费,懒得思考,这种费脑子的东西,不想也罢。读者们想看的是具体的指南,比如明年房价涨不涨,汇率要跌到哪里,下一个产业热点是什么之类的东西。就算是跳大神,他们也爱看,因为不费脑子,关乎金钱,迎合了兴趣点。这类东西,正是所谓抓住的用户的痛点。

应当讨好读者,还是讨好自己,对每个写作的人都是为难的事情。 按照周期律,或者复杂系统(计算宇宙里几乎一切现在搞不明白的事物都是)演化发展起起伏伏,螺旋上升的规律,写文章一会儿迎合读者,一会儿由作者发挥, 才是正确的作法。这样作者和读者可以共同学习探讨,螺旋上升。因此本文将在迎合作者的路径上再走一步,想来放松的读者可以就此止步了。我们明年再见!以下是正文。

所谓周期律,按照方法论来说, 是易,易是阴阳转化,往复循环,螺旋上升的复杂系统演化规律。而复杂系统是一个远离平衡态的非孤立系统。 我们都知道热力学第二定律, 孤立系统就会墒增,最终归为死寂。我们已知的宇宙,按照大爆炸理论,是有边界的,像是一个孤立宇宙。于是可以推论,宇宙终将归于寂灭。恒星燃烧完自己之后,变成矮星或者黑洞,围绕恒星的行星上假设有生命,一定逃不过这一劫。比如太阳的死亡对于人类来说,就是一个死结,只有搞出星际飞船。 等到银河系死亡,得换星系,那么全宇宙都死亡了呢?

也许事情不是这样的, 子曰,未知生,焉知死。考察宇宙的诞生,按照大爆炸理论,似乎砰的一下,各种负墒就凭空出现了, 我们是不是在宇宙消亡之前能搞出另一场大爆炸,造出负墒,为生命利用呢?

按照现有的理论,宇宙大爆炸的起点是一个奇点, 也就是无穷, 宇宙再大也是有穷的,也是可以理解的。而大爆炸理论说,这个有限世界是从无限中来的。 所谓无穷生有穷, 有穷的起源是无穷。无穷想搞明白就难了。黑洞只是一个小无穷, 大家就搞不大明白了,因为现有的数学工具碰上无穷都不好使。 能稍微搞明白一点,就可以成为世间少有的天才人物,比如霍金。

现代科学早已分支细化到各个学科,每一个学科中的具体内容都太多了,超出一个人能够掌握理解的范畴。能够跨学科思考问题就更难。要想掌握全局,只能抛掉各种细节,考察基本原理。相比之下,古人更能看到全局。因为古代和近代人类积累的知识还不多,范围有限,一个人可以全部学会。当时很多推动科学进步的伟人比如伽利略,牛顿都是通才。再往前看,人类知识的幼年时代,一些哲学家的思想就已经足够深入,触及了很多本原的问题,但是因为没有工具,只能提出问题,只能把握整体,下探不到细节。所以往往大而不当,对现实中问题给不出解答。 但这不表示他们的深入思考没有意义。直到今天,我们的全部哲学,仍然跳不出柏拉图曾经问过的问题包含的范围。

回到中国古人对宇宙本原的解释,最关键的概念是气, 道生一,一生二,二生三,三生万物。 中国传统文化,道,儒,释三家互相影响, 各种观点都互相借鉴,这里就不再细分了。古代所有研究“气”的学问,这里统称为气学。按照气学的看法,所谓道, 是鸿蒙,是混沌, 而气是万物的本源,也就是一, 道生一, 鸿蒙中生出气。 气分阴阳,阴阳二气化生万物。 气是一种动态,凝结为物,也就是物质。 而气就在物中流动,尤其是生物,流动的气与死物不同,人是万物的精华,气在人体内可以为精。精从气演化出来,人与万物从此有别。这一大套看似玄学的说法,也许抓住了本质。我们把以上名词替换成现代科学名词, 再重新叙述一遍:

所谓气, 是动态的,不段流动的,  物质的本源。 气到底是什么?  作者说,气就是物理大统一理论追寻的统一的力。 鸿蒙和混沌,就是无穷, 是奇点, 是宇宙大爆炸的本源, 也就是道。 道可道,非常道。 因为道是无穷没法说清楚。

道生一, 无穷中产生了有穷, 也就是统一的力,纯粹的力, 力一出现就按照自己的规律开始流动,转化为阴阳二气, 所谓两种基本力, 力和暗力。为什么是两种? 因为阳就是力, 而阴生于阳, 是暗力,二者互相转化,相辅相成。  二生三,再化生万物。为什么要二生三, 看过三体的人都知道, 有三才有复杂性。光有阴阳还不够。 因为力的表现方式包含能量和场。 其中能量扩散开的的过程中产生了物质。 物质和能量不断演化,构成了已知宇宙,和丰富多彩的生命。 生命中流动的是能量,所谓气已经和本初的气,所谓鸿蒙之气,统一的力有所不同。而气更是在人出现以后化为精。 再由精构成了神,精神也就是意识。

意识是怎么从物质里出来的呢? 这是哲学研究的本源问题, 按照前面的思路, 意识不是从物质里面出来, 意识是从能量里面出来的。 因为能量流动的方式,也就是能量的结构, 有一个描述,叫做墒。 墒代表着信息,所以能量的结构可以定义为信息。按照复杂系统演化理论, 某种信息一经出现,就要维持自身。 可以维持自身的东西,叫做生物。 生物维持自身结构的物质载体,就是DNA, DNA的本质是编码,编码当然也就是信息。

而人的出现,就更加特殊。人与一般生物不同的地方是复杂的意识。 意识是一种特别复杂的信息结构,其中不光包含着维持自身的部分,还包含着特殊的部分,这个部分我们目前只能猜测是某种计算。还需要进一步研究才能搞明白。

气分阴阳,一生二, 纯粹的统一的力先分化为力和暗力。二生三,基本力又接着分化演化, 变成了我们看到的三种:能量/场,物质,信息,这三者就是三才,对应着天,地,人。 这是传统文化的最新解释!

胡言乱语到此结束,谢谢观赏!