学习和记忆-人是什么系列之四

上一篇题外话从计算的角度说了说什么是记忆。这一篇我们回到心理学,来看一看心理学是怎么理解记忆的。 这个话题相对来说又好写,又难写。因为心理学特别是认知心理学以及随后的交叉学科认知神经科学里面有大量的关于记忆的研究内容和结果。 可以说是关于脑研究的最主要方向之一。写一本书都不困难,自然搜集内容写一篇文章很容易。 然而要在一篇网文有限的篇幅内抓住如此之多研究结果,也是一件非常困难的事情。 这里只能搜集一些看上去比较重要的结论,如果忽略了一些关键结论,请见谅。以下是正文。

从心理学研究之父冯特定义了心理学的实验研究方法开始, 记忆的机制就是被研究最多的内容之一。 因为与记忆相关的行为非常容易做实验。 大部分读书学习的人都听过艾宾浩斯遗忘曲线, 或者说是学习曲线。艾宾浩斯也是德国人,几乎跟冯特一个时代, 早在1885年就通过研究自己写了一本书, 叫做“关于记忆”。他观察了自己背诵一个无意义的字母表的过程,看到底自己要用多久才能把这个表背下来。 发现了一些有关遗忘的规律。这就是著名的艾宾浩斯遗忘曲线。直到今天,我们仍然借助这条曲线来帮助学习特别是背诵单词。 考过英文的都懂。

艾宾浩斯之后, 各路学者开展对记忆的研究。因为记忆永远是跟学习结合在一起的, 所以大家都是通过学习来研究记忆。 比如著名的条件反射, 就是最早的相关研究之一。 巴甫洛夫发现, 通过把两个没有关联的事件摇铃和喂食放在一次刺激狗, 狗会自动建立这两者之间的关系。 这就是所谓accosicate learning关联式学习。  不光可以通过摇铃让狗流口水, 如果光摇铃不喂狗,时间长了狗就生气, 不对是刺激反应消退。相关的行为可以总结为以下规律:

  • 习惯化。当一个弱刺激,不产生生理威胁的刺激,反复出现, 同样刺激相关的影响就会弱化。如芝兰之室,久而不闻其香。
  • 敏感化。 一个刚刚受了强刺激的被试,伴随的弱刺激,就算是无害刺激,也会产生强烈的反应。
  • 条件反射。不管这两个刺激之间有没有关联,只要反复同时出现,就会自动建立关联。训练条件反射就是这个道理。

这些早期研究可以说是叩开了学习和记忆基本规律的大门。 相关的过程被总结为记忆三个步骤,获得,巩固, 再现。光从字面上就能理解。

在学习和记忆的过程中,到底大脑是怎么记住的东西的呢。 受到条件发射的启发,加拿大生理学家Donard Hebb在1949年出版的自己的书里面, 提出了著名的Hebb学习规则:当两个刺激同时出现时, 其间的联系会被强化。Hebb认为学习就发生在神经元的突触连接上, 具体表现为两个神经元同时兴奋的时候, 之间的突触连接会被强化。 这里插个题外话,hebb的实验里,人一定需要外界的刺激才能正常生活, 如果把外界的刺激关闭, 比如把人关在一个小黑屋里,时间一长,脑子就会胡思乱想,直到发疯。那些拿关小黑屋惩罚儿童的父母你们自己体会下。

Hebb只是凭自己个天才洞见提出了一种假说。这种假说真正得到验证要等到诺贝尔奖金获得者Eric Kandel对海兔的研究工作。因为人,或者高等动物的神经系统实在太复杂,很难从细胞的水平研究。Kandel找到了一种相对简单的生物, 海兔,开展自己的研究。

海兔可以被当作是海里的蜗牛, 它的神经系统一共有2万个神经元,分成9个组团,或者说是神经节。但就算如此低级的生物, 它的外部行为也是很复杂的,进食,运动,呼吸,心律,产卵,喷墨等等。Kandel小组观察了上述行为很长时间,最后觉得太复杂了, 每个行为都会涉及到一大堆神经元的激活。要想准确研究生物学习到底在细胞水平上发生了什么了。 需要找到只有一个神经元参与的外部行为。 这听上去似乎不太可能, 但是Kandel找到了。 海兔的腹神经节是上述9个组团之一, 有大约2000个神经细胞,涉及心律,呼吸等。Kandel最终找到了一个行为, 缩腮反射,只涉及到一个神经元。真正的两万里挑一。

什么是缩腮反射篇幅所限,在这里就不详细解释了。 总之, kandel观察到, 在海兔的神经系统中, 有24个感觉神经元,接受外部皮肤刺激, 对皮肤的某一点刺激, 会激活其中6个,这个6个把刺激传给另外6个运动神经元,引发海兔对刺激做出收缩反映。终于是个个位数了。 因此可以仔细观察。

跳过研究过程,其实是个漫长的历时数年的实验过程。直接给结论,之前提到的三种学习规律, 习惯化,敏感化,条件反射,都在细胞突触上得到了体现。 习惯化表现为突触电位减小,敏感化则相反。而条件反射的建立,需要两种刺激强刺激和弱刺激满足严格的先后关系,最后也表现为突触连接的强化,而且比敏感化更强。通过以上研究, kandel证明了hebb是对的, 学习就是通过积累经验,改变突触化学连接上的强度和效率,最后导致了生物行为的改变。 说白了学习就是化学调参。

我们从海兔回到人, 相比海兔的2万个神经细胞, 人的100亿个神经细胞当然要复杂的多。 按照我们这个认识什么系列的习惯, 要介绍一个人的生平。就记忆来说,虽然有如此之多的天才和大拿来参与研究,比如提出7+2的米勒等,都不选他们来介绍。我们来介绍一个特别的人,一个被试。现有的记忆理论,基本上都是建立在对这个特殊被试的研究基础之上的。 各路学术大拿都纷纷排队研究他, 也就是H.M。

H.M不是卖衣服的, 他是认知心理学上最著名的被试, Henry Moliason名字的缩写。如同让加扎尼加明白大脑左右半球功能不同的裂脑人一样, H.M也是一个严重癫痫病患者。 H.M出生在1926年, 7岁的时候, 因为骑车摔跤受到了脑损伤,引发了癫痫病。随着他的长大, 癫痫病症状越来越严重, 从间歇性发作到痉挛直至无法控制。 按照当时医生的习惯作法。就是对着脑子来一刀。H.M在1953年 27岁时被切掉了大脑两侧的颞叶,包括海马的大部分。

H.M是一个天性随和幽默的人, 喜欢看电视,玩填字游戏。在手术之后, 他的癫痫病治好了。初看起来一切正常, 但是随后发现,他学不会新知识了。 也就是只有短期记忆,而无法建立长期记忆。 之后直到2008年,他82岁去世前, H.M作为被试被各种专家研究。自己则快乐的过完了一生。他平时的工作生活就是玩自己喜欢的填字游戏, 然后让专家们观察他的脑部活动。在去世后,他的大脑被送到了UCSD做3d切片研究,直到2014年,完成了全部3d模型的重建。

通过对H.M的研究和观察, 专家发现, 他并不是学不会所有的新东西, 他还是能够通过训练,掌握一些新的过程性的技能。 H.M被切除的部分海马, 是大脑中最古老的部分之一, 几乎所有的生命, 包括低级的海兔, 都有类似的海马回。 而海马,被认为是短期记忆,通向长期记忆的路径。 好了我们听到了各种有关记忆的名词,为了避免混乱。 这里统一梳理一下。

首先, 人的记忆机制并不是单一的, 而是有多种工作方式不同的部分。 最简单的划分,从hebb的研究工作中来,可以分为与刚刚发生事情相关的短期记忆和除此之外的长期记忆。而短期记忆随后又被分为,在1秒时间内,直接来自于视觉,听觉之类输入的感官记忆。和引起注意之后进入意识可以维持数秒的level 1记忆。 长期记忆可以被分为,通过训练获得,在学会之后不通过注意就可以自动运转的过程性记忆。和需要意识主动参与的记忆。 而有意识主动参与的长期记忆, 有可以继续被分成, 表示概念符号的涉及语言的记忆陈述性记忆, 和与一个具体场景相关的情景型记忆。 通过大脑科学的研究, 这5种不同的记忆形式。涉计到的具体神经回路和工作机制都不同。

比如H.M 并不是不能建立所有的长期记忆, 他还是可以通过训练,获得过程性记忆. 所谓过程性是一种意识之外自动运转的主要和运动相关的机制, 比如骑车,打球,开车,打拳。长期训练后,都是一些自动化的反应, 通过反复练习,不需要意识介入,就叫学会了。

在来自感官的刺激进入意识之后, 有了所谓工作记忆。 也就是著名的7+-2理论, 人能够短时间内记住7个左右的组块。 这七个组块是由输入和记忆中高阶的所谓概念联合得到的。 比如一串数字201711151033,12个数, 猛一看记不住, 但是把它分解成2017年, 1月, 15日, 10点, 33分, 变成了设计概念的5个组块, 人就很容易短时间内记住。

进驻意识的东西都在大脑的新皮层里, 其中与概念是与语言相关的部分,比如你会用一段文字来描述或者回忆事情, 这些功能都在左脑的特定部分,是进化中最后获取的能力。 而与情景相关的, 比如一个场景的图示, 左脑和右脑都有, 但是右脑能力更强一些。你可以回忆起一些特定场景, 主要跟右脑相关。

进化最后获取的能力虽然高级, 但是资源很有限。 超强记忆的秘密, 在于开发右脑, 也就是充分利用情景记忆。 一个有意思的是, 人对感觉的记忆能力很弱,不管是音乐,食物都是尝试过很快就忘记了, 要当音乐家,美食家,红酒专家,需要长期的训练。 大家想想为什么。

没有进入意识的东西, 属于进化初期大脑中就有的, 涉及脑干,小脑丘脑,海马回等回路。 特别是海马回是从短期到长期记忆转化的关键部位。

现在我们回到海兔, 看看在细胞水平不同的记忆是怎么发生的。 海兔当然没有大脑皮层, 以及与意识。概念相关的这些高级货。 但是海兔有类似海马回的东西,也有短期记忆和长期记忆之分。 前面提到过, 对于海兔来说, 通过刺激, 海兔可以改变突触化学连接的强度,从而改变自己的行为。 而实际上,突触连接,涉及到感官神经细胞的释放, 和运动神经细胞的接受, 一开始的所有改变都发生在感官神经细胞的释放部分。 所谓强和弱,取决于感官细胞释放的神经递质,谷氨酸, 的多少。

在感官细胞和运动细胞之间, 还有一组中间神经元, 感官细胞除了直接刺激运动细胞之外,还会同时传送一个很慢的电位给所谓中间神经元, 这个慢电位可以持续数分钟。而所谓中间神经元,接受刺激后,会在适当时间释放神经递质5-羟色胺。这种物质可以用来调节谷氨酸作用的强弱。也就是说实际上有两种回路, 一种是从感官细胞到运动细胞直接传递的叫做介导回路,另外一种是从感官细胞到中间细胞,通过控制直接转递的强弱来影响行为的叫控制回路。 所谓短期记忆, 直接改变谷氨酸的释放强度。 而长期记忆, 与中间神经元的调控作用相关。

Kandel通过研究发现, 甚至不需要中间神经元, 只要按照一定规律给神经回路注入5-羟色胺, 就可以影响谷氨酸的释放水平。 最后让突触的连接长时维持,比如长达数日之久。 而在细胞里存在着两种蛋白, CREB-1, CREB-2, 一种用来激活,一种用来抑制。 一旦刺激反复呈现, 超过某种阈值, 让CREB-2失活, 细胞间就建立了永久联系, 也就是所谓形成了长期记忆。 而如果刺激足够强大, 一次就可以突破阈值, 建立长期记忆, 这就是所谓闪光灯式记忆。

在随后的研究中, Kandel还进一步发现, 新突触连接的形成, 还可以进一步细分为两种,所谓启动和维持, 是两种不同的机制。这些变化都涉及到基因转录, 都需要细胞核的介入。突触的形成需要一种信使RNA, 按照Kandel的比喻, 是王子吻醒了睡美人.所谓王子,也是一种特异蛋白CPEB,用来激活转录RNA。而前面提到的5-羟色胺的刺激,正是用来激活CPEB。 CPEB一经激活,就变成了自我复制形态。CPEB激活mRNA, mRNA用来合成两种蛋白酶, 一种蛋白酶A帮助CREB-1, 一种蛋白酶MAP使的CREB-2失去活性。 顺带提一下, 关键的钥匙,特异蛋白CPEB, 与一种阮病毒类似。 细思恐极。

至此,我们在分子水平上, 搞明白了短期记忆,和长期记忆全部的形成机制。 总结一下, 短时记忆调节突触连接的强度, 长时记忆需要形成新的突触连接,改变了结构。 长时记忆的两种, 前面提到的习惯化和敏感化, 一种体现在突触连接的减少, 一种体现在新的突触连接的生成。 以上提到的谷氨酸和5-羟色胺 在人的大脑中,特别是海马回中,发生的同样的作用。

搞明白的记忆的种类,和分子水平的机制之后, 我们终于可以开始谈谈意识。 所谓大脑新皮层支撑的, 人所以为人的东西。 下一篇见!

 

 

 

大脑的快乐系统,以及对我们生活的启示

今天我们聊聊脑科学。 学AI的人总想着类比大脑, 但实际上目前所做作为离大脑的工作机制相去甚远。我们也一直试图理解大脑是怎么工作的, 搞明白大脑的工作机制是相关专业的所有学人的梦想。 但话虽如此, 目前的科学进展仍然是刚刚起步。 我们到底走到那里了, 有两种看法。看法1:假如把大脑的工作机制比作大海, 我们目前只是在海边拾贝壳的小孩子, 捡到了被大海的波浪推上沙滩的几片小小的贝壳。 看法2:我们已经造出了蛟龙号,正在尝试下潜试图看到大海最深处, 虽然完全了解大海的概貌仍然不太可能, 但是大海的内容按照深度分了层级, 每层都一样, 只要我们能看到最深处是什么, 并且了解之上的每一层是什么, 就能了解大海的行为。 以上两种说法,读者君你信那一种? 以下是正文。

按照阅读文章我肤浅的理解, 研究大脑工作大概是分为两种路数, 一种是从底层玩弄单个神经元, 微观细节, 电化学机制, 看看神经细胞之间的活跃机制和信号是怎么传递的。 另外一种是从宏观角度, 研究大脑的分区功能。相对应的我们大致有以下研究手段, 比如可以在自由运动的小老鼠身上研究单个神经突触的信号, 也可以用所谓的无损方法高清晰核磁共振脑成像, 看看大脑的血氧浓度, 什么区域被激活。当然还有脑电, 这个就更笼统了。

但是现在手段的局限性在那里呢?跟某同学(感谢陈大师)交流时他说, 先不说老鼠, 斑马鱼这种简单生物, 神经单脉冲信号是ms量级,而具体到每个基本计算突触大概是100-1微米的尺度 。而发生记忆和学习机制导致的变化以天计算, 斑马鱼一共有10万个神经元。 以上时空尺度横跨7个数量级, 更不要说小鼠的脑神经是斑马鱼的一万倍。所以研究单个神经突触信号的同学一定不觉得自己可以搞明白大脑的工作机制。

另一方面, 所谓无损脑核磁共振成像, 现在最高分辨率的高清晰成像一个像素代表着8万个神经元, 100万个突触。而且既然是成像, 时间分辨率也惨不忍睹。  这好比是戴着老花镜, 研究远在几千公里之外的一只蜂鸟翅膀的震动。所以研究脑神经生理的同学也一定在吐槽, 觉得自己可能这辈子也不能搞明白。

所以这些脑科学的真正专家学者实际上都很谦卑, 他们大多持有本文一开始举例的第一种观点, 就是我们还差的太远太远。而作者表示因为自己是外行,所以无知者无畏。 作者持有的是第二种观点, 有生之年就能看清楚。 为什么呢? 之前的文章谈及计算时,提及到计算复杂性概念, 非常简单的规则通过计算就会产生无比复杂的结果。但正是因为计算复杂性的存在,这种计算无法通过建立模型来简化。你只能通过演算来模拟。 在没有足够的计算能力之前, 一切努力都是白费。 所以很多事情看上去毫无可能。 现在计算能力强大了, 我们开始看到一些效果,比如说深度神经网络。 当计算能力足够强大时, 也许就能揭开谜底找到答案。

请远离以上胡言乱语,我们来看看脑科学研究的最新进展,也许对AI研究也有一点点启示。 以下内容主要参考了2015年neuron上的一篇综述文章 Pleasure systems in the brain(大脑中的愉悦系统)。

大家都知道, 人生中快乐很重要。有一种哲学叫享乐主义(Hedonism)又叫伊壁鸠鲁主义(Epicureanism)。hedonism这个词甚至在现代脑科学里被引申为让大脑体会到快乐的神经回路。

有关这个享乐主义, 最有名的一个段子是 :有一位叫做第欧根尼的学者, 平时就是住在一个桶里, 被周围的人当作狗。 而史上最伟大的统治者之一亚历山大大帝巡游帝国时,遇到了正躺着晒太阳的第欧根尼,这位世界之王上前自我介绍:“我是大帝亚历山大。” 学者依然躺着,也自报家门:“我是狗儿第欧根尼。” 于是大帝肃然起敬,问:“我有什么可以为先生效劳的吗?”哲学家的回答是:“有的,就是——不要挡住我的阳光。” 据说亚历山大事后感叹道:“如果我不是亚历山大,我就愿意做第欧根尼。”。 这个故事虽然有名, 但是不管你信不信, 反正我是不信。 这是学者们喜欢给自己脸上贴金。

抛开纯粹的享乐主义不谈, 快乐仍然是很重要的。略微懂一点脑科学,心理学等等的人都知道多巴胺, 在现有的教科书里面都会写到, 多巴胺作为传递神经信号的物质,主要作用于大脑的快乐系统。因此能引起快乐。 而一些化学结构上模仿多巴胺的物质, 比如说著名的冰毒, 能够取代多巴胺刺激大脑的功能,带来极其强烈的刺激, 因此冰毒是毒品中最可怕的一种。 一旦染上,基本无解。

而neuron的文章总结说, 以上说法是非常片面的。 大脑真正的快乐机制不是这样。 大脑中引发快乐感受的神经回路主要有三种, 一种我们知道的最多的是多巴胺起作用的大脑皮缘层的A部位(抱歉一些专有名词就不翻译了, 都是特指大脑的某一块区域某种结构,对外人来说如同天书,也没有了解的必要,以下都以字母为代号)。这一块的主要作用,是刺激人想做某事(want),是想要, 是欲望。 欲望很重要, 没有欲望,人自然就各种消极, 什么都不想做。 但是欲望不是真正的快乐。

第二种回路,用所谓享乐主义的衍生词指代的神经系统B, 主导的真正的快乐, 快乐是一个满足的过程。 拿吃东西来举例, 突然想吃某种东西是欲望, 大脑的A系统起作用。 真正吃到了东西, 吃的过程是一种享受, 是真正的快乐, B系统在起作用。 但是B系统本身的效用是递减的, 好吃的吃好几遍就不那么好吃了, 入芝兰之室久而不闻其香。 再好的东西, 熟悉了就会腻味。都跟这个相关。

第三种回路, 是跟学习相关的, 称为C。 大脑是一个模式机器, 不断的在预测, 尝试匹配, 试图建立某种模式。 也就是学习的过程, 这个过程是苦的, 但是模式建立的一刻,也就是学会了, 是快乐的。有人说科学发现的一刻,是人类能够体验到的最大的高潮, 就是学习有所成就所能给予的极致奖赏。

这三种机制,都可以和生存竞争联系起来。可以说是自然选择的结果,详细讨论可以另写一篇,这里就不展开解释了。

有A欲望,B享受, C学习这三种划分, 就可以扩展开来理解很多现象。比如很多毒品因为刺激的是A欲望, 而没有B享受的过程, 所以并不是真正的快乐, 只是欲望让人欲罢不能。 一旦撤掉毒品, 副作用就是极大的折磨。 英文里有个专有名词坦塔罗斯就是指这个。

坦塔罗斯是希腊神话里的宙斯之子, 因为无法无天的各种恶行,得罪了众神,被打入地狱。 他站在一池水中间,波浪就在他的下巴下翻滚。可是只能忍受干渴,永远喝不上一滴。他只要一低头,水位就会下降,永远保持在他下巴的位置。同时他又饥饿难忍。在他身旁就是一排果树,结满了累累果实,吊在他的额前。他只能看着,一伸手大风就会把树枝吹向空中。欲望永远得不到满足。

佛家因此而说, 认识到了欲望是万恶之源。为此开出的药方是屏蔽一切欲望。然而按照大脑的机制, 没有A,  也就没有B,得不到事实上的满足。  这样的心态是脆弱的, 非常经不起诱惑。

有欲望,就去实践满足是一种实用主义的态度, 享乐主义就是其中之一。 很多人生哲学就停留在这里, 认为人生需要追逐快乐, 把自己保持在B状态里。 然而按照前述B的机制, 重复的东西不能带来同样的B享受, 必需时常换新。 因此追求B状态的保持很难, 需要极大的物质资源支持, 而且经常会腻。对一些富人贵人来说,  当一切的传统刺激都不起作用了, 就会胡作非为。

只有C学习,可以贯穿一生。 因此不断的学习, 特别是在艰苦的学习之后,因为技能的习得获得一点小小的但是真正的快乐,可以鼓励你继续走下去。学无止境,可以伴随一生。 这样的才是对以上大脑机制理解之后,推断出的正确人生态度。

掌握这样的理论,犹如掌握一把大锤,可以用来解决人生的各种疑难, 比如什么是真正的婚姻,如何让爱情永恒。 爱一开始是一种欲望A, 然后是互相拥有B, 这个阶段因为是真正的享受, 非常的快乐, 然而随后大脑的享受平衡机制开始起作用, 时间久了就腻,就有人开始追逐别的新鲜刺激。靠享受不能相伴一生。 唯有学习C, 互相学习,互相欣赏,共同提高,才是真正的人生良伴。 才是最高质量的婚姻生活。 比如杨绛,钱钟书,钱写的书,杨是第一个读者,并能给出很好的修改建议。两人互为精神伴侣,成为大家学习的榜样。 可以轻松举出无数的例证来证明这种观点。

电影阿甘正传里, 有一段时间因为女友不告而别的刺激, 阿甘开始横穿美国的跑步,其实他漫无目的, 因为跑都够久,就引来了很多追随者。他们觉得跑步本身也许就是一种人生意义。而当阿甘突然不跑了, 一众追随者都不知道该怎么办,问阿甘,我们下面该做什么。 阿甘也给不出什么建议。 而读完本文的诸位,都可以轻松给出建议, 去学习!

人类一思考,上帝就发笑!

(全文完)

有关AI的一点随想

今天的文章没有主题, 想到什么写什么

这两天业余时间翻完了一本讲古典音乐的书, 叫”乐之本事”. 强烈建议古典音乐爱好者阅读, 如果对古典音乐有兴趣也可以翻翻, 原书作者说他是写给爱好者的入门书, 其实他高看了爱好者的基础知识水平. 也许是想说的东西太多, 用了很多专业名词, 说起用户体验, 对初学者并不那么友好(职业病犯了).  但是读过总比没看好, 帮着做个广告.

其实原书中说的最多的还是审美, 不光是音乐, 所有的艺术, 甚至人生的意义. 归根结底是美学. 所谓艺术的科学是美学, 科学的科学是哲学. 其实美学和哲学是相辅相成的, 二者合一, 就是道.

谈及美学, 绕不开的就是李泽厚先生的美学三书, 这本来是三本书, 美的历程, 华夏美学, 美学四讲.  三本书各种版本不知出了多少, 也有就叫美学三书的合计版本. 美学也罢, 哲学也罢, 琢磨起来都费劲, 因此这类书一般都小众. 能出这么多版本, 已经是超出想象的影响力了. 也就是所谓绕不开的理由.

但是个人看法, 美学三书终归只是入门读物级别的东西, 要想深入体会, 还是得到西方的经典著作里去找. 中国人的传统美学, 李泽厚先生讲了很多很多, 但是不透, 最后还是得看金刚经,道德经和易经. 玄之又玄, 众妙之门, 太高, 一般人可能也够不着. 阳春白雪,应者寥寥. 高手寂寞, 又想布道,  真的是很矛盾啊.

李泽厚先生在建国后和朱光潜, 蔡仪,有一场著名的美学论战, 本来美学可以有很多种, 但是最后无产阶级革命美学总要胜出, 所以这个嘴仗要打. 打起仗来情绪激动, 就会超水平发挥, 为了争取围观群众支持, 也会说的比较直白. 强烈建议好奇的群众翻出史料去围观一下.

说了一大通, 没有半句AI,  不是关于AI的随想么? 所谓随想, 就是这样的啊.

其实本文是想说, 因为美学和哲学最高, 可以说是人类最上等的知识和成就. 要想做出类人AI, 不能只在工程里打转, 一定要搞懂美学和哲学.

继续跑题. 乐之本事这本书里谈到对音乐的审美, 因为音乐本身是个序列, 不像画或者图像一样能让人一开始就人掌控全局. 音乐一开场你并不知道接下来会听到什么, 在听的过程中, 一般人的的工作记忆容量也有限, 听到后面, 前面的也许就忘了, 没有一个全局的上下文可以依托. 因此音乐的主题都要反复重复,  从信息论的角度看,有大量的冗余信息. 即使这样, 仍然表现力有限, 存在信息量不够的大问题, 所以古典音乐发展到后期, 主流越来越依重唱, 贝多芬的第九交响曲, 最后是大合唱, 而我们耳熟能详的音乐, 大多都来自歌剧.  因为结合文字, 信息量才能更多.

创作, 可以认为是作者和读/听/观者之间一个传达信息的过程. 作品就是要传达信息的媒介和载体. 音乐又是一个非常特殊的例子, 完整的传递信息, 需要作曲的人和演奏的人合作来提供, 通常是各占一半, 作曲的人需要把自己的丰富感受压缩在乐谱上. 演奏的人虽然自由些, 但是仍然受限于手中乐器的表现力 (钢琴因为表现力最强, 被成为乐器之王) . 所以就算作曲者和演奏者都尽力了, 仍然不能提供完整的信息, 还有很大一部分需要脑补. 这就是为什么欣赏古典音乐需要一个学习的过程. 当然, 不学也能欣赏到一部分, 有人天生就敏感, 能自通乐理, 但是大部分人需要训练.

音乐/美术/文学这些东西, 归根结底都是大脑的安慰剂. 大脑天生喜欢探寻模式, 通过观察模式, 结合自身的记忆, 如果能总结出所谓规律, 大脑就会兴奋.   寻找规律的极致是就是所谓借此体悟到人生的道理.  从信息量角度上讲, 音乐,美术, 文学依次扩大. 但是从悟道的角度上讲, 听到音乐有所触动,最有可能悟, 美术次之, 读完一本小说悟道的最少. 因为压缩后的信息才是最精华的部分.

那么人生的道理又是什么的,  能让大脑愉悦的是两类东西, 一类是以多巴胺为代表的兴奋剂. 正向刺激, 高潮体验. 一类是以内啡肽为代表的安慰剂. 在经历过痛苦不适后的反向刺激, 对应的是舒适.  两类典型的毒品, 冰毒是正向刺激, 兴奋狂躁, 极端的会去吃人咬人. 海洛因和鸦片是反向刺激, 舒坦,昏昏欲睡. 两者都会上瘾, 前者比后者更可怕. 辣椒和跑步的上瘾是后面一种. 换个控制论的角度, 一个是正反馈, 一个是负反馈.

从系统论的角度, 管理一个系统的终极奥义, 是用负反馈约束正反馈, 没有适当的正反馈, 就是死水一滩. 没有负反馈约束, 系统不够稳定, 早晚就爆掉了.  那些管理公司的真正高手都懂这个道理. 大脑也是这么管理的. 所有的复杂系统,都是这么管理的, 才能生机勃勃, 又存在秩序.

BTW, 说AI说的太少? 我全文都在说AI. 就喜欢故弄玄虚

暂时就想到这么多,  谢谢观赏.

做研究的奥义:象外行一样思考,象专家一样实践

最近跟同学朋友聚会,大家聊起近况,自己往往要感叹一句:“不做research已经很多年”。说话时颇似电影里一句常见台词:不混江湖已经很多年。这话说的五味杂陈,人入江湖, 还能走的干净么?从思考的角度,到做事的方式,只要混过江湖的人,都是一望便知。今天这篇小文就说说自己经验的总结。其中大部分不是自己的, 是从一本武林秘籍“象外行一样思考,象专家一样实践–科研成功之道” 里面学来的。 其实我看到这本书的时候, 自己就已经不太做研究了。 倚天屠龙记里的创立乾坤大挪移心法的高人,其实自己的内功不够, 只练到了第6层, 第7层心法是全凭想象写出来的。我也大抵如此,并没有最高级的内功, 只凭想象写文章。 读者君要学张无忌, 看到不顺的地方,自行跳过。也许是作者想错了,硬要练习就会走火入魔。

文章写多了, 往往就有了套路。 人不论做任何事, 都大概有三层境界。第一层是技的境界, 是做事情的具体技巧, 第二层是术的境界, 已经不再强调具体的技能,上升到了方法论的层次。第三层是道的境界, 术到一定深度需要道的配合,有了道才能突破障碍,无限展开。

举个例子, 比如小说里的武功, 一开是要学各种招式, 低级的有各大门派的入门拳法,剑法,后面循序渐进,有各种进阶招式,最后顶级的有少林七十二绝技之类。这都是武技。金庸后来写了一些高级货,比如独孤九剑,无招胜有招,很多人不理解,认为这是老头子故弄玄虚。而一些小说里最经典的场景, 光明顶上张无忌学会了乾坤大挪移,破遍各家武技。那怕招式不如人,都可以现学,然后招招后发先至。少林寺里鸠摩智和虚竹对攻,靠小无相功的运使,两个人玩遍了少林七十二绝技。这些其实说的都是术。有了术,只学武技的人都被通吃。再往一层是道, 到这个境界的人太少,基本上都不露脸。金书里现世可能武功最高的两个人:少林扫地僧说武功要用佛法化解,东方不败吹自己学会了天人化生,万物滋长的妙谛。这一正一邪都是道。有了道,葵花宝典就能压制独孤九剑。后来令狐冲对付学习同样武功的林平之,岳不群没有这么难,是因为大家以术对术,这些人层次不够,没有道的境界。

写了大一大堆虚无缥缈的武功,回来说research。 其实意思是相通的, 要是说技巧, 怎么做research, 至少要写一本书,或者可能要很多本书。

而道的境界是没法说的, 道可道,非常道。不能正面说,可以从反面说, 道德经里说的都是:什么不是道。道这种东西, 全靠自己悟,  而通常情况下,从术到道的进阶,要有生死体验。

第二层次的东西,也就是术,或者直白说是方法论是可以说的。术的篇幅都不太长, 比如乾坤大挪移写在一张羊皮上,小昭用手指头上的血就能让张无忌看一遍。要是一本书,以小昭的体格,恐怕血流干了也看不完。要学会术,需要技的配合, 没有技,光谈术会走火入魔。还是要先做几年research,从技巧开始学习, 切记切记。

做research的术, 或者说是金出武雄先生做research的术, 大致是这样的:

1.首先是心态, 做research不能太严肃, 要有趣。绪方先生说所谓有趣是指:精神上的放松,同时内心要认真对待。 这是辩证法, 一下子可能学不会,需要大家慢慢练习。心态放松以后, 让思维去奔跑,去飞翔,才可以有很多天马行空的想法。想法一开始可以很幼稚, 不要让现有的知识把自己框住。最好喝茶聊天跟各种不同的人多讨论,多思维碰撞,这些都是技。只举个例子,后面就不再说了。

2.要集中精力,深入思考,让自己成为问题本身。决定研究什么问题是做research最关键的事情。 发现问题需要创造力。很多人说创造力来自于灵光一现。有各种科学发现顿悟的故事。这是成功学的套路,只告诉你最容易模仿的。 顿悟固然重要,但是只说顿悟是故意的。 因为顿悟之前需要的长期思考很难。思考要集中精力, 跟自己过不去, 这是非常累和辛苦的一件事。 金出先生说他自己读研究生的时候,经常一周每天只睡2-3个小时, 还有连续74个小时只想一件事情的经历。 一般人想问题,3,5分钟就开始走神了。经过长期思考后,顿悟的时刻可以很快乐,据某些研究说是人能体验到的最快乐的事情, 这是大自然给做研究的人的奖赏。

3.创造力的基础是记忆,记忆需要在实践中反复练习。说一个人聪明, 会下意识的觉得他记性好。这是因为所谓创造构思是从记忆重组而来的。记性好是这一切的基础。 记忆是需要培养也可以培养的。 别再抱怨小时候的背书了,真的有用。 需要注意的是不能填鸭一样死记硬背,要在理解的基础上背。内容经过思考理解之后才能变成知识。知识需要反复应用和练习, 别再抱怨小时候做那么多题。

4.多和人交流,但别管别人怎么看。 又是辩证法, 做研究找问题需要思维的碰撞,因此需要多和别人交流。交流不仅限于专家同行,最好跨界。而找到问题之后,就要一条路走到黑了, 对自己的想法要够坚持, 不能轻易动摇。 问题不是那么容易解的,要不然也轮不到你了,各种挫折,错误会纷纷而来,这时的心情就象一句歌词:甚至让人开始怀疑人生。一定要挺住,才有柳暗花明。

写了4条,感觉就已经写完了,写来写去,说的基本都是怎么找问题。金出先生说做研究,找到一个好问题, 大约占6成功夫,剩下的就是努力用心解问题。金出先生的书名,“象外行一样思考,象专家一样实践” 主要说的是这个找问题的过程。

除了做研究本身,在现代社会,好东西也要宣传。 要把自己的研究写成好文章,要能出去给别人讲。这些金出先生的书里都有写,强烈推荐买一本回去仔细阅读!

翻开手头这本书的扉页,还有Harry送书给我的题字,是06年11月,到现在整整10年。金出先生是Harry的老师, Harry是我的老师。不知道我会不会去当老师。 做research的薪火相传,一代一代总是会让世界变得更好,人类生活的更幸福。那我们呢?

茶与咖啡文化篇之茶道

coffee

这是我开始动笔以来写的最不痛快的一篇文章。 快餐时代大众已经没有耐心看太长的文字。 而文化这个话题又实在太深太难, 如何在短短一两千字的小文写出些许味道实在是很为难的事情。 最后决定还是写成冈仓天心名著茶之书的读书笔记,这本书是一百年前冈仓用英文写的,用来向西方推介日本的文化。所以相对来说,通俗易懂,当然也比较浅。 我对茶文化的理解并没有超过他,那就跟随他的脚步吧。 因为篇幅的约束和个人的爱好做了取舍, 所以强烈推荐有时间的人还是读读原书,并不长。

分段仿照原书的章节


中译本的书开篇有日本名教授藤田一美给中国读者作序介绍背景。 开宗名义, 日本文化源于中国, 在十六世纪后, 日本通过贸易接触到西方, 除汉学以外, 又开始学西学。 日本文化从来就是谁强学谁, 并没有大国的抱负和负担。 十九世纪美国炮舰打开日本,当时日本启蒙思想的代表人物西周说, 余深感非学西学,今后不足以立身行路。 中文里很多现代词汇是从日本转来的, 其中一些最基础的, 比如哲学, 主客观,归纳,演绎,义务,权利,还有艺术,美术等都是西周首先使用的。 日本被打败,所以西周,津田真道为代表的第一代人是推崇完全西化的 。 到了第二代,也就是本书作者岗仓天心这一代, 日本打赢了甲午战争,日俄战争, 建立了初步的自信。 福泽谕吉等人仍然坚持全盘西化, 岗仓天心则看到了西方的问题,开始推崇汉学为本,西学为用。于是用英文写了这一本书, 向西方介绍东方文化。这本书写于日俄战争刚刚打赢后的1906年。中国对西方文化的态度,又何其类似? 以下是正文。

第一章 人情的碗
岗仓以茶碗作为切入点,总揽了一下茶文化。茶一开始出现, 是药材, 后来就称为饮料。从唐朝开始,称为了高雅的享乐,随后因为禅宗的影像,变成了审美的宗教, 日本的茶道,源于唐,成于宋。茶道本身, 是源于对人生不完美的崇拜,就象明知人生难以成就时,仍然希望有所为的温和企图。

茶影响了日本人生活的方方面膜, 日本人会说一个人没茶气, 意思是他对生活中亦庄亦谐的趣味非常愚钝。茶的精神,不同于西方对酒神的无止境献祭,而是孔子惬意的宁静,老子犀利淋漓,以及佛飘渺的风韵。只有感到自己伟大处渺小的人,才能看到渺小之处的伟大。一只碗中见宇宙。

茶传到西方是十六世纪, 推动者是荷兰的东印度公司, 到十七世纪, 开始在西方上流社会流行,十八世纪最盛时, 英国的咖啡馆里实际上主要喝茶。塞缪尔.约翰逊说自己是一个顽固的饮茶者。而少数理解茶道的查尔斯兰姆说,我所知道的最大快乐, 就是暗中行善,并偶然发现它是善行。隐藏且可以发现,不敢表白的暗示,正是日本茶道的核心审美。

作者同时抱怨,西方在日本沉迷于温文尔雅的艺术时,把日本当作野蛮的民族。 而当日本在满洲战场大屠杀时并打赢了俄国时,就变成了文明的国度。何等的讽刺!

第二章 茶的源流
茶作为艺术作品,有高下之分,但是并不是只有唯一正确的方式。不同流派,沿革于历史的流变。 此时岗村说了一句名言:当你没有伟大的内心可以隐藏时,才会过多的在小事情上展示自己。
中国的茶在公元四,五世纪就有文字记录, 但当时的做法非常原始,茶叶先蒸再碾碎,做成团子,和米,姜,盐,橘皮,香料,牛奶一起煮。 这种原始的状态,在现在的牧业地区,仍有保留。
提升茶境界的第一人是唐朝写茶经的陆羽。陆羽生于儒释道开始贯通融合的年代, 他给喝茶制定了仪式, 期望从中体悟宇宙的秩序。茶经各章,分别讨论了茶树的本性,采茶的工具,选茶的方法,各种茶具(论述了二十四种),制茶的方法(包括水的选取,著名的 泉为上),以及一些茶人的历史,著名茶园和茶的变种。 中国的瓷器来源于对玉的模仿,不同的追求,与饮茶的方式紧密相关, 陆羽推崇青瓷,因为可以增添茶水的颜色,而白瓷会让茶水变粉,看上去很无味。这是因为他泡的是团茶。
宋朝开始,抹茶流行,茶叶被磨成细粉,放在热水里搅打, 茶汤里也没有了盐。宋人不再过度追求结果,开始重视过程。饮茶不光是一种消遣,而是自我实现的方式。抹茶适合装在深蓝或者黑色的厚茶碗里。 日本最有名的茶器,国宝 曜变稻叶天目盏 就是一只宋代的黑茶碗
明朝崇尚自然, 茶叶不再被各种研磨, 保持原样直接放在水里。 这样的茶汤适合白瓷。 因为泡制的过程越来约简单, 茶具就变的越来越复杂, 作为泡茶用具的紫砂壶就单成为一种文化。
岗仓文中直说因蒙古入侵,唐宋的文化中断,被日本学了去,中国人眼里, 茶也不再是道, 变成了一种玩物,茶叶越来越香。然而这种令人惊异的花香, 正是不肯体悟自然,却玩弄自然的结果, 毫无唐宋时期仪式的浪漫。 对此, 我并不认同。

第三章 道和禅
众所周知, 日本的茶道和禅有密切关系。 岗仓说,茶道来源于禅宗和尚献茶给客人的风俗。甚至在道家的故事里, 老子出关时,从关尹手里接过的最后一样东西,就是一杯茶。
岗仓在这里用了全书最长的篇幅, 试图让西方人理解什么是道, 什么是禅。 因为用英语写书的缘故, 他先强调翻译是不准确的,最理想也是只能看到锦缎的反面,所有纵横的丝线都清楚, 却没有色彩和匠心的微妙之处。但是仍然可以说, 因为古代的圣贤只说道的反面,因为无法正面说出道的真理,这样虽然开始说话的时候显的很傻,但是说完之后, 听众都变聪明了, 所以老子说:下士闻道,大小之,弗笑,不足以为道! 你笑了没有?
岗仓认为,相对于儒的秩序, 道和禅都是自由主义, 两种不同来源于中国的两条大河, 长江和黄河。 儒代表北方的正统, 道和禅是南方的浪漫。儒教的精神理想是完美的古代, 而道教的世界是永远在变, 是荒谬的, 既然如此荒谬, 无需严肃对待。

道的思想深深植于中国国民内心之中。成为节制而又文雅的力量。 温如玉这三个字,就是其集中体现。生活虽然如此苦难, 中国人并不凭借西方死后的天堂作为精神安慰。 我们可以和列子一起御风, 那时我们就是风。 我们可以和河伯一样生活在半空之中。道的审美,在于虚,虚藏万物。一个人只有把自己放空,其它的东西才能自由出入。道的思想在艺术的体现,也要有虚,要留给观众空间,让他能体悟,与作品成为一体。如果在生活中掌握了这种虚的艺术, 你就是道教里的真人。
禅宗应对生活又是另外一种态度,禅的自悟来源于成佛六法之一的冥想,佛陀晚年尤其强调这种方法,并将法门传给迦叶,自此二十八代后传给了达摩。达摩一苇渡江,从此禅宗在华夏开枝散叶。有文字记载的禅宗最早的著作是六祖坛经,二代传至百丈大师,首创禅寺和相关戒律。中国的禅宗和道教一样是相对主义, 禅宗大师对禅的定义, 是在南天见到北极星之术。真理只有通过领悟于真理相反的一方才能实现。因为语言无法传达这种高妙的思想,甚至对于先验体悟,语言反倒是一种障碍,因此禅宗的流传并不见太多经文,而是各种小故事,丹霞和尚冬天烧佛取暖就是一例,旁观者吓坏了,说你亵渎佛祖,丹霞和尚说, 我要从灰烬中提取舍利。旁观者愤怒的说, 你从佛像的灰烬中能找到什么舍利? 于是丹霞和尚回答,既然没有舍利,它就不是佛, 所以我并没有亵渎佛, 并转身回去继续烤火。
禅把尘世和灵魂看的同等重要,物并无大小之分,一粒沙中见宇宙。因此寻求解脱的人应在生活中找到灵光的反射,禅寺的组织也是如此,出了主持,所有人都会分担禅寺的日常劳作,而分给刚入门的工作应当是最轻松,越是有声望和资历的僧人,做的工作应当越低端和枯燥。这是修行的一部分。日常削萝卜皮时的言谈中,也许是悟道的契机。 (请告诉我, 那个禅寺现在是这样)

宋代有个三人尝醋的故事, 可以作为总结。 佛陀,孔子,老子站在生活的象征– 一坛醋面前。每个人用手指蘸醋后放在嘴里品尝, 孔子注重事实,说醋是酸的, 佛陀说, 醋是苦的, 老子说, 醋是甜的。

尾声
岗仓的原书, 一共七章, 还有四章,分别说的是 茶室, 艺术鉴赏,花, 茶道大师。 我觉的作为一篇网文, 现在写到的篇幅已经过长了, 有兴趣的可以去看原书。就不在摘录了。 最后一章茶道大师, 说了茶人利休的一生,利休是日本茶道的创立者和宗师,他最爱的一句话是, 世人只道花开好,却不见雪压峦发春草。日本人崇尚和美一起生活,并死的美丽。 在利休身上得到了集中体现,得力于丰臣秀吉的友谊和赞赏,利休名满日本,然而成也萧何,败也萧何。利休也死于和丰臣秀吉的冲突, 有人告他要毒杀太阁, 特许可以自杀, 于是利休举行了临终茶的仪式,喝完后打碎茶碗,并留诗一首
人生七十
力围希咄
吾这宝剑
祖佛共杀
岗仓全书的结尾就是这首诗,他说利休含笑步入了永恒的世界。 我觉得他并未体悟利休的心境。 利休心境应当是弘一法师的临终遗言, 悲欣交集!
岗仓说的是日本人对茶的理解, 他们确实截取了唐宋文化, 并将之提升为茶道, 岗仓不屑的明清在生活中体悟的自然, 并没有他说的那么不堪。 道法自然, 日本人其实是走偏了。 明朝另开一路, 中国文化有了新高度, 我们又有了世间唯一活的圣人王阳明。

日本人的路走在前面, 中国人随后,各种反复,都有类似。 他们已经走到头了,而现代中国, 摸着石头过河了几十年, 又会到那里去呢?

茶与咖啡

七天假期转眼即过。 就要从休假模式调整到工作模式, 读者君是心急火燎的想去上班呢?还是不想上班不想上班还想补觉旅游呢?想是一回事, 做是一回事, 该干啥干啥,今天写两种饮料,工作的时候特别需要, 大部分人一辈子离不开的, 茶和咖啡。

开宗明义, 我们喜欢茶和咖啡, 因为它们都是兴奋剂。

茶和咖啡中都含有咖啡因。 咖啡因通过口服进入体内之后, 由胃和肠道吸收进入血液, 随后遍布全身,大约三十分钟到一个小时后,完全起效,之后会非常缓慢的代谢,大约三个小时为半衰期,因此早起一杯茶或者咖啡, 到中午咖啡因还剩一小半, 仍然起作用。

咖啡因在化学上归属黄嘌呤类化合物, 茶里面还单独有茶碱,也属于黄嘌呤。 茶碱可以用来放松呼吸道,在治疗气管炎,哮喘之类的药里很常见。 但是茶叶里的茶碱含量很少, 主要起作用的还是咖啡因。

所有的黄嘌呤,对身体都有多种作用,最主要的作用是作为神经介质阻断剂。大脑中有一种称为腺苷的神经递质,是细胞的代谢产物,神经细胞一旦开始活跃,就会产生腺苷,腺苷会降低细胞的活跃程度, 这样构成了天然的负反馈,也是一种生物保护机制。黄嘌呤或者说咖啡因直接阻断腺苷的作用,神经细胞没了这一层负反馈的限制, 受到刺激会更兴奋。同时咖啡因会降低大脑血液的流量,也许不兴奋的部分会更低调,相互作用下,人会觉得注意力更集中,加上兴奋带来的愉悦感, 对精神层面就会有影响,会有一点点上瘾。

黄嘌呤对身体其它部位特别是平滑肌也有作用。 肠胃里主要工作的就是平滑肌, 有人喝咖啡会拉肚子, 中国古代传说中,神农尝百草的时候,靠吃茶叶来清肠胃,排毒, 就是这个原因。

讲完一大段科学知识,再来说说含量。 吃东西也罢,吃药也罢,不谈量就是耍流氓。即使食品吃多了也害人。普通冲泡的一杯茶(250毫升,半斤),咖啡因含量大约是30-60毫克, 用最常见的滴滤手法冲泡的一杯咖啡(不是浓缩)(250毫升,半斤),咖啡因的含量大约是75-150毫克, 因此咖啡里的咖啡因要比茶里面大概多2-3倍。传统食物里面还有另外一个含有很多咖啡因,猜到了吗? 就是可可,以及可可做的巧克力。巧克力的历史对欧洲人来说,比咖啡还悠久, 但是从文化意义上就差了很多。 这里就不说了。现代社会,大家常喝的还有一些软饮料,比如可乐,能量饮料比如红牛,里面都含咖啡因,软饮料的咖啡因含量低于茶,能量饮料的咖啡因含量大致相当于茶。所以一罐红牛的提神醒脑效果基本相当于一罐茶。

到了一定剂量, 咖啡因也是毒药。精神刺激太强烈,就有反作用,比如喝多了咖啡,人会感觉紧张和烦躁。如果咖啡因到了一定量,还可以致死,医学上说,大约每公斤体重35毫克的量,就会有毒到致死。一个50斤重的小孩,大约喝5斤咖啡就会中毒,一个成年人大约需要10斤咖啡。通常人不会喝这么多。所以没事。 这里特别要提提意式浓缩咖啡(简称esp)。浓缩咖啡的浓度大约是普通咖啡的10倍,标准25ml的一小杯,就相当于一大杯普通滴滤咖啡的效果(也许咖啡因的量要第一些) 。意大利人早上喜欢来一小杯esp, 加一勺糖,搅一搅,然后一口闷。提神醒脑,心满意足去上班。 这种喝法跟喝酒差不多, 可以喝很多. 但是要是喝了一斤esp,20个标准杯的量,有可能就挂了。 切记切记!

茶叶本身的咖啡因含量并不比咖啡豆少, 只不过咖啡的做法经过了深加工,先烘培,再磨成粉才泡,提取的效率高。更别说esp,专门加压力,务求浓缩。如果茶叶也磨成粉,泡出来的茶就会特别浓。把茶叶磨粉放在意式机器里,可以做出意式浓茶。好奇的人可以试试,保证够劲。

咖啡因本身是食品添加剂,那么多软饮料都需要,因此有工厂生产这个, 收集一些泡过的茶叶,茶叶次品,渣子,碎叶子, 就可以通过简单的步骤提取出咖啡因。大学化学基础实验里提取咖啡因是必修课。但是前面说了,浓度高了就危险。 纯的咖啡因,相当于是毒品,中国北方的大货车司机喜欢吸一种东西,俗称“面面”,就是纯的咖啡因加碱。这个就厉害了,不光违法,还可以损害健康。

拉拉杂杂写了一大堆,完全从功能角度说,把咖啡和茶写的很无趣。咖啡和茶作为文明载体,都积淀着非常丰富的文化,写几本书都写不完。如果只取其中提神醒脑的功效,那可真是牛嚼牡丹了。改天我们再来谈文化,谢谢阅读。

大脑是如何工作的?兼谈如何做出类人智能。

记得读书的时候,我的老师曾经提到过当年他为什么选择计算机视觉和人工智能这个方向。 他说,他曾经参加过人工智能之父明斯基的讲座。 老先生上来就问了一个问题: How human brain works? 做AI的人, 其实终极目标一直是如何做出像人一样聪明的机器,这是一个历史使命, 要代代穿传。 创始人时代做不出, 就传给我的老师那一代, 之后再传给我们。 我写这篇文章的目的是想说, 也许或许我们不用再往下传了, 我们这一代就能解掉这个问题。 以下是详解。

这篇文章要不要写, 我其实犹豫了很长时间, 脑子里有很多想法, 模模糊糊有些答案,但是并不确切。 写文章应当能经得起历史考验。 万一错了, 被打脸会很丢人。想来想去还是把不成熟的想法写下来, 读者君们一起思想碰撞, 会进步的更快, 想的更明白。

先说为什么我觉得我们这一代能解决掉AI的问题,并不是我们比前辈们聪明, 归根结底是计算能力,我们赶上了好时候。 大脑的计算能力是多少, 有各种估测数字。 什么时候计算机的计算能力超过大脑, 也有各种估测。 其实这些数字都是胡扯, 你连大脑是怎么计算的都还没搞清楚的, 怎么评估计算能力? 那种算算神经细胞个数,然后把神经细胞当作一个计算单元来统计的都是伪科学。但是为什么我还是敢说我们这一代能遇上计算机计算能力超过大脑? 因为有摩尔定律, 就算估计不准,差了2个数量级, 也不过是十年功夫的事情。 基本上, 我的个人预测(胡猜),与人体同等重量的计算机计算能力超过人脑, 大约在2018-2019年。 这里耍了个流氓, 没有拿大脑的重量和计算机比, 大脑和人体的重量差了几十倍, 对摩尔率来不过不到十年功夫。

计算能力是物质基础, 硬约束, 没有计算能力都是空想。 有了计算能力, 可以谈算法了, 也就是软件。 大脑是怎么工作的? 这里面关键是工作的原理, 就像造飞机一样, 研究了鸟以后, 科学家发现了伯努利原理, 造出了跟鸟的飞行方式不一样的飞机。 AI的伯努利原理是什么?

要想从功能上模仿大脑,回避不开的问题是如何理解人类智能。 大脑的功能又多又复杂, 一眼望不到边, 从何入手。 怎么建立理论框架。 解题的思路在心理学, 心理学一直是研究人的。 心理学三大门派, 精神分析,行为主义, 人本主义都对人是什么有自己的理解和研究方法。 自心理学之父冯特之后心理学已经研究人有快两百多年了。其中以佛洛依德的提出的, 本我, 自我, 超我的模型最流行。 本我是动物性, 是生存本能, 是条件反射层面的东西。 自我是逻辑, 是理性判断和分析, 超我是社会性, 是道德和思想。 这个思路, 正可以用来指导AI, 目前AI做到的东西, 大致也可以这样分。 以下分开来说:

本我:语音,视觉都是自我层面的东西,对应于潜意识。 人类生存的基本技能, 我们还没学会,但是可以 一个一个技能做, 慢慢来。深度神经网络发明之后,大大提高了大家做出这个层面东西的信心。  究其原因, 本我是对外部世界的基本理解和直接反馈, 解决的问题是如何从外部世界抽出概念这个关键的东西。 并做出相应的直接反馈,那么我们要学习一个从外部表象, 比如语音, 图像, 到内部概念的映射关系。 深度神经网络学这个映射大大的有效。 为什么会这样?

MIT的几个物理学家最近有个理论给出了解释。 他们说自然世界是建立在简单的物理规律之上的(这些规律甚至大部分都是线性的)。不同的线性规律相互作用,产生了非线性,比如双线性插值就是个简单的例子。 有了非线性, 加上耗散结构自组织,最后就能形成了五彩缤纷的现实世界。所以归根接地,世界就是一个大的分层网络产生的, 用分层网络来理解,做这个逆向过程,当然有效。 这样同样可以解释为什么大脑也这么厉害, 大脑的分层神经元结构不也是干这个的?

自我: 有了映射关系, 我们可以从外部世界走到内心世界了, 但是本我的内心世界很简单, 就是一些状态,和对应的简单逻辑, 比如分了多少类, 每一类该怎么做。 AI一开始做的玩具世界,就是搞搞类似的逻辑, 所以用LISP语言描述这个就可以。 当年计算能力不够, 玩不了外部世界到内部世界的映射, 前辈们只好玩玩具模型, 积木世界,也真是不容易。 也愈加佩服他们的聪明才智。

但是对应人的自我, 这些简单的状态和逻辑是远远不够的, 这里面有几个关键的东西要弄明白, 什么是知识? 什么是通用知识? 什么是记忆?最最重要的是,什么是自我意识?

先说知识, 搞知识表示的人研究这个很久很久了, 语义网络, 概念层次网络, 还有个语义互联网的RDF标准, 在他们看来,知识是一种概念直接的联系, 语义联系,确定性关系。 比如RDF标准,核心是一个三元组, 从一个概念,到另外一个概念,加上中间的链接关系, 就是知识。 RDF折腾了十几年了, 仍然只有有限的应用。 为什么不成功?各种解释原因都有, 在我看来, 是走错了路。 知识是确定性的关系吗?大错特错, 知识从来就是不确定的, 动态变化的, 所以要表示知识,不能用确定性网络, 要用概率网络, 也就是贝叶斯网络。 这里就不展开了。

有了知识,就可以谈谈通用知识。 所谓通用智能, 大家说计算机笨,AI笨,一般指责最多的就是这个。 计算机就是工具嘛,智能干一些特定的事情,而且还做不好。 这种指责其实相当没有道理, 刚开始学说话的小孩,学一个词都不容易, 你问他为什么不会作诗? 从知识到通用知识,是一个慢慢积累的过程, 这里面有没有过不去的门槛,量变引起质变。 仅此而已。

再说什么是记忆? 其实人的记忆很复杂,有短期记忆, 有长期记忆, 有短期记忆到长期记忆的转化过程, 人要睡觉, 除了让身体各个器官休息以外,最重要的就是要干这个: 把一天接触到的东西整理下来,变成长期记忆。 这个过程中没有自我意识的干扰。 有的时候, 转换出了点小问题, 就会做梦, 展开说可以是另外一篇文章。 这里点到为止。 那么记忆怎么来理解,关键在动态, 在时间。 与记忆相关的都是时间,我们记住了新东西,慢慢的就忘了旧的。 要模拟这个,知识表示的贝叶斯网络每个状态都得有动态属性, 动态贝叶斯网络。哈哈, 我的博士论文就是写这个的,瞎猫碰上死耗子,小得意一下。

最后要说自我里面最关键的东西, 自我意识。这里就不谈概念了, 就说说心理学认为自我意识是怎么来的? 一言以蔽之,学出来的!自我意识是从孩童开始逐渐发展起来的概念, 小孩子刚生下来是分不清楚内外部世界的, 慢慢的才知道”我“和其他东西是不一样的。 既然大脑可以学, AI也可以学, 具体怎么学, 因为设计到高层次的东西, 在我们还没解决知识和记忆之前, 提这个有点早, 但基本上可以推测这个跟增强学习相关。

超我:有了本我和自我,其实大部分人的智能就有了,尤其是有了自我意识的东西, 必须承认它已经是一个“类人”了。超我这种文化和道德层面的东西, 在于AI个体之间如何连接,如何建立关系。 我们做出了一个AI, 两个AI, 几百上千个有自我意识的AI之后,他们之间如何组织成社会。 Startrek这个片里的想象是borg人, 所有的AI个体公用一个大脑。 是不是这样, 值得商榷。 这个很重要, 人类简史里说, 智人之所以打遍天下无敌手,就是有了精神世界,创造了共同想象物,可以大规模群体分工,一致行动,直至建立庞大复杂的社会组织。 AI会怎么样,AI如何定位,AI和人的关系如何,这个交给未来学家,哲学家,社会学家。 涉及价值观,每个人都可以有不同的想象。

文章到此就可以收尾了。 有两个小问题再补充下, 一个是创造力,一个是自由意志。这也是讨论智能时候口水最多的两个问题。 创造力从哪里来,自由意志是什么? 很多人说这个归结为量子效应,这种说法很高大上。 我的个人观点,没那么深,大脑利用的全部科学,就在十九世纪的物理学里, 用不到二十世纪的物理学。 有热噪声就够了。 能坚持看到这里,也不容易,谢谢读者君。再见!

 

美食之道

link

前两天在微信群里和人聊天, 一言不合就说起来吃。 于是我开始显摆家里有各种饮食的书,表示自己略懂。聊完随手捡起小山裕久的日本料理神髓翻了翻。一翻就没放下手,基本从头到尾又读了一遍。好书要重读是真的, 人生阅历不同,心境不同, 同样一本书,能看出非常不同的味道。当年看这本书,看到了日本师傅做料理如何细致,怎么炫技。如今再读才明白原来人家早已上升到道的境界。

论起餐饮。口水话题最著名的一个就是中西方餐饮那家高? 因为中国人一直觉得自己的美食之国,中餐高到不知那里去了, 一出国就想念家的味道。 以至于很多学子回国都是因为胃。然而在放在全球视野下,却不是如此, 卖轮胎的米其林搞的餐馆排行榜才刚刚进入中国, 在上海挑出来的也是西餐,日料为主。 世界各地的高级餐馆,都是法餐,日料。 很多最贵的其实是日料馆子。基本没见过中餐。钱是没有偏见的, 因此光从钱的角度看, 中餐确实没有抓住世界人民的胃。 为什么?

小山裕久这边讲日料的书前半部分分阶段说了十几个日料的要点,后半部分主要是几个大厨的谈话记录。 书开头有两篇别人写的序。其中一篇谈到日料与法餐的差别,着重突出了小山先生的看法:说日料有如书法,粗看起来不复杂, 只是简单的几笔几划,然而真正动手,从第一笔开始就要一气呵成,中间不能有半点差错。 同时,每一笔都要技到神到。既要讲精准,又要讲神韵。必须经过多年苦练基本功,才能掌握基本写字的技巧,再加上多年的实践,悟出道理,才有自己的书法/料理风格。而法餐仿佛油画, 各种色彩颜料,涂涂抹抹,有点小错没关系, 可以抹上一笔把出错的盖住,最后整体效果不差就行。

这个比喻真是精到, 那反推中餐是什么。 当然是中国画。等等, 你是说中国山水吗?中国有八大菜系, 当然不只是文人山水画。那种追求淡雅意境的做法类似淮扬菜。还有更多不同的画派,比如粤菜如工笔花鸟,鲁菜有似杨柳青年画等等。中国菜五花八门,多彩多样,口味杂,风格多变。然而并不追求极致,略有追求的淮扬菜也是浅尝即止。出国了别人不是太待见你也是应有之意。有人不服, 说中餐馆开遍全球,老外一见中华料理就不要命。 我说那个叫做俗,世上毕竟俗人多,迎合大众口味,红尘之气当然也可以。 麻辣烫吃调料红遍大年南北。并不是有多高,游戏红尘,切莫坠入其中无法自拔。

回头再说书, 书中提到日料因为简单,所以要追求极致, 每一步都要精益求精,这种追求,从选料开始,强调经验积累,掌握原料的各自特点。之后从菜单的准备,高汤,刀工,蒸,炸,炖,煮,米饭等各个环节,娓娓道来。即讲操作,更多的是讲背后的道理。 比如高汤,只有几种最基本的材料:小山师傅却说 “每一天熬煮的高汤都是不一样的,。。。,柴鱼是很特别的食材,每一条鱼都有不一样的滋味,即使是同一条鱼,部位不同,也有不同的影响,甚至是给鱼刨片的方式,刨片之后放置等待的时间,搭配的昆布品质和部位,柴鱼片放入热水的瞬间,。。。,听上去很简单,这可是我花了5年时间才找到的现在的方法”。 “还有生鱼片,没有因为是生的就叫生鱼片,这么简单的事情。重点在于:想尽办法留住素材本身的美味和水分,切的时候要了解食材,讲究方法, 将刀刃对鱼肉本身的压力降低,不用刻意施加压力就可以轻松的将肉切断”。 是不是让人想起来了庄子,庖丁解牛? 人家不光是嘴上说说, 真的是这样练习的。

小山在书的开篇自己作序,原文并不长,写的十分精彩,因此我全文抄录如下,作为这篇小文的结尾:

所谓做料理,对我来说像是走进偌大的森林,进入森林后为了找寻出口前进,一路上也许会遇到志同道合的朋友,偶尔结伴同行,时而有大石挡住去路,时而迷失方向。而我们则是在料理的房间里前进。 森林和料理的房间还是有差异的,虽然两者都会有人引导到出口附近,但是料理的门最终还是要靠自己的双手推开。如果想以做料理为目标的话,其实取决于任何相关的事物究竟能不能很明确的用自己的意思表现。或者是如何可以很精确的表达自己的想法。

这种标准,从古至今没有任何的改变

简单说,料理的三大定律就是: 仔细看,注意听,审慎思考。

第一章“料理的思考模式”中,透过许多先进的经验积累,以他们的所见所闻,思考心得为基础,再加上具体的参考实例进行说明。第二章“名师的金玉良言”,则是我本身与一些知名的料理达人,名师的对谈。如果这些经验的分享能够对现在投身料理界的后进们有所帮助的话,将是我最大的荣幸。

能够在物资富饶的德岛,将受过鸣门海峡激流旋窝千锤百炼的鲷鱼做成料理,是我此生最大的幸福。今后得更加努力才行

一九九六年十二月

小山裕久