2016 年 11 月 – Tianshu's Personal Site

GPU,FPGA,还是ASIC? 浅谈深度学习计算的硬件选型

今天是Intel主导的边缘计算联盟成立的日子. 边缘计算这个中文名字有歧义, 往往让人产生靠边站,边缘人等不好的联想.其实边缘计算的含义就是在端上的计算, 为了与以服务方式提供的计算有所区别. 端上计算的概念喊了很久, 因为所谓物联网的起起落落, 也经历过波折. 目前物联网概念再次回暖,AI又火的不能再火, 两者结合则让人越加兴奋. 因此相关公司要召开一次胜利的大会. 这里借势谈谈个人对深度学习计算硬件平台的理解, 企图从应用领域出发,梳理相关硬件选型和可能的机会. 学识所限, 错漏在所难免. 请批判性阅读, 如有不同意见, 欢迎留言讨论.

谈及硬件平台, 先看看市场上有什么. 目前在深度学习相关硬件平台上, Nvidia一马当前, 美其名曰AI时代的发动机. N家最先看好深度学习的应用机会, 并且在硬件特别是开发环境生态上全力投入. GPU硬件计算成为各家深度学习平台的必备品, 而大家似乎忘了AMD曾经在显卡比拼时代一直对标N家的GPU. 这是因为从开发环境上对比, CUDNN对OPENCL是秒杀. N家的用心投入也得到了充分回报, 这体现在了不断飙涨的股价上. 可以说在深度学习模型训练上, N家的GPU平台是不二选择.

除了模型的训练, 更多的实际应用是用训练好的网络来做识别, 也就是inference. Nvidia在做inference上也有了充分的布局, 其推出的P4/P40系列和相应的面向INT8计算的支持, 又领先了一步, 在服务类应用上是新的标杆. 同时在端的应用上, 特别是安防相关的视觉计算领域, Nvidia 的TK1 又歪打正着. TK1本来是面向MID也就是pad设备推出的平台, 但是在平台竞争上被人殴打出局. 碰巧当时深度学习已经开始在视觉识别领域显出王者风范, 各家都使用Nvidia的计算库, 忽然发现因为nvidia的支持, 相关的计算很容易就可以迁移到TK1平台上, Tk1又适合部分端上比如智能相机的应用场景. 因此迅速占领了相关领域的应用市场. TK1和随后的TX1也成为类似应用的硬件选型参照物.

总结一下, 做深度学习的训练, GPU无敌, 做深度学习的Inference, N家在服务端有P4/P40, 在端上有TK1/TX1, 要想推出新平台, 要踏过参照物才能走下去. 那还有机会吗? 有的! 一旦结合具体应用, 就有数不清的机会, 市场还是非常大的.

以端上的应用来举例, 目前在市场上除了TK1之外, 唯一得到实际应用的就是Movidius. Movidius的芯片的特色是高度集成(片上集成了DRAM), 和低功耗(1W左右). 因此在特别强调体积和功耗的场合, 成为了唯一选择. 当然手机芯片在类似应用上也应有发挥空间, 奈何或许因为市场太小,手机厂家看不上, 手机芯片都没有面向计算的轻量级系统支持. 没有RTOS, 甚至没有嵌入式linux, 只能跑个andorid, 从内存占用, 启动时间等方方面面都不能忍受. 问题就是机会, 期望有良心企业有志于此类开发.

之前提到, 既然通用市场已经是GPU的地盘, 其它硬件存在的机会要看应用. AI相关或者深度学习相关从大的应用领域方面是三个方向, 语音,自然语言, 图像或者说视觉. 以下分领域再简单谈谈.

先说语音, 要坦白承认, 个人对语音应用并无深刻理解. 只是从基本概念上, 当年做动态贝叶斯网络时明白, 有向图的统计推断效率秒杀无向图. 所以语音相关的识别网络重在设计优化出特定的有向图结构. 同时考虑到语音的数据量传输在当前网络条件下不是问题, 所以语音的应用当以服务为主. 也就大致是GPU的市场. 考虑到网络仍然有延迟和连接等等种种问题, 在一些应用领域, 特别是所谓物联网, 也存在端上的机会, 而语音识别任务明确, 到目前为止相关技术和性能已经可以说比较成熟了，算法一旦稳定下来，加上应用场景有量的支持，就可以考虑做芯片。因此语音应用可能是最早做出面向深度学习应用ASIC的方向. 我们拭目以待.

再说自然语言理解和语义. 自然语言相关的领域应用是百度,搜狗等做搜索引擎公司理应探索的方向. 因此要做这个方向绕不开和这些搜索公司的竞争. 从应用特点上讲, 因为数据量极小, 因此基本不存在端上的机会, 应用应围绕服务展开. 而自然语言相关的深度学习应用特点是网络小,品种多, 百度为此开发了自己的深度学习库. 与这个领域应用相似的一个场景是服务器端的存储SSD, 因为要理解数据才能深度优化性能, 需要结合算法定制, 服务器端的存储SSD是FPGA应用的天下. 也许服务器端自然语言理解应用也存在FPGA的空间.

最后谈谈图像视觉, 大脑皮层里视觉相关的占一多半, 因此这一块是最复杂的. 从基本的应用场景出发, 大致可以分为感知类应用, 和交互类的应用, 感知类的应用, 又可分为被动感知, 比如监控, 辅助驾驶, 主动类的感知, 比如追踪, 机器人等等. 因为应用复杂,结合具体场景, GPU也好, FPGA也好, ASIC也好, 都存在机会. 举个例子, 交互类的应用强调实时性, 一定需要做在端上, 如果对功耗,体积没有要求, 需要GPU, 如果对功耗,体积有强烈要求, 可能要做AISC. 诸如此类, 可以单写一篇文章再谈.

写到这里, 基本可以收尾了. 在此特别想说的是, 深度学习相关应用领域相关的从业人员软件和算法出身的多, 很多人对硬件开发的周期不了解, 忽视了其复杂程度, 一言不合就要做芯片, 逻辑上很难成立. 一个硬件芯片的开发周期, 如果从零起步至少3年, 同时被忽视的还有面向应用不光需要芯片,还需要做出开发工具链toolchain, 这个可能比做芯片更难, 在有经验的人员操持下, toolchain以及相关的开发生态成熟可能又需要1-2年, 这样就是4-5的周期, 以深度学习领域的变化速度, 要看清4-5年后发生的事情而提前布局, 难之有难. 再加上各路大企业入局竞争. 小公司险中求胜可能是九死一生的荆棘之路. 这样就畏缩不做了吗?

知难而上, 与诸君共勉!

视觉计算-理论还是实践?

这两天, 朋友圈里朱松莼教授的一篇雄文”正本清源:初探计算机视觉的三个源头,兼谈人工智能”刷了一遍屏. 据了解为写此文朱老师酝酿了好久, 因为计算机视觉和人工智能长期积累之后终于做出了work的东西, 需要技术产业升级续命的金融资本主义如同苍蝇见了血,疯狂的扑了上来.学术圈也难免浮躁, 处在这个时代的CV学生们幸也不幸.幸运的是因为人才争夺战,以前无人问津难找工作的AI博士们,现在一毕业就能拿到难以想象的高薪.不幸的是过于功利的时代,本该打好基础的学生阶段大家都忙于不求甚解玩数据调参快速发文章,如果将来做研究难免后劲不足.

借一句师妹的评论: 朱老师一出场自带千军万马. 当头棒喝也许能帮到今后想从事科研的CV学生. 朱老师的文章里提到了CV创始人David Marr(本文按中文起名习惯译作马大卫)的视觉计算理论. 勾起了当年回忆. 因此这里也借机写一篇小文谈谈马大卫先生的生平和工作.

我不久之前写过一篇文章回顾了一下自己曾经做过研究工作. 这里要再次感谢一下朱老师对我研究思路给予的指导. 2000年夏天朱老师在MSR china 访问, 当时开班指点了一下我们这些迷茫中的研究众生. 印象深刻的是, 朱老师上课一开场就说你们以前学的东西全是错的! 并同时指出正确的路径是什么. 十几年过去了, 朱老师仍然用强大的气场镇压宵小, 要挑双手大拇指来赞!

回到马大卫先生, 网上能找到的生平介绍比较简单, 马大卫先生在二战的尾巴,1945年1月出生于英国伦敦, 应当算是十分幸运的一代人. 其后有baby boom的一代婴儿潮小弟托势, 非常容易做出成绩(类比中国生于80年代出生高峰之前的一代人较易成功).

马大卫先生的学生阶段是奔腾咆哮的五十年代. 社会发展欣欣向荣. 他中学毕业于拉格比(Rugby School)学校, 是英国历史最悠久的私立贵族学校之一. 其后进入剑桥三一学院学习数学. 他高中和大学毕业时都拿到了额外的荣誉奖励. 妥妥的精英学霸. 本科毕业后又对心理学产生了兴致, 跟随英国著名神经生理学者Giles Brindley 学习. Giles在视网膜和颜色视觉的生理机制上有突出贡献. 本人同时是个音乐学家, 还以某方面的出格行为而著称(感兴趣的请自行搜索).

经过本科硕士数学,博士研究生阶段心理学,和神经生理学的训练, 马大卫先生于1972年获得博士学位, 他的博士论文就是有关小脑和视觉神经生理机制的研究. 毕业后, 马大卫先生来到了MIT. MIT是人工智能研究的发源地, 当时是人工智能领域的创始人Marvin Minsky在主导工作, 有一众AI大牛.

在马大卫的遗作视觉计算这本书的序言里提到: 他到MIT是应Minsky 和 Seymour Papert的邀请. 来到MIT之后,因为DARPA和NSF给了非常慷慨的资助, 并且有Whitman Richards和Richard Held(当时主管vision基金的人)特别关照, 可以”便宜行事”, 加上一众出色的合作者, 以及本人跨领域的背景和天分, 才做出来了开创性的工作. 以上列出的这些条件应该是搞出了不起研究的必要条件. 如果再有合适的时机加成,比如有大量的实验结果, 而理论解释青黄不接时. 就可以突破.

然而幸与不幸, 天妒英才, 仅5年之后, 1977年底马大卫就被检查出了白血病, 当时是毫无办法治疗的绝症. 在用尽各种当时的医疗手段都无法治疗之后, 人生的最后一年, 马大卫写了视觉计算这本书. 严格的说, 这本书在他去世时(1980年11月17号)还没有写完. 部分内容是他的合作者和学生补充整理完成的, 首版出版于1982年.

我手头的中文译本是科学院生物物理所姚国正, 刘磊,汪云九三位翻译的, 出版于1988年. 姚先生的也因为癌症于2010年11月去世了. 他是受过中国传统文学训练的一代学人,文字功底很好, 为了翻译这本书, 也倾注了很大的心血. 他当时主办了针对这本书的讲习班, 每一章都自己或者请人来讲, 反复讨论, 务求做到充分理解. 翻译全书几个学者大概用了三年时间. 因此中译本的质量也很高.

马大卫先生在书里提过这本书是为阅读乐趣写的. 他说的乐趣也许是思考的乐趣, 因为这本书实在是不容易读. 尤其对初学者, 常常会有每个字都认得, 连起来不知道在说什么的感觉. 但是经过思考后, 尤其是体悟到其中隐含的深刻思想之后, 确实会有很大的乐趣. 每每在学界有了新的事实发现之后, 重读这本书又会感受到以前未曾体悟的认识. 朱老师说他每年都会重读一遍都有新发现. 此言非虚.

马大卫在书的导论里总结, 从哲学意义上, 全书写的是视觉的表象(representation)理论, 也就是如何从外部世界投射得到内部表示的计算框架. 因此这个计算框架是个自底向上的单向流水线. 目前应用领域里涉及到的视觉任务, 比如物体定位, 跟踪,识别, 三维重建等等都大概可以归纳在这个计算框架下. 对现在的这类研究工作仍然有指导意义.

另一方面, 当年就有人认识到, 人的视觉形成机制, 并不仅仅是一个被动接收的表示过程. 人与环境是互动的, 其中包含的不单单是自底向上的计算, 还有意识的参与, 自顶向下的指导和主动选择. 视觉里有一个门派, 主动视觉就是专门做这个的. 我们当年也基于人的眼球运动的生理现象, 做了有关注意力的主动视觉计算的研究, 并归纳其为选择性注意力形成机制的视觉. 受困于当年的计算平台, 大家只能在初级视觉里打转, 理论并没有多少应用价值. 而目前机器人大热, 在相关的视觉应用中, 这一类工作应大有用武之地.

除此之外, 在2010年视觉计算这本书出了再版, 马大卫当年的合作者,目前仍是MIT教授的Tomaso Poggio 在新版中的视觉计算框架下补充了一个学习层. 并认为学习是视觉计算高层表示中非常重要的成分. 这样就更好的呼应了最近几年所谓机器学习的研究热潮.

就研究的方法论而言, 先实践, 还是先理论,各有一派人坚持, 互相之间争执不休, 也不大可能吵出结果. 而按照中国人的传统智慧和后来西方哲学家总结的辩证法, 事物的发展总是在互相矛盾的事物之间摇摆并且最后螺旋上升的. 马大卫先生三十年前就给出了视觉计算的理论框架. 但受困于当年的计算能力, 并没有获得多少实践上的成功. 而最近的深度神经网络在实践中取得了大大的成功, 却又缺乏理论的指导. 按照事物发展的规律, 在考虑去创业挣钱发财之外, 学者们如果能静下心来认真思考DNN背后的道理, 是否能有再一次理论突破的机会?

智胜先师-人类能做出强AI吗?

看过我之前写的文章的读者应当知道, 我本人对于做出强AI是非常乐观的. 同时我也认为这并不是一件好事. 我的观点一直是在做出强AI引发系统内部剧烈冲突之前(AI和人的战争),必须先行拓展系统边界(宇航), 这些是由耗散结构的系统演化规律决定的, 不能以人的意志为转移. 不久前我也写过一篇文章, 大脑是如何工作的, 兼谈如何做出类人智能” 着重谈了谈思路. 整篇文章里最弱的地方是对记忆的解释. 当时想的也不是太清楚. 最近看了看有关知识表示相关的最新进展, 对睡眠的一些研究, 还有Jian提到的on intelligience, 觉得有必要再写一篇, 整理一下思路.

开宗名义, 飞机和鸟都会飞只是利用了同样的空气动力原理, 具体工作方式完全不同. 类比AI和人脑也一样.

前面一篇文章已经说过,目前最火热的深度神经网络是解决外界环境到内部表示的映射问题, 而且是头痛医头, 脚痛医脚, 只能是解决单一问题的工具, 一个子系统,最多是本我, 离强AI差很远, 而做出强AI的关键是通过知识表示把各个子系统连接起来, 其中的核心是记忆的机制. 有了记忆, 就有了自我. 下一步是解决多个AI之间的关系, 竞争合作, 是超我.

我的个人观点, 第一步, 学习各种映射,建立听觉,视觉, 五感运动等相关的子系统,这一步最难.这些功能大部分都是基因里自带的, 自然演化了数十亿年, 要靠人工赶上数十亿年的自然选择,当然难! 到了记忆自我意识,这些大脑皮层的功能, 大约只演化了数百万年, 学起来就容易很多. 而看似高级的一些东西, 比如艺术,文化,政治大约只有几千不到一万年的演化历史, 学起来就非常容易, 只要让有自我意识的AI自己玩,很短的时间就能玩出来. 而且AI玩出的东西无法预期, 也许是人不能理解的. 整个过程会越来越快, 并不那么遥远. 最近有报道说霍金,比尔盖茨反对AI的发展, 不知道霍金,比尔具体是怎么想, 但是我认为他们的担心是有道理的.

on intelligience 这本书主要就在谈记忆, 书中的观点, 大脑皮层的高级功能其实是通用的, 同样一块大脑皮层,既可以用来做视觉, 也可以用来做听觉. 这启发了大家思考是不是可以用一些比较简单的连接机制就能模拟. 书的作者为此建立了研究机构尝试了很多年, 受成书年代的时代局限, 书中建议的是一个7层的网络, 计算能力约束了想象力, 他们也不能做出什么东西, 然而相关想法是个很好的启示.

那么什么是记忆, 核心有两条,一是如何表示概念(系统的内部状态)以及概念的连接(知识,或者说是记忆), 一是如何有效学习获取知识(记忆).

对于知识表示方式, 长期以来一直有两派争执, 知识到底是确定性的还是不确定性. 不喜欢随机的人认为知识是确定性的, 而为了解决现实中大部分概念都没有清晰边界的问题, 他们搞出模糊逻辑等一套东西. 另外一派则认为自然的本质是随机的, 因此知识是对概率分布的表示, 推理只是对分布做采样. 这样往往会得到各种不确定的结果. 如果是在研究怎么做出工具, 当然确定性的东西大家更喜欢. 如果讨论模仿人, 那么引入随机性就是必然的.

最近搞知识表示的人终于扔掉了RDF, 三元组, 他们发现把实体和关系嵌入到一个子空间, 整体不光更有效率,而且效果也好. 这样终于往正确的方向迈出了一大步, 这两年在基础子空间表示方法上各种更新改进层出不穷, 效果也越来越好, 但是他们还是在搞确定的, 没有引入随机性. 需要再往前走一步.

至于知识如何学习, 简单的说, 任何模型在贝叶斯的框架下都可以学习, 关键是学习算法的效率是不是够高, 是不是能用当前的计算设备支持. 为此类比人的学习方式就很有意思, 人要学一个技能, 需要反复练习, 从一开始的主观意识, 练习再练习, 反复重复,最后变成潜意识, 就算学会了.

那么什么是潜意识? 人类学习经过总结最有效的方式就是刻意学习, 一万小时定律, 刻意学习其实就是在边界条件上学习, 要求太高学不会, 简单重复没意思, 比当前已经学会的稍难一点刚刚好, 会深度学习调参的人看到这里应当会心一笑. 你们别笑, 潜意识是结构学习, 主观学习是调参, 练习成为潜意识是学结构, 正确的结构一形成, 运算的效率就很高, 不再需要主观意识(监督指导信号)的干预, 技能就习得了.

另外一个跟学习过程紧密关联的事情是睡觉. 人为什么需要睡觉, 有各种解释, 也有各种相关研究. 最近的研究表明, 所有的高级生物都要睡觉, 甚至无脊椎动物也需要短时间睡觉. 有一种说法是说器官需要休息. 这个虽然正确但是没抓住重点, 需要休息的不是器官是脑. 脑为什么需要休息, 因为神经网络需要训练. 成批训练. 这不是空穴来风, 如果一个人长期睡不好, 典型症状就是记忆力下降, 学习能力下降, 各种东西看过就忘, 用的时候也想不起来. 同意上述说法就很容易解释这个现象, 因为没有训练好,所以没学会啊!

以上讨论记忆,知识表示和学习, 都是形而上的猜测, 也并不能推导出具体的算法或者计算模型. 但是我仍然觉得没有不可解决的障碍, 不同意作者观点的欢迎留言讨论.

从具体做事情的角度出发. 最最关键的还是效率, 包括计算的效率, 存储的效率, 计算和存储之间的通道效率. 尤其是存储, 做深度神经网络硬件实现的人已经意识到了, 把存储单元嵌入到计算单元中去, 整体的计算效率会更高. 现在的GPU甚至一些专门的神经网络硬件实现, 计算起来的瓶颈都在内存, DDR内存的带宽影响整个数据流的效率.

设计计算硬件需要考虑的核心问题是结合硬件实现和成本约束确定计算和存储单元的粒度以及架构方式. 目前存储仍然是分层结构的, 廉价大容量访问速度就慢, 访问速度越快,容量越小,成本越高. 这一是对计算很大的制约, 二是增加了架构设计的复杂程度. 因此除了摩尔定律以外, 新形态存储方式的进步, 将影响或者制约AI的进展, 直至所谓强AI, 奇点到来的时间.

回到本文的标题, 智胜先师来源于二十年前台湾一款游戏的名字, 游戏用这个名字也许是取了智胜和至圣的谐音. 先师孔圣人也被游戏当作封面. 这个游戏就是个做智力题的游戏, 没什么趣味. 但是标题含义深远, 人类学生都是可以胜过老师的, 一代更比一代强, 将来AI超过人类也是很自然会发生的啊!

做研究的奥义：象外行一样思考，象专家一样实践

最近跟同学朋友聚会，大家聊起近况，自己往往要感叹一句：“不做research已经很多年”。说话时颇似电影里一句常见台词：不混江湖已经很多年。这话说的五味杂陈，人入江湖，还能走的干净么？从思考的角度，到做事的方式，只要混过江湖的人，都是一望便知。今天这篇小文就说说自己经验的总结。其中大部分不是自己的，是从一本武林秘籍“象外行一样思考，象专家一样实践–科研成功之道” 里面学来的。其实我看到这本书的时候，自己就已经不太做研究了。倚天屠龙记里的创立乾坤大挪移心法的高人，其实自己的内功不够，只练到了第6层，第7层心法是全凭想象写出来的。我也大抵如此，并没有最高级的内功，只凭想象写文章。读者君要学张无忌，看到不顺的地方，自行跳过。也许是作者想错了，硬要练习就会走火入魔。

文章写多了，往往就有了套路。人不论做任何事，都大概有三层境界。第一层是技的境界，是做事情的具体技巧，第二层是术的境界，已经不再强调具体的技能，上升到了方法论的层次。第三层是道的境界，术到一定深度需要道的配合，有了道才能突破障碍，无限展开。

举个例子，比如小说里的武功，一开是要学各种招式，低级的有各大门派的入门拳法，剑法，后面循序渐进，有各种进阶招式，最后顶级的有少林七十二绝技之类。这都是武技。金庸后来写了一些高级货，比如独孤九剑，无招胜有招，很多人不理解，认为这是老头子故弄玄虚。而一些小说里最经典的场景，光明顶上张无忌学会了乾坤大挪移，破遍各家武技。那怕招式不如人，都可以现学，然后招招后发先至。少林寺里鸠摩智和虚竹对攻，靠小无相功的运使，两个人玩遍了少林七十二绝技。这些其实说的都是术。有了术，只学武技的人都被通吃。再往一层是道，到这个境界的人太少，基本上都不露脸。金书里现世可能武功最高的两个人：少林扫地僧说武功要用佛法化解，东方不败吹自己学会了天人化生，万物滋长的妙谛。这一正一邪都是道。有了道，葵花宝典就能压制独孤九剑。后来令狐冲对付学习同样武功的林平之，岳不群没有这么难，是因为大家以术对术，这些人层次不够，没有道的境界。

写了大一大堆虚无缥缈的武功，回来说research。其实意思是相通的，要是说技巧，怎么做research，至少要写一本书，或者可能要很多本书。

而道的境界是没法说的，道可道，非常道。不能正面说，可以从反面说，道德经里说的都是：什么不是道。道这种东西，全靠自己悟，而通常情况下，从术到道的进阶，要有生死体验。

第二层次的东西，也就是术，或者直白说是方法论是可以说的。术的篇幅都不太长，比如乾坤大挪移写在一张羊皮上，小昭用手指头上的血就能让张无忌看一遍。要是一本书，以小昭的体格，恐怕血流干了也看不完。要学会术，需要技的配合，没有技，光谈术会走火入魔。还是要先做几年research，从技巧开始学习，切记切记。

做research的术，或者说是金出武雄先生做research的术，大致是这样的：

1.首先是心态，做research不能太严肃，要有趣。绪方先生说所谓有趣是指：精神上的放松，同时内心要认真对待。这是辩证法，一下子可能学不会，需要大家慢慢练习。心态放松以后，让思维去奔跑，去飞翔，才可以有很多天马行空的想法。想法一开始可以很幼稚，不要让现有的知识把自己框住。最好喝茶聊天跟各种不同的人多讨论，多思维碰撞，这些都是技。只举个例子，后面就不再说了。

2.要集中精力，深入思考，让自己成为问题本身。决定研究什么问题是做research最关键的事情。发现问题需要创造力。很多人说创造力来自于灵光一现。有各种科学发现顿悟的故事。这是成功学的套路，只告诉你最容易模仿的。顿悟固然重要，但是只说顿悟是故意的。因为顿悟之前需要的长期思考很难。思考要集中精力，跟自己过不去，这是非常累和辛苦的一件事。金出先生说他自己读研究生的时候，经常一周每天只睡2-3个小时，还有连续74个小时只想一件事情的经历。一般人想问题，3，5分钟就开始走神了。经过长期思考后，顿悟的时刻可以很快乐，据某些研究说是人能体验到的最快乐的事情，这是大自然给做研究的人的奖赏。

3.创造力的基础是记忆，记忆需要在实践中反复练习。说一个人聪明，会下意识的觉得他记性好。这是因为所谓创造构思是从记忆重组而来的。记性好是这一切的基础。记忆是需要培养也可以培养的。别再抱怨小时候的背书了，真的有用。需要注意的是不能填鸭一样死记硬背，要在理解的基础上背。内容经过思考理解之后才能变成知识。知识需要反复应用和练习，别再抱怨小时候做那么多题。

4.多和人交流，但别管别人怎么看。又是辩证法，做研究找问题需要思维的碰撞，因此需要多和别人交流。交流不仅限于专家同行，最好跨界。而找到问题之后，就要一条路走到黑了，对自己的想法要够坚持，不能轻易动摇。问题不是那么容易解的，要不然也轮不到你了，各种挫折，错误会纷纷而来，这时的心情就象一句歌词：甚至让人开始怀疑人生。一定要挺住，才有柳暗花明。

写了4条，感觉就已经写完了，写来写去，说的基本都是怎么找问题。金出先生说做研究，找到一个好问题，大约占6成功夫，剩下的就是努力用心解问题。金出先生的书名，“象外行一样思考，象专家一样实践” 主要说的是这个找问题的过程。

除了做研究本身，在现代社会，好东西也要宣传。要把自己的研究写成好文章，要能出去给别人讲。这些金出先生的书里都有写，强烈推荐买一本回去仔细阅读！

翻开手头这本书的扉页，还有Harry送书给我的题字，是06年11月，到现在整整10年。金出先生是Harry的老师， Harry是我的老师。不知道我会不会去当老师。做research的薪火相传，一代一代总是会让世界变得更好，人类生活的更幸福。那我们呢？

AI时代如何做产品经理

昨天顺为资本孟醒先生一篇AI创业我看好这三大领域的雄文在朋友圈里刷屏. 梦醒先生的名字起的非常好, 文章也写的非常好. 我之前在西玛会上也分享过自己的想法, 也是这个公号的头两篇文章:AI时代做产品的思路. 大家不谋而合, 都在说先ToB, 后ToC, 也都看好AR等未来产业变革的大方向(先给自己贴个金).

梦醒先生文章里说能做AI产品经理的人非常稀缺, 我就搭一下车, 说说AI时代怎么做产品经理.

产品经理跟用户体验一样是个被用滥了的词. 一些巨头大佬们比如360,腾讯,小米的大当家都说爱自己是产品经理. 还有一本畅销书名叫人人都是产品经理.西二旗地铁如果发生踩踏事件,受伤的10个人里面9个都是产品经理. 那么产品经理怎么还会稀缺呢?

我的理解, 大家说的其实不是一回事. 很多网上的吵架争执,归根结底是没有理清概念. 产品经理范围太宽, 行业大佬和IT新兵都说自己是产品经理, 经常讨论起来驴唇不对马嘴. 我们先对产品经理做个划分: 分三类, 巨型产品经理, 大型产品经理, 中小型产品经理.

先说巨型产品经理, 就是之前说到的那些总爱当产品经理的业内巨头. 他们其实掌控的不是具体哪一款产品, 而是整个公司的产品战略. 一说战略这个词, 好象就很高大上, 其实内涵也不复杂. 出来混社会做生意,最类似的就是打仗. 打仗也爱说战略, 所谓战略就是先要对未来会发生什么有个预期, 再决定该怎么做. 不能想起什么是什么, 做事要有个章法. 会制定战略的人, 不光要懂产品, 更重要的要懂商业, 懂行业, 懂市场, 也许还要懂政治, 懂经济, 懂人性. 这样的人当然难找. 就算有个别人物通常都会自己单干, 所以非常稀缺, 梦醒先生脑子想的至少有三成是这类. 我没提技术, 这个层面的人不需要懂技术. 他们需要做的事情最关键的是选战场. 在部队里面, 可类比的是司令, 不是总司令,也是军团司令, 要掌握一个军团.

其次是大型产品经理, 也就是具体掌控一款产品的人, 这个层面的人要懂商业模式, 懂一些技术, 做商业客户的要懂行业,做消费用户的要懂产品体验 . 做事情需要知己知彼, 要知道别人靠什么赚线, 自己能靠什么赚钱, 能够最大化自家的优势. 同时又能一边理解用户的需求,一边理解技术的边界和成本. 能够在两者之间把握一个平衡点. 帮助公司挣钱. 要做到这个层次也不容易, 梦醒先生脑子里有七成估计是这一类. 类比部队里面的一个独立作战单位, 师团级.

最后是中,小型产品经理. 也就是一般意义上的产品经理. 通常需要同理心, 能够充分理解客户和用户, 还需要耐心和细心, 能够精益求精, 把各种细节打磨好. 这样的人其实做到顶级也不容易, 部队里面的营连级.

这样划分有点粗糙, 不过大致是按照角色和作用不同来划分的. 不同层次看重的素质也不一样. 如果想跨级, 需要转换思维方式, 通常这个很难.

有了划分, 就好说事了. 回到AI时代, 要做好一个巨型产品经理. 需要对AI的未来有个明确预期, 之前就提过对创业的人来说, 应当先toB, 后toC, 背后的逻辑是新技术刚出现时候的成本比较高, B端比较能出价. 同时我也比较同意梦醒先生的提法, 因为要ToB, AI是要结合在行业里, 需要有对行业的理解, 做进去, 才可以最终赚钱. 这就是一个选战场的逻辑.

尤其对于创业公司,选战场还得考虑竞争对手. 比如BAT, 行业大佬万一来插一脚怎么办? 这里有个一般的思路, 也是制胜战略. 大佬们人多势众, 平原大兵团作战肯定没有什么胜算, 但是可以把他们拉到山谷里,地形狭小的地方来打. 让他的部队无法展开. 人再多, 冲不上来也没有用.

对于大型产品经理, 主要是靠经验, 最好做过技术, 又懂体验, 又懂管理. 在别人选好的战场上冲锋陷阵. 最主要的是要理解两点, 一个是对时机的把握, 知道什么是关键时刻, 养兵千日,用兵一时, 关键时刻要赌. 一个是对力量的把握, 需要知道集中自己的精锐力量突破敌人的薄弱之处. 什么? 说的都是打仗, 这对做产品有什么帮助? 你自己慢慢理解.

对与中小型产品经理, 能学能参考的就太多了, 这里就说一点: 注意不要关起门来自己修炼, 平时多参加行业聚会, 多跟同行交流学习.

有感而发, 一时能想起来的就这些. 就写到这里吧!

曾子曰：“吾日三省吾身——为人谋而不忠乎？与朋友交而不信乎？传不习乎？”

做产品经理也要每天三省吾产品:

产品用户会越来越多吗?
用户需要的重点被抓住了, 被最恰当的满足了吗?
我已经充分利用一切可能力量了吗?

世界真乱！领导很忙！我想静静！

帝都最近是一趟开往南极的列车，每过一天都要冻死几只企鹅。万幸我家搭了个自采暖的小站，让它可以临时停泊。比起天下纷纷扰扰，各种大事件层出不穷，冻不冻死只是青萍之末吧。自从白左们搞了所谓政治正确，又几十年，世界终于要毁在女人手里了。各位女权看了别生气, 我就想吐个槽。

当前世界是有史以来女性领导人最多的时候.欧洲两个老牌强国英国，德国都是半边天当家。美国大统领也几乎要落定在女人手里。中国周边，女人当过家或者有很大影响力的还有，韩国，缅甸，泰国… 。要挑她们的毛病，默大妈打开欧洲边界，放进百万难民，恐怕是欧洲盛衰的历史转折点和标志性事件。最近的新闻热点基本上是围绕的美，韩两家的女主转的，各种八卦，狗血层出不穷。这个世界是怎么了？

也许跟中国文化喜欢坐而论道相关，在中文互联网兴起的过程中，时不时会出现一些观点犀利，引领潮流的论坛型网站。从早期的四通利方，榕树下，新语丝到中期的泡网，西祠，再到后来的水木，天涯，各领一时风骚。海外也有华人必看6Park，文学城等等。特别是08-10年左右有个西西河可谓精华汇总。西西河有些比较奇怪的制度，比如认证需要拉票，砸花送宝之类的，有一定门槛，像是一个熟人社会。我就因为这个门槛所以只看不发言。而大牛好扎堆，西西河当年可谓群星闪耀。有人写历史，有人懂政治，有人分析经济。比如陈经的大作：官办经济就是在自由派话语权下最早跳出来反对，又能描述中国现状的好文章。抱朴仙人写的九段线和南海问题因为去年的南海热点被翻出来又热了一遍。他的另一篇建国后三次财税改革的文章是理解中国政经现象的一把钥匙。还有万里风中虎的远华系列各种八卦描述了政商如何勾结。更有忙总这样曾经的体制内人士言传身教，帮助大家立三观。可以说，我理解政经现象的全部思路都来自于西西河。

金庸的鹿鼎记里面取笑满清当权者没有文化，说他们就懂戏文里的三国，凭借这一点儿大部分都是编造的计谋故事取得了天下。明朝的大儒们通读二十史和诸子百家，碰到戏文三国，竟然是人有狼牙棒，我有天灵盖的下场，让人不胜唏嘘。我这西西河学来的半吊子，看到那些侃侃而谈的政经大家，也有几分，庙堂之上何置于此的感慨。

那么当前政经乱象该如何理解呢。六月份我刚开始提笔写字的时候，新闻热点是宝万之争和英国脱欧，当时在一篇短文里总结了两条大势：

民主政治民粹化
金融整合产业资本。

一条说的政治，一条说的经济。怎么理解？本文先说政治。政治的核心是利益分配问题。

当前时代的热点是AI，有人说AI是自农业革命，工业革命，信息技术革命后的第四次产业革命。每一次产业革命都会大大的促进生产力，物质会更丰富。我D总结，中国社会主义初级阶段的主要矛盾是有限生产能力和人民群众物质需要的矛盾。所以要大力发展经济。那么生产力发展了，物质丰富了，矛盾就能自动解决吗？恰恰相反，回顾历史，每一次产业革命的时候，生产力大发展，都是社会矛盾最激化的时候。

为什么？因为有了物质，还要解决分配问题。而分配是一场博弈！掌握先进生产力和资本的人，永远是少数。当生产力革命时，会大大加强这少数人的博弈能力。他们将占有更多的资源。被动接受生产力革命的大部分民众会更加困苦。有个研究曾经给出了一个数字2%，也就是每次技术革命的受益人口在全人口中所占的比例大致是2%。剩下98%都是利益受损者。

当前的纷纷乱象就来源于此。信息革命大大加强了世界的连接，缩短了空间距离，地理不再是管理的障碍。通讯手段的进步让信息传递的效率更高，这在增加了组织的规模的同时，推动了全球化，出现了很多巨无霸型的公司。所谓世界是平的。一个组织的工作人员可以同时分布在世界各地，资本期望着在全球无障碍的流动，哪里最有利益就去那里。于是中国的工人凭借低收入自然就能抢夺美国工人的饭碗。

民主政治的有效运转是建立在基本利益相同，也就是橄榄型社会，一亿总中流的基础上的。基本利益不能一致，民主就会运转不良，变成撕逼大战。所谓的民主失败国家包括台湾的种种乱象，都是来自于此。美利坚也在往这条大路上狂奔。

美国的犹太精英们推动全球化，抛弃了美国的中产阶级。在全世界挣钱，又有各种手段避税。为了保证自己的政治利益，他们大搞喂奶主义，靠福利制度笼络底层民众的选票。女克就是他们的代言人。民主党在美国的政治光谱上属于左派。左派为了要钱来笼络底层票仓，与传统属于右派力量的大资本苟合，现实就是这么反讽。

O8大搞福利已经8年了，实质上已经造成了美国财政的破产。 O8的8年，美国的国债增加了一倍，目前是gdp的119%。 2015年光利息就要支出4943亿美元（比2008年翻了一倍），占财政支出的12%，而美国的国防预算不过5千3百多亿。美国的政府财政已经有60%用于社会福利。因为税收的减少，福利支出的增加，投入在教育，科研，基础设施上的预算被不断消减。这是对未来的透支。 O8同时还在全球开战，消耗美国的实力。他留下的这个烂摊子本来就极其不好收拾。

出来混早晚是要还的，要解决当年奢靡导致的问题，就得过一段苦日子。这样必将惹恼吃福利的民众。人民不高兴，乱象就纷纷而生，最可怕的是他们会依托宗教对抗。因此要上台的领导人需要有足够的威望，极敏感的政治嗅觉，强大的内心，和丰富的政治经验来把控民意。只有这样才能对抗民众的反弹。以上素质要求很少在一个女性身上看到，女性喜欢各方平衡。因此才有本文开始的吐槽。川普这个死胖子有这个能力吗？存疑。

技术革命抛弃的底层民众，如果无人安抚，对现世的绝望，会让他们自然而然寄托于各种宣扬来世和天堂的宗教。而一个宗教如果有活着的教主，就是邪教。因为活人的私欲不可阻挡。他们对自身地位的不满，对获取更多利益和名望的渴望会导致社会的冲突和混乱。

那些能自创一派的人物更加危险，他们在草根社会磨练出来的本事，恰恰符合前面提到的卓越领导人该有的能力。对他们来说，不成则死，这是生死之间的考验。这不是养尊处优的上层社会精英可以比拟的。所以精英社会需要给这样的人物留一扇门，之前文章里提到的武则天就是个例子。武则天来自底层，一个女人单挑了一群高富帅，掌控大唐40年。但她毕竟和关陇贵族们相爱想杀，建设多过破坏，这是正面的例子。而更多的史实是进阶之门关闭，出现各种在下面胡搞的张角，洪秀全之流的坑爹货。

当今世界会如何，不知道。但是世界之大，应当能放得下一张书桌。推背图在神棍之后，结尾说：

茫茫天数此中求
世道兴衰不自由
万万千千说不尽
不如推背去归休

我们可以去做个泰式按摩，做个足浴。物质毕竟丰富，可以比古人享受更多！

2016 年 11 月
一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30