美食之道

link

前两天在微信群里和人聊天, 一言不合就说起来吃。 于是我开始显摆家里有各种饮食的书,表示自己略懂。聊完随手捡起小山裕久的日本料理神髓翻了翻。一翻就没放下手,基本从头到尾又读了一遍。好书要重读是真的, 人生阅历不同,心境不同, 同样一本书,能看出非常不同的味道。当年看这本书,看到了日本师傅做料理如何细致,怎么炫技。如今再读才明白原来人家早已上升到道的境界。

论起餐饮。口水话题最著名的一个就是中西方餐饮那家高? 因为中国人一直觉得自己的美食之国,中餐高到不知那里去了, 一出国就想念家的味道。 以至于很多学子回国都是因为胃。然而在放在全球视野下,却不是如此, 卖轮胎的米其林搞的餐馆排行榜才刚刚进入中国, 在上海挑出来的也是西餐,日料为主。 世界各地的高级餐馆,都是法餐,日料。 很多最贵的其实是日料馆子。基本没见过中餐。钱是没有偏见的, 因此光从钱的角度看, 中餐确实没有抓住世界人民的胃。 为什么?

小山裕久这边讲日料的书前半部分分阶段说了十几个日料的要点,后半部分主要是几个大厨的谈话记录。 书开头有两篇别人写的序。其中一篇谈到日料与法餐的差别,着重突出了小山先生的看法:说日料有如书法,粗看起来不复杂, 只是简单的几笔几划,然而真正动手,从第一笔开始就要一气呵成,中间不能有半点差错。 同时,每一笔都要技到神到。既要讲精准,又要讲神韵。必须经过多年苦练基本功,才能掌握基本写字的技巧,再加上多年的实践,悟出道理,才有自己的书法/料理风格。而法餐仿佛油画, 各种色彩颜料,涂涂抹抹,有点小错没关系, 可以抹上一笔把出错的盖住,最后整体效果不差就行。

这个比喻真是精到, 那反推中餐是什么。 当然是中国画。等等, 你是说中国山水吗?中国有八大菜系, 当然不只是文人山水画。那种追求淡雅意境的做法类似淮扬菜。还有更多不同的画派,比如粤菜如工笔花鸟,鲁菜有似杨柳青年画等等。中国菜五花八门,多彩多样,口味杂,风格多变。然而并不追求极致,略有追求的淮扬菜也是浅尝即止。出国了别人不是太待见你也是应有之意。有人不服, 说中餐馆开遍全球,老外一见中华料理就不要命。 我说那个叫做俗,世上毕竟俗人多,迎合大众口味,红尘之气当然也可以。 麻辣烫吃调料红遍大年南北。并不是有多高,游戏红尘,切莫坠入其中无法自拔。

回头再说书, 书中提到日料因为简单,所以要追求极致, 每一步都要精益求精,这种追求,从选料开始,强调经验积累,掌握原料的各自特点。之后从菜单的准备,高汤,刀工,蒸,炸,炖,煮,米饭等各个环节,娓娓道来。即讲操作,更多的是讲背后的道理。 比如高汤,只有几种最基本的材料:小山师傅却说 “每一天熬煮的高汤都是不一样的,。。。,柴鱼是很特别的食材,每一条鱼都有不一样的滋味,即使是同一条鱼,部位不同,也有不同的影响,甚至是给鱼刨片的方式,刨片之后放置等待的时间,搭配的昆布品质和部位,柴鱼片放入热水的瞬间,。。。,听上去很简单,这可是我花了5年时间才找到的现在的方法”。 “还有生鱼片,没有因为是生的就叫生鱼片,这么简单的事情。重点在于:想尽办法留住素材本身的美味和水分,切的时候要了解食材,讲究方法, 将刀刃对鱼肉本身的压力降低,不用刻意施加压力就可以轻松的将肉切断”。 是不是让人想起来了庄子,庖丁解牛? 人家不光是嘴上说说, 真的是这样练习的。

小山在书的开篇自己作序,原文并不长,写的十分精彩,因此我全文抄录如下,作为这篇小文的结尾:

所谓做料理,对我来说像是走进偌大的森林,进入森林后为了找寻出口前进,一路上也许会遇到志同道合的朋友,偶尔结伴同行,时而有大石挡住去路,时而迷失方向。而我们则是在料理的房间里前进。 森林和料理的房间还是有差异的,虽然两者都会有人引导到出口附近,但是料理的门最终还是要靠自己的双手推开。如果想以做料理为目标的话,其实取决于任何相关的事物究竟能不能很明确的用自己的意思表现。或者是如何可以很精确的表达自己的想法。

这种标准,从古至今没有任何的改变

简单说,料理的三大定律就是: 仔细看,注意听,审慎思考。

第一章“料理的思考模式”中,透过许多先进的经验积累,以他们的所见所闻,思考心得为基础,再加上具体的参考实例进行说明。第二章“名师的金玉良言”,则是我本身与一些知名的料理达人,名师的对谈。如果这些经验的分享能够对现在投身料理界的后进们有所帮助的话,将是我最大的荣幸。

能够在物资富饶的德岛,将受过鸣门海峡激流旋窝千锤百炼的鲷鱼做成料理,是我此生最大的幸福。今后得更加努力才行

一九九六年十二月

小山裕久

乱弹大数据

首先要声明, 我本人不是做大数据的, 完全属于外行, 只是兴之所至, 随便写点自己的感想。 您要是专家, 发现我那里错了, 欢迎指正, 但别因为这个生气。 先报个拳。

现在说正题, 大数据很火, 不是一般的火, 总理经常挂在嘴边, 还有各路英豪在到处宣讲。 到底什么是大数据, 似乎一直没个准确定义, 有人说要动态的, 每天起码得上TB, 有人说要规模, PB级别才算。 但这些都是技术指标, 回到我们之前文章的一贯思路, 还是要从商业出发。 技术和商业结合, 才能做好。

我个人一直在重复一个观点, 做技术要选战场。 这话是什么意思呢? 就是做同样的技术, 要找一个最好的商业领域去应用。 所谓最好的商业领域, 有各种准则来挑选, 但是归根接底要最容易挣钱。 用这个逻辑去思考, 做大数据的各种技术本身都是相通的, 如果商业想成功, 应当选战场(数据)。简化一下, 就是要找最值钱的数据。

先看说大数据的一般都指什么数据, 最多的就是物联网,传感器, 万物互联, 各种传感器每天都不停的报数据上来, 这个当然是大数据。 其次是工业大数据, 企业运营, 方方面面, 各种数据集中起来。 当然还有行业数据,各种行业,医疗,物流等等。 最后一个是用户数据, 各种人的行为数据, 内容数据。 那么什么数据最值钱呢?明眼人不用问, 当然是用户数据。

说到用户数据, 再扯一扯谁有用户数据。 用户最多的公司当然是首选,B,A, T,M,D。 一个一个说,

先说狼厂, 狼厂的用户数据似乎主要在贴吧, 是内容。 狼厂一直想用这个挖金矿, 一挖就出事, 哈哈哈。

其次就是A, A家掌控商业, 行为数据最多, 应当很有玩头,金融上自成体系, 略微玩玩就可以做的很好。 A家少一点点内容。  影业媒体那些无关用户。

再次就是T, T家微信霸天下, 内容也有, 行为也有, 就看怎么用, 我就一个服字!

然后说说M, 其实M的基本盘很不错, 有端, 有端上用户上来的数据, 还有云, 但是M可能天天都在跑路, 没有静下心来想想这些怎么用起来。

最后一个是D, 最近的当红炸子鸡, 其实刚起步, 任重道远, 要想办法弄弄内容。

点评完毕, 都是第一感觉, 也许漏掉很多, 各位看个热闹吧!

创新产品的用户研究方法

我是做技术出身, 后来混用户研究圈子很多年, 一直做的事情就是新产品研发。 技术背景的人通常不太喜欢用户研究这种所谓软科学, 觉得他们太忽悠。用户研究圈子本身又鱼龙混杂。之前互联网刚兴起的年代, 所谓基于用户的设计UCD相当流行了一阵, 时间长了, 很多公司觉得投入产出比不高,或者审美疲劳, 不管什么原因, 目前用研圈子普遍不如10年前乐观。 这里写篇小文, 说说用研的思路, 希望能激发大家一点思考。

有些公司的用研没有分的很清楚, 通常是跟设计部门放在一起,也有把可用性, 用户调研甚至市场,运营相关的都混在一起。 这里要澄清一下概念, 我们说的主要是面向新产品开发的用研, 可用性不包括在内。用研和设计师完全是两类人,最牛逼的设计师都沉浸在自己的世界里,因为他们其实是创造了自己的世界。用研要做的事情是把自己的世界,变成现实世界。

面向新产品开发的用研或者说UCD,基于用户的产品设计,概念最早是在IBM提出来的, Tom Moran为首的一拨人长期引导这个领域的方向。 我当年在IBM跟他们混过一小段(给自己脸上贴金), 很疑惑这些人并不是很强(我又说人坏话了, Tom不认识中文,他也看不见, 哈哈),为何有如此江湖地位?可能真的是人家是开派元老所以有江湖地位。 UCD那一大套背后是Activity theory, 这里就不多讲了。

国内UCD大概是在03,04年左右引入, IBM还是先驱, 后来有几个国内组织推广,慢慢的发展起来, 接着互联网,移动互联网的大潮, 开支散叶。 有人用类似的思路和方法来做创新产品设计,各种痛苦。 为什么? 道理很简单, UCD理论提出的时代还是软件开发的年代, 所以那一套理论和方法基本是围绕了产品迭代操作的,你已经有了产品, 有了用户, 该怎么做2.0. 中国的互联网圈子基本没有原创, 抄国外的思路, 然后在国内基于用户迭代, 这一套方法玩的很好, 慢慢的也有一些江湖大神摸索出了道理, 比如微信牛b到硅谷要反过来抄。 大家都觉得好神奇, 中国最牛产品经理第一人。 哈哈哈, 我还是跪大神一下!

那为什么真正的新产品开发做用户研究总是不对路? 其实道理也不难, 真正的新产品通常是一个新技术驱动的, 新技术出来的全新形态, 第一步是找用户, 连用户在那里都不知道, 做什么用户研究? 这时候怎么办, 我拿一些经典用户研究方法举例子, 说一说这背后的逻辑。

首先最简单就是发问卷。当然设计问卷这件事情本身非常不简单, 要经验, 要学问。最后体现在信度和效度, 大家都懂! 为什么先说问卷, 操作起来容易。 现在网络发达, 有现成网络平台可用, 弄个网上问卷, 各种群里发链接, 这个东西您要不要, 要A、还是要B, 回来就有数字, 反正老板天天要操心钱, 最喜看数字, 一看数字就高兴, 大家顺利通关。

其次是做竞品研究, 很多童鞋没搞清楚, 以为竞品研究是把东西买回来自己研究。 大错特错, 竞品研究要研究的竞品的用户, 你要锁定竞品, 找到用户群, 然后做研究。

再往下是用户访谈, 有各种扩展,比如情境用户访谈。 对用户研究的能力需求越来越高, 到这里是不是高手一看访谈提纲就能知道一二。 心理学专业出身的秒杀各种半路出家。 不展开了。

最后是放大招, 用户观察, 哈哈哈跟在人屁股后面看, 录像。 一提起这个谁都头大, 太辛苦, 太累, 还不保证能出结果。 投入产品比不能预期, 风险偏好的人都不喜欢。 据说当年日本车做美国市场是派调研员在美国人家里住了好几个月,回来写报告。总之玩到这一步就得玩大的, 一般小公司肯定玩不来。

好了, 依次写下来,大家有没有明白这背后的逻辑? 用户研究,用户研究, 你研究的其实是人, 所以各种方法, 跟人的接触越深入, 你才能得到越多, 当然对技能的要求也越高。 你随便派个人去别人家里住十年, 我相信也写不出观察报告。

等等, 焦点小组在那里? 问这个问题的,您还是没看懂这篇文章, 建议从头开始,再读一遍。

站在人类的十字路口

半夜醒的早睡不着,刷朋友圈时和某童鞋聊了两句,又勾起了思绪。本来已经发愿再写这种空对空就剁手。主要是因为写这种玩意不合我的身份,你一个小毛毛整天说宇宙人类的太不靠谱,写完一没人看,二伤人品。但这次还是要写一下,真的是最后一篇。至于发的愿,按某童鞋建议,买个猪手炖下,明天喝猪手汤。但愿我儿子的时代,他还能想喝就喝,也是我写这个文章的动机之一。

目前全球经济都没起色,表现为各国政府都在印钱,搞投资的钱花不出去,搞实业的越来越难,广大人民收入不升反降。(这个看刚毕业大学生的起薪变化最明显,中国已是全球亮点,这两年也不行了)。一言以蔽之,叫滞胀。凯恩斯那一套已经不灵了。真要信自由市场那一套绝对更糟,本来就是过于自由搞出来的,还想拿致病病毒当解药?根源在哪里,马太效应!该怎么解决,1.去产能,2. 二次分配,3,生产力升级,技术革命?。 倒序解释,最后一条打个问号,因为技术革命都是加速马太效应,从未看到反例。第二条要各种利益集团博弈,吃到嘴里的谁也不愿意吐出来,这个很难很难。第一条基本上是唯一路径,我朝主动在搞,效果如何,大家看到了。还是得看历史,从历史成功经验里找解决方案,去产能要打仗,而且要足够规模。

明确要打仗,接下来是怎么打,跟谁打,事后怎么收场的问题。中美欧俄几个核武大国互相打肯定不行,人类一起完蛋。剩下都是小国,打印度也没理由,而且印度没工业,打了也没用。看到这里,明眼人应当猜出来了,打宗教战争,灭石油财富。

前面有文章已经讨论过某教了,所以要打必须早打,这也是文章取这个标题的原因,再不动手真的就晚了。意图明确,再讨论下可行性,战争一方自不必说,另外一方几个主要力量,欧洲其实可以忽略,我甚至觉得战场可以在欧洲,老毛子多年深受齐害,一提要打,肯定哇哇叫冲上去做先锋。本朝有点拎不清,摇来摆去。好在最近某些人作死,终于让高层明白了。做先锋不行,也当不了主力,最多是个偏师后备队。还得看美国队长。

可是美国队长真能行吗?美国正在大选之年,有人说选谁决定美国历史走向。我说纯扯淡,美国政治框架决定了车子惯性很大,变向很难。好处是稳,坏处是明知前面路上有坑也躲不过。o8上台change了八年啥也没change。这次在选的两个活宝,一个就会感情牌,一个乱放嘴炮,统统不靠谱。

怎么办,天晓得!关机睡觉去,但这么收场太郁闷。今天看新闻,天朝在搞廉价空天航行器,快点吧,快点吧,我们去火星,那才是出路。

AI时代做产品的思路,7月30日参加西玛会的讲稿

西玛会是微软中国/亚洲研究院前员工和学生成立的交流组织,三天时间聚起了一千多人。在中国it圈怕是绝无仅有。30号西马会成员在创新工场搞了个小规模聚会,本文是当时的讲稿,略做修正。
​标题,The Journey to the AI Era

非常荣幸能站在这里,感谢开复,感谢世鹏给了我这个机会,感谢大家捧场,也因为有了西玛会这个平台,我们这么多人又重新聚在一起。

我今天的标题很大,但是世鹏日程里只给了五分钟,所以我剩下时间只讲干货。看标题,模仿了西游记,西游记了不起,要一句话讲完,是有一个大唐和尚,找来了三个小伙伴,去很远很远的地方,取到了真经,改变了世界。我们其实也是想在AI时代,找几个小伙伴,走很长时间的路,得到真经,改变世界!

前两页先做广告:

我2000年到微软vc组,Harry是我导师,有一段时间我跟着徐迎庆老师,也是我导师。02年毕业后,经不起诱惑,去了ibm,在ibm做了七年人机交互和用户体验,之后又去联想七年,做设备和用户体验,都没熬过七年之痒。现在在一个做算法和硬件实现的小公司叫文安智能科技。在座的有听过的没有? 哇,这么多,我还想说我们公司很低调。ToB的公司都这样,我们公司有十年历史,现在大约200人的规模。我们其实做了集成深度学习硬件的相机,全球第一个真正用起来的。

我本人做产品规划,大产品经理,目前正在搞两个产品,一个深度学习硬件前端,一个全景相机做内容。还在开发中,商业原因,不多说,有兴趣我们可以下来交流,不过为什么做这个的逻辑,我后面会讲,都是我自己的心得体会。

回到这个标题,有三层含义:

第一,AI时代终将来临

第二,我们有很长的路要走

第三,关键还是钱

动画效果:  Journey to->Money from

AI 很火,有前面开复老师的talk,我这里就不说了。

关键还是钱从哪里来,有三条路:

第一从市场上挣 可以toc 可以tob  挣客户的钱,这是正道,也最难。

第二做技术  ,在座搞技术的最多,都会码代码,做算法,搞研究。搞出了黑科技,卖给bat。也不赖!不过他们一般不买,此处不展开。

第三,可以挣投资人的钱,有一种说法叫toVC。不过大家虽然智商都高,但基本也就智商高,投资人都比你情商高,比如开复,智商也高,情商也高,就是双高。所以挣投资人的钱,其实你别想。

这三点,我们一条条再讲下。

倒着说,还是先说下怎么拿投资人的钱。注意是拿钱不是挣钱。一份商业计划书,一定要写100页,表明我态度很认真,其实重点一共就三条,100页里关键的是三页:

第一条,预期市场规模

方向对不对,有没有抓住大市场的前景。

第二条,商业模式

你懂不懂市场,对行业有多深的理解,会不会挣钱。

第三条,竞争优势

什么是竞争优势,多讲两句。有人说是技术,其实一定要想清楚,通常技术不能单独作为竞争优势,还要配合商业模式。你要真是独门绝活也可以,我反正没看到。专利在中国是吓唬人的,目前也没大用。有人说钱也是竞争优势,用钱可以砸死人,这个我同意。不过我们刚起步的时候,手里钱都砸不死人,只能给人挠痒痒。那绕了一圈,什么是竞争优势,主要看人,靠团队。我往这里一站,就是竞争优势,不展开。

接着我们谈技术,你要卖技术,先得做对技术。这里我就班门弄斧一下,在做的其实都比我懂技术。先声明一下,今天的主题是ai,所以我的标题也是ai。但其实ai太大,我只懂一点点计算机视觉,所以只说视觉相关的大方向。

三大方向,自动驾驶,ar增强现实,家庭机器人。哎呀,我真是喜欢数字3,什么都是三条。

没什么了不起,大家都看到了,将来都有很大很大的市场,不过都有点远,三年,五年,还是十年,八年,好像谁也说不清。说了我也不能全信。你要玩大的,万一搞错,节奏不对,没等挣到钱就先饿死。

long journey,不容易啊,唐僧去西天总是要问路。借问施主,去西天要往哪里走,这里有三条路: 1 辅助驾驶.  2 机器人一开始要做核心部件.  3 想做ar,先做vr.  时间关系,都不展开.

投资人讲完了,技术讲完啦,最后说市场怎么做,对我们这样的人来说,这个其实最难。

很多人都听过鸿沟理论,看过跨越鸿沟这本书,尤其做新产品要跨越鸿沟,从早期受众到大众市场。这个理论出来很多年,你也跨,我也跨,基本都掉进沟里啦,九死一生,十死无生,为什么?跨沟的姿势不对,做早期用户一定不是商业模式。正确的姿势是什么?做行业用户,先tob,后toc。

tob怎么做,时间关系推一本书,四步创业法

大家自己看. 还有一条路,可以toc。怎么做,再推一本书,国人写的,超级ip。前面周老师讲了微软小冰,如果小冰真成了,就是一个ip。

终于讲完了,看手机的同学没听没关系,attention,注意啦,看标题,很奇怪,为什么这么说?做事情要做,不能光说,有交流,互相学习,还得靠自己悟,悟出来才是你的。别人讲的可能都不适合你。

就说这么多,谢谢大家!

深度学习往那里去

从昨天开始, 深度学习的元老之一Yann LeCun, 乐总在quora上hold了一个session, 地址如下  。 里面有几个非常有意思的话题, 国内AI媒体新智元马上跟进, 翻译出来了中文版, (标题, LeCun:深度学习突破,对抗式网络最值得期待, 请自行搜索)。

新智元翻译的乐总文章一看完,脑子里翻江倒海, 五味杂陈。 思绪一下子回到了14,5年前, 我快毕业的时代。

我博士毕业是在02年, 毕业前一直在微软实习, 论文的题目是用图模型(graphic model) 做人类舞蹈动作的合成, 大致意思是用跳舞的运动捕捉数据学习一个基于图模型的动态贝叶斯网络, 然后用来合成舞蹈动作。 这样只要提前训练好模型, 就可以生成任意的舞蹈,要多少有多少。 文章发表在siggraph02上, 引用率还不错。 后来为了毕业,顺便用这套框架做了下动态纹理合成, 拿了chinagraph02年的最佳论文奖。 但是一毕业我没待在微软, 去了IBM研究院。 IBM研究院主要做工程研究, 不太涉及基础研究。 大家问我为啥不留在微软, 我给的解释是我贪图享乐, 微软太苦, IBM好一些! 其实内心的苦处, 实在不足为外人道。

我毕业的那个时间节点01-02年, 做计算机视觉的人其实非常痛苦, 传统几何的东西3d geometry做完了。 神经网络因为没有理论基础, 效果受限于计算能力也并不好, 在当时基本被当作骗子。vision的人抓住SVM, boosting 当作救命稻草, 这两个东西工程上都有用, 也号称有统计学习理论做基础。 我当时费了很大力气, 学习了统计学习理论VC维数等知识, 看明白以后, 有点失望, 理论倒是不错, 但是离实践太远, 不能用来指导具体的研究工作。

后来发现Micheal Jordan(UC Berkley教授, 跟打篮球的那个同名) 在贝叶斯网络基础上搞图模型,他当时也是刚刚立山头。 一看就觉得有道理, 特别是动态系统也能放在同一套框架下。 理论完善, 也能操作, 当真找到救命稻草, 救我一命, 得以毕业。

但是图模型虽然理论框架非常完善, 也有对应的学习训练方法: 比如MCMC通杀,就是太慢; 快一点还有变分学习,  凸优化等等;  总之各种学习方法都能尝试,但是仍然存在表现能力太弱的问题。

我要学习人体运动的模型, 从统计意义上讲, 是要估计人体运动所在空间的一个概率分布。 这个空间太大, 我们用贝叶斯方法和人的先验知识,控制模型复杂程度。 加上BIC这样的准则, 保证在有限数据集上训练出结果来。 我一开始就纠结在DBN的观测模型上, 观测模型本质上是要学习从系统内部状态到外部数据表示的一个映射关系。在Jordan的统计框架下用的最多的是混合高斯。 混合高斯其实过分抽象了, 表现不了数据样本的细微分布, 当时也没有深度学习网络这种东西。 找来找去, 我从传统控制领域找来了线性动态系统LDS。  LDS本来就是做动态的, 做对运动建模比混合高斯高到不知哪里去了。 再加上有后面的图模型做高层推断, 一定意义上把舞蹈建模这个问题就解掉了一点点。

现在乐总的文章里提到用深度学习和图模型做结合,用图模型做reasoning。 其实类似我当年的路子, 把LDS换成深度神经网络, 对状态到数据的映射关系表现能力更强。 结合图模型又有一个完备的学习框架, 这样会对深度学习有个大大的提升。

此外乐总还提到对抗式网络的思路, 训练两个网络, 一个做生成, 一个做判决, 两个网络一起竞争, 大家都越来越好, 这样就可以结合有监督和无监督。 让我也回忆起当年做合成时的疑惑。 通常统计学习建模对付问题有两种思路, 一种是估计联合概率分布, 一种是学习条件概率分布。前者其实是最核心的。 有个完全分布,那什么都有了。 但是模型参数太多, 数据有限, 学起来太难。 所以实践中搞搞条件分布, 压缩下供学习的概率空间, 学起来容易些。 对我的生成数据来说, 不管是条件分布, 还是联合分布, 模型受计算能力的限制, 信息量总是有限的, 要用来生成像样的数据, 全random肯定不行, 建模时丢了太多信息。 怎么把丢的东西找回来, 还是得靠知识, Lds动态系统就是利用了人的知识对运动的一种高层抽象。有了lds,就可以基于随机噪声做出像模像样的人体舞蹈动作来。机器就真的能画画,跳舞了。 现在大家都说用深度网络学不出知识。 其实我感觉没那么复杂, 乐总说的这个对抗网络的巧妙设计, 将来发展一定可用来解决这个问题。

总体来说, AI 进步很快, 很有希望!惜乎我只能旁观了, 没法也无时间亲身参与。 但话又说回来, AI进步还是不要太快的好。 原因你懂得!

BTW,有人问我合成怎么做,真的靠噪声驱动模型就可以吗?答案是不可以,模型表示能力毕竟有限,此外一个非线性动态系统,趋向于混沌,你就算模型全对,时间一长也没法预期。那怎么办?加约束。当时的做法实际上是先编舞,再跳舞,人工设定几个关键动作,模型把中间的过程推出来,结果也挺有意思,噪声加的多一点,动作就夸张一点,不加噪声就很直白。

又BTW,当年Cambridge有人来,讨论过为什么语音识别和语音合成完全是两条路,能不能用一个统计框架统一起来。答案是可以,语音识别用的hmm是dbn的特例,合成用template是知识表示,但是语音后边有语义,远比跳舞复杂。当时的计算能力下,统计模型差太远,干不了这事,也许现在技术进步了,有人可以琢磨下。

 

滴滴打车个案调查

这两天在上海出差,今天一早起来赶火车,旅馆的人警告我外环会很堵,于是起了个大早,没想到路上很通畅,早早就到了火车站,等车无聊ing,写篇小文,汇总一下我通过简单交谈了解到的滴滴打车生态。

因为旅馆位置不好,不通地铁,所以进出用滴滴叫了两次快车。路上没事跟司机聊天,问了下他们的基本情况,一男一女。以下详述:

两人碰巧都是安徽人,一个黄山,一个合肥附近的,都已婚有小孩,男的来上海四年,家人都在老家,女的两口子在上海,孩子在老家上学,表示上海的学上不起。都对上海房价表示了无奈,也没啥抱怨,接受现实,都表示早晚会回老家。以上是个人基本情况。

两人开的都是租来的车,租车要签一年合同,交一万押金,以后按月付租金,不论车好坏,租金基本是7千到8千

问,十几,二十万的车(当然二手不值这么多)车主不怕你们开车跑路吗。

答,登记了身份证,车上应当装了两个定位,装在哪里不知道,另外,为一辆车犯不着。

问,如果车主装记录仪监控你们呢?

答,均表示无所谓,不清楚。
问,车主是谁?

答,从小公司里租的,这个市场上有几千辆车的算大公司,有一百辆的是小公司,他们都找小公司租,大公司不理你。

个人脑补面向个体司机管理太麻烦,于是所谓大公司会把车转租给百十辆车的所谓小公司,小公司月租4,5千一辆,再租给个体司机挣差价。小公司似乎要半年付,这钱挣得也不轻松。整个上海租车规模男司机说得有十万,光他知道的大公司就不少,女司机表示不清楚。

问, 保险,保养怎么操作

答,都是车主负责,他们不管,保养基本一个月跑七八千公里就要做一次,他们唯一休息的一天,把车给车主去做保养。男司机表示他追了一次尾才知道车主只上了交强险,商业险统统没有

问,怎么挑公司和车租?

答,纯粹碰运气,各家车,租金都不一样,人家轻易也不说,只能自己碰或者老乡介绍。

问,为什么不自己买车开

答,不合法啊,怎么敢自己买车?经常被抓。。。

给司机讲解了刚出的网租车政策,还有滴滴优步合并的事。都表示完全没听过。男司机反应很快,先表示马上要自己去买车,又犹豫说挣钱全靠补贴,优步的补贴尤其多,一合并,都没啦,可能就没法开了。我宽慰到,滴滴不会杀鸡取卵的,一定会让你们有活路。

男司机表示,他想去试试易到用车,滴滴必须登记上海牌照,上海牌照的月租要一千多太贵,他要买个外地牌的车,在易到上挂着,易到没事不限制。

就回忆起这么多,该进站了。

btw,上海虹桥站空调真差,写完一身汗!

又btw,老娘舅的白粥套餐不错,7块钱一个肉包,一个菜包,一小碟咸菜,一大碗白粥,味道很好,吃的很饱。

又又btw,在杭州叫了四次快车,车主全是开自己的车,全是原来开出租车的,都是外地人。其中一个浙江衛州的生活状态明显比另外三个外省的(两个河南,一个吉林的)好些,对国内发展的信心十足。所以上海可能因为牌照问题是特殊情况。杭州的司机普遍生活满意度比上海高,出租车司机最大的有河南帮,东北帮等,都是老乡带老乡十来年形成的,有自己的微信群,曾经因为优步野蛮销户统一行动过,大概算是松散的社会组织,江湖雏形,就不单写了。

说说线上流量, 玩玩小数据。

前两天参加了个鲜老虎和维肯的公司合并发布会。两个公司都是做ibeacon的, 宣传彩页上写的都是发掘线下流量, 发布会上几个相关公司的老总和投资人反复强调线上流量太贵, 要30-100块钱一个人, 所以现在是做线下流量的时候到了, 是个大机会。 这一块我之前完全不懂, 也没有意识, 听人家一讲激起了我的好奇心。 线上流量到底怎么回事?真这么贵吗? 凭感觉不靠谱, 咱也玩玩数据!

我这个个人网站刚刚建立起来, 之前都是自娱自乐, 完全没告诉过别人, 因此没有自带流量。 最近一个月,后台的统计信息是这样:

blog1

一目了然, 平时基本没有流量, 有几个尖峰, 正好对应我在朋友圈分享文章和引流的时间。 具体情况,待我慢慢细表。

我的朋友圈目前大约是450人, 我在朋友圈分享自己网站的文章一共五次, 分别是7月16号分享了两篇比较长文章, 7月17号分享了一篇短文章,7月19号一篇不长不短的文章, 7月20号一篇不长不短的文章, 7月24号一篇类似的文章。 因为wordpress后台是按美国时间统计, 因此相邻两天会混起来,不好细分, 五篇文章分为三组。  最后我可能有个位数级别的几个粉丝,贡献一下日常流量, 可以忽略不计,因此数据虽然不大, 还是相当准确的。

1. 7.16,17号, 第一组分享,一共三篇文章, 对应上图第一个峰, 一共是428个PV. 3篇文章合并的效果, 打个8折, 算2.4篇(一个人看3篇,记三次, 也有看两篇, 一篇的, 脑补一个八折,各位别较真), 那么在微信朋友圈的转化率是:
428/450/2.4 = 39.6%
相当不错。

2. 7月18号流量归零, 7月19号,7月20号第二组两篇, 一共是269个 pv

269/450/1.6 =   37.3%

3. 之后几天流量归零, 7月24号一篇文章,280个pv, 怎么回事?转化率达到

280/450 =62%

其实很简单, 我在这篇文章里面放了三个之前文章的链接, 文章自引流, 因此又增加了大约70%的pv数。

总结一下, 朋友圈引流效果很好, 高达40%左右, 文章自引流更是出其不意。 所以各位要多多加好友, 按他们30-100一个流量的算法, 取个中位数, 咱的朋友圈也值

65* 450* 40% = 11700

过万人民币啦。

再来个尾巴, 新浪微博是个好东西, 有不少数字, 我刚刚在新浪微博上推广了下网站,我的微博有1200粉丝。推广文章到目前为止被查看了216次, 网站的pv数竟然只有个位数。引流效果不到4% , 大大的差。 难怪新浪微博不值钱啊。。。

 补充: 有人说我最后一篇效果好是当了剁手标题党,也有一定道理

未来中国之我见

最近读了一本很有意思的书,中国政治时钟:

这本书的主要观点是把中华大约三千年文字记载的文明史划分为7,800年一轮的四个大周期 :  周朝,井田制,土地公有; 秦汉,黔首实其田,土地私有; 唐宋,均田制,租庸调,土地公有;  明清,鱼鳞册,土地私有。 看似循环,其实每个大周期都始于政治制度革命性的创新。制度创新引发了系统的整体活力, 故而出现了历史上伟大的帝国。

盖因从国家的根源出发, 政治是各方要素的一场博弈。制度是博弈达成的均衡。 所有的均衡都是暂时的。 并且依照要素本身的特性,有其固有规律。 这就是为什么有大周期。此外大周期里有200年左右治乱循环的小周期。大致是因为人口粮食问题马太效应导致每200年要换统治阶层。大周期里政治要素变化,制度慢慢不适应,从博弈平衡态退出, 会出现系统崩坏期。 国家处于分裂状态,各种战乱,直到探索得出的新制度确立。 历史上其实分裂状态时间更长。 为何最后仍总是能统一, 书里给了七条原因, 我就不一一罗列了。 我觉得还要加上一条, 汉字! 导致沟通无障碍。

200年一小劫, 800年一大劫。 此所谓政治时钟也!

同意以上原理, 然后就可以当神棍了。我辈应当在第五个周期的起点上:国家统一,开疆拓土(也许是经济意义上的)。乐观预计,能有一两百年富贵可享受, (此处应有欢呼和掌声), 生逢其时, 太幸运啦!

再往后就ai了,也许人类全灭,也许可以去人马座!

最近一直在各种宏大叙事。 各种不靠谱。 虚头巴脑的东西到此为止。 以后只说具体的。

以下是相关的三篇臭屁文章, 你能看到这里, 其实也可以一起看看:

1. 有关社会, 民族, 国家种种前途的对话

2. 有关AI, VR, 和人类未来命运的思考

3. 文明的冲突