如何培养强大的直觉?–从AlphaGo下棋说起

上一周科技圈最热的事件就是alphago 再战最强人类棋手了。 不出意料, 人类完败。不管是3番棋还是转着圈下, 组队下, 人都输给了机器。 有人说从此就没人下围棋了, 观点错了。跑不过汽车的人一样爱跑步。跑步是用来锻炼体力的,下棋是用来锻炼脑力的。作为锻炼脑力最好的游戏之一,围棋将长期繁荣,而且因为有了电脑可以帮助教学,降低学棋的成本, 围棋会进一步繁荣发展。那么围棋究竟是怎么锻炼脑力的, 我们今天就掰开来讲一讲。

在谈alphago下棋之前。 先来说在在此之前计算机是怎么下棋的。计算机先胜过人是下象棋。在机器下象棋的时代,走子主要是根据规则来下。象棋的子少,每个子都不一样,我们就可以给每个子一个重要性的分数,比如王后是10分,小兵是1分, 再根据每个子在棋盘上的相对位置加权,比如王后下一步直接吃到王,那就多加几分。综合下来我们就可以对一个象棋盘面打分。下棋就是遍历所有走子可能的一个树型搜索过程,从当前步所有可能的走法往下延伸,太差的招法可以及早去掉,一步一步算下去,最后选择搜索到的空间里最好的下法。

同样的方法到了围棋, 就有问题了。大家都知道那会儿计算机下围棋不太行,长期处在业余水平,主要原因是围棋和象棋有很大的不同,围棋每个子都一样,棋盘也大得多,而且是逐渐往棋盘上加子,如何评价局面就很困难。简单办法就是数谁的地盘大,一个空地离那个活棋近就算谁的,但是这个通常是不太准的,因为死活本身就不确定。再加上选择太多,能搜索到的空间有限。这样合起来就有太多的不确定性,因此围棋不能象象棋那样用确定的搜法。实际上围棋搜索是用了所谓蒙特卡洛树,一种引入了不确定性的搜索方法。因为判断不准,干脆认为所有的判断都包含有概率,然后象仍骰子一样蒙,可能性大的地方就多试几步,到然后所有试过的加起来那个分高选那个。这样蒙圈,效率就不高,计算量大, 对计算能力的要求高,在alphago出现之前人们认为机器下围棋是不行的,超过人还早。

为什么alphago一出来就行了?是因为alpha过把下棋的判断过程分成了两个网络,一个叫策略网络,也叫走子网络,可以根据当前盘面一步就推出下棋的选点在那里。另外一个叫价值网络,其实就是象棋里那种盘面评估的,只不过因为围棋复杂,用到了神经网络学习。alphago还搞了一个快速走子的策咯网络,用这个和价值网络的评估配合起来,利用蒙特卡洛搜索方法,综合选择可能的走子。这个策略网络是之前没有的,一步就能算出下一步棋,类似人的直觉。

我们在现实生活中会碰到很厉害的人,做事很行,能成功也是大家服气的。对这样的人肯定有的评价是脑子好使。脑子好使体现在两个方面,一个是脑子快,想得多,算的多,另外一个就是直觉准。尤其是后者,在生活里面对很多复杂问题的时候,一开始是无从下手的,因为各种看不清楚,没法算,这个时候,也许只能依靠直觉,直觉好不好使,是高手还是低手,一出手就知有没有。

这听上去就很玄乎了,直觉是什么?为什么别人的直觉比我强?我怎么来训练直觉?我也想知道!

开个玩笑,对于大脑是如何工作的,人们慢慢有了越来越多的深入了解,虽然还没有最终确定的答案,我们也已经知道了很多。我们可以依次回答问题。

首先什么是直觉?直觉来源于潜意识,也就是没有进入注意力的意识。通常情况下,直觉也和人的情绪系统相关,说白了,直觉也是算, 只是没有进入到你的注意,没有意识到而已。这种算,跟alphago的策略网络有点象, 多层非线性映射,一步出结果。直觉是计算的观点,我师父的师父金出武雄先生在“象外行一样思考,象专家一样实践”的大作里曾经也提到过的。并且也得到了最新认知神经生理学研究的支持。

按照脑科学的说法,直觉和Acc前扣带皮层相关。ACC监控脑部其它区域的活动,并且对冲突进行协调,当ACC激活到一定程度的时候,会竞争唤起意识中枢,将它的结论注入意识。这就是所谓的直觉,包括灵感和创造力属于这一类。

为什么有人的直觉更强?那么我们要反过来看知觉可能的弱点是什么,直觉是一步决策的计算。从输入到输出的映射,这样的映射,最讨厌的还是不确定性。因为直觉的映射可以被理解为提取出了模式,这样才能分类简化处理。对不确定性,就不容易提取模式。大脑又是面对一切都倾向于找出规律的。碰到不确定性,会有各种偏差,比如去赌博就容易上当,把靠运气赢钱理解为自己掌握了赢钱的模式。此外,直觉倾向于逃避惩罚,大个比方丢一块钱和赢十块钱给人的刺激程度可能是一样的,这样依赖直觉会偏保守。此外在传统经验不适用的新事物上,直觉可能是无效的。

所谓直觉强人,是针对直觉的弱点,有意识无意识的进行了改进的人。这样的人,不盲从,更大胆,知识面更宽广。

那么怎么训练直觉呢?因为直觉在潜意识层面,我们没法直接触及到,只能间接培养。 其实就像学骑车一样,学习一开始依赖注意力,到多次重复,反复训练后学会了,就变成了程序化记忆,我们可以说掌握了骑车的“直觉”。训练直觉思考也可以通过思考问题做练习来有意识的训练。通过思维训练,培养自己的思考习惯,日积月累,就形成了强大的直觉计算系统。

篇幅所限,这里没法展开谈了,推荐几本书,除了之前提到的“象外行一样思考,想专家一样实践之外”, 还有:

为什么大猩猩比专家高明。这一本就是讲感性思考(直觉)和理性思考的。

怎样解题-数学思维的新方法。这一本是讲数学思维的,但也触及到了更一般的问题求解过程。

怎么没说到底怎么训练? 去下围棋!

 

 

 

 

 

你好, 我不是人工智能。

这几天帝都热的要命。周末我碰巧受人之约跑到外地,躲过这一场热劫。然而写文章的时间又到了, 这可躲不过。 旅馆房间外就是风景, 天已大亮,得抓紧时间完成任务, 好出去走走。

上周看光量子计算机放了个卫星, 写了篇量子的科普。这周可燃冰又放了个卫星, 搞出了能开5万公里的可燃冰汽车。主要过程是记者看到有说法一升可燃冰可释放1百多升天然气, 又看到现在烧天然气的汽车,装满天然气能跑300公里, 就脑补说如果把天然气换成可燃冰可以跑300公里的一百多倍吧,5万公里的笑话就这么出来了。 实际上烧天然气的汽车里面是高度压缩后的天然气, 并不是可燃冰释放出来的一个大气压的标准气态天然气。单论燃烧,可燃冰里含有一定比例的水,还比不过当前汽车用的高压天然气(大约200个大气压,按照高中物理, 体积压缩了200倍)。记者闹出这种大笑话,还被权威媒体报道,负面影响不小。

为什么记者会犯这种错误, 假设他不是故意的, 那就应当是缺少常识,不知道天然气汽车用的是高压天然气, 跟可燃冰释放的天然气压力不同,物理特性也不同。而当下正火的人工智能也有同样的问题, 缺乏这类常识。现在新闻有了所谓自动采编,意思是不需要记者了, 靠人工智能就能自动写报道。 可能搞点简讯还行,一旦需要加工素材,就危险了。因为就常识来说, 人工智能还拼不过文科生记者。

当前人工智能缺乏常识这个问题反过来思考,做人工智能研究的人就应用研究怎么做出常识。  用上面可燃冰这个例子可以看出, 常识不是简单的百科全书一样的字典解释, 需要有深层次的结构和连接。 一个概念比如天然气, 除了知道它字面上是一种可燃气体之外,还需要知道它有一个属性是压力, 这个压力在物理里面有理想气体定律,跟体积直接关联。概念和概念之间连接起来, 形成一个概念网络。这看上去就是我们想要的常识或者是知识。

在计算机领域, 因为互联网的出现, 我们有了前所未有的海量数字化信息。 这些信息都是以超链接方式存在的文本。 当年google的两个创始人意识到海量信息通过这种链接关系构成了一个大的网络,每个网页就是这个网络中的节点, 每个节点因为链接关系在网络中的位置不同,体现出来的重要性也不同。于是他们构建出了一种算法来计算这个重要性, 就搞出了搜索引擎,和直到今天google这样一个庞大的公司。

几乎在google创始人思考网页构成网络结构的同时, 另外一大波学者认为互联网上的文本虽然有链接, 每个网页本身还是太杂乱。如果我们能进一步提取出其中的语义,按照某种方式表示出来。 那么最古老的人工智能方法(语义逻辑推导)都可以拿来应用,那么整个互联网就可以变成智能网。 海量信息就借此变成知识, 杂乱无章的文本世界从此就整洁有序了。这是多么完美的未来图景。 于是大家一起合作, 试图定义智能网络的标准。

首先有了xml,把平铺的文本变成一个严格的树形结构。 树形结构因为表示和计算的效率高, 是用计算机的各种算法最爱的东西。xml对树形结构的每个节点都打上了标签。 这样这些文本就有名字了。到此为止可以说小有成功。下一步就是定义这些标签之间的关系, 所谓标签, 是描述数据的数据,元数据。 于是引入了RDF用来处理元数据。

有了RDF,我们可以建立概念之间的关系,形成所谓的知识。 这里还要引入一个名词ontology 本体论。 熟悉哲学概念的人知道这是一个古老的词, 用来指哲学的出发点, 世界是什么。  在计算机学科中的ontology, 主要包括概念的定义和连接概念的关系定义。概念通过不同的链接关系构成一张图,就是知识图谱。 借助这张图, 我们就可以来推理。 具体来说知识被表示为一个三元组。 从一个概念到另外一个概念,中间是他们的链接关系。 比如中国的首都是北京这个知识, 可以被表述为(中国,首都, 北京)这样一个三元组, 中国, 北京是两个概念实体, 首都是连接它们二者之间的关系。

粗看起来人类知识似乎无穷无尽, 这样用三元组表示能行吗? 其实语言的词汇是有限的, 一种语言常用的名词就是几万个。表示关系的词汇也就小一万, 就算全组合起来, 不过是万亿这个级别。 对现代计算机来说,能处理的过来(实际因为有效组合有限,还小于这个量级)。然而与xml得到广泛应用不同, 知识图谱搭建了10多年, 仍然没有看到结果。 那一定是哪里出问题了。

问题在哪里? 与哲学上的ontology本体论不同,哲学是吃饱了饭就可以一直思辨的,而计算机是拿来挣钱买饭的。RDF所以没有用起来,是因为没有实用价值。 而这其中的关键原因就是没法很好的结合现实世界。 从复杂混乱的现实世界中不能自动化抽取出这么干净纯粹的概念和确定的关系。 有人说是因为语言描述的概念对应于现实本身就是模糊的, 要引入这种模糊, 于是就有了模糊逻辑。 还有人说不是模糊是概率, 概念也好, 关系也好都是不确定的。

上一篇讲量子的文章就提到什么事情一旦有了概率,就麻烦大了。概率的不同的解释会导致不同的路径,大家的分歧就纷纷出炉。但是这一步必须要走, 不引入不确定关系, 知识图谱的完美世界对应不了不完美的现实,就没有太多实用价值。

是模糊也罢,概率也罢。 假设穿越到了未来, 我们有了新一代的知识图谱, 也就是能真正表示现实世界的所谓常识。人工智能就可以利用知识来取代更多的人工。 比如说真正的聊天对话机器人, 比如说真正懂你的个人智能助理, 等等。 可能有人问, 这些东西现在不是就有吗?是有的, 然而现在市面上所有的聊天机器人和智能助理,不管是他, 是她, 还是它, 其实都只是它。 不是动物它, 是机器它, 没有常识, 没有感情。 而没有这两样, 可能火在一时, 难以自持。

最近有个段子:

教授,我很害怕!

怎么了?

我确认我研究出了一个能通过人类智能测试的人工智能。

那不是挺好么?

然而它没有通过测试。

不用害怕,该来的一定会来,期待这一天早点到来。 就算没来, 非要搞搞聊天机器人啥的, 我们不是还有那么多没有事做的人吗?

 

什么是量子?什么是量子计算机?

上周有个刷屏的新闻,中国科学家建成世界首台光量子计算机。一时之间群情振奋,各种解读都欢呼雀跃,终于扬眉吐气啦。有人说,量子计算机的时代就要到来,马上就可以取代传统计算机,计算能力大大突破,真是这样么?从量子这个概念提出开始,就有太多的争论和误解。本文试图介绍一下量子有关的基本概念,希望能够帮助读者理解。当然一孔之见,有错漏请批评指正。

文章篇幅所限,跳过量子力学相关理论的创立,另一个恢宏的故事。直接从早期爱因斯坦和波尔的争论说起, 也就是爱因斯坦当年的名言“上帝不扔骰子”。有关这一段历史,各种书籍文章成千上万,然而一说起来还是很多人不明白爱因斯坦的意思。说明这个事情本身并不简单。其实理解的难度不在背后有多复杂的理论和数学公式,而是基本概念本身。就象相对论曾经被各种误解,直到今天还是民科发表文章的神器之一。量子力学相关的理论甚至被误解更多。

爱因斯坦和波尔到底争论的是什么?所谓上帝不扔骰子是什么意思?其实其核心来源于对微观世界不确定性的解释。 我们在高中就学过了物理有个测不准关系, 无法同时精确测量微观粒子位置和能量。还学过德布罗伊的物质波,基本粒子都有波粒二象性。量子力学里有美妙的薛定谔方程,把微观粒子的特性的统一为方程的解,一个波函数。这样就在微观世界中引入了不确定性,或者说概率。

而按照传统物理学的研究思路, 一但有某种不确定性,看上去随机的一些东西, 那是因为我们还没有真正理解这件事情背后的机制。这种随机性肯定来源于一些隐藏的物理实体或者机制。一旦我们发现这种背后的实体或者机制,之前的所谓随机就可以迎刃而解,变的可以用理论来进行确定性的描述和预测。这就是爱因斯坦当年的意思。爱因斯坦不同意量子力学的概率解释。尤其是所谓量子纠缠,为此他在1935年发表文章提出了著名的EPR佯谬。然而到了今天, 我们可以明确的说, 爱因斯坦的质疑并不成立。

看上去波尔似乎赢了这一局。 并没有什么没发现的隐含变量,粒子似乎就是用波函数描述的某种概率性质的存在。通过量子力学理论计算出来的结论被无数实验结果验证,极其准确。那为什么还有这么多争论和含糊?还是要归结到对不确定的理解上。

按照波函数的概率解释, 如果我们认为粒子是某种实体, 它会以概率来出现在不同的地方。假设我们人为的把粒子可能出现的区域分成两半,一半定义为0,一半定义为1,那么粒子即可能为0,又可能为1,它的存在是0和1的叠加。由此而引申下来就有著名的薛定谔的猫, 如果我们让这个粒子的0或者1控制一只猫的死活, 那这个猫就处在又死又生的叠加状态。这看上去无比的荒谬。

完整的薛定谔实验叙述是将一只活猫、一瓶毒药和一个放射性原子放入一个箱子。如果原子衰变,就会有榔头打碎瓶子,放出毒药,杀死猫。根据量子力学,原子有50%的概率在一小时内衰变。所以1个小时候,不打开箱子观察,猫处在50%生50%死的叠加态。一旦揭开盖子,量子态塌缩,才知道猫的死活。

先放过那只可怜的猫。回到基本粒子比如说电子上来。电子有个著名的双缝实验,让电子通过一个双缝,会在之后的靶面上形成干涉条纹,这说明确实有某种波,或者位置的不确定存在,奇妙的是,一旦研究人员试图在某一条缝上观察电子,比如放一个计数器,条纹就消失了,电子出现会出现在某个特定的位置上。按照波尔主导的哥本哈根学派说法,因为观察导致波函数塌缩了。

量子力学实际上有各种不同的解释。 爱因斯坦认为存在隐变量是一种,哥本哈根学派的无处不在的波函数一观察就塌缩是一种。还有一种休•埃弗莱特提出的所谓多世界理论:一个高维空间包含了各种低维可能的世界。在每一条时间线上都会分叉,猫活着和猫死了的世界同时存在。这个理论是科幻小说和电影最喜欢的东西。

此外还有一种出发点是统计理论的观点, 就是所谓概率是总体的统计行为,讨论单个粒子没有意义。并不存在“单一”事件的行为,我们观察到的只能是来源于统计的结果。

到这里,应当容易看出,所谓的解释,实际上是哲学。 隐变量的说法更像是唯物主义,一切都要基于客观的实体。哥本哈根学派有点唯心主义,看到了才算,如果更绝对一点,没看到的不关心,那就是主观唯心主义。 多世界的说法是和稀泥,有多个世界,你只能处在其中一个,双向选择,姑且算作是客观唯心主义吧。而完全是统计的观点是彻彻底底的实用主义,不争论。

科学和哲学到最后是分不开的。最新的一派理论, 是所谓的量贝理论, 来源于2001年美国学者卡尔顿•M•凯夫斯(Carlton M. Caves),克里斯托弗•A•富克斯(Christopher A. Fuchs)和英国学者鲁迪格•沙克(Ruediger Schack)三人的论文《作为贝叶斯概率的量子概率》(Quantum Probabilities as Bayesian Probabilities)。

在他们的最新解释里。我们用贝叶斯理论来看世界。 所谓的波函数是一种先验,通过观察过程,影响了波函数,导致了后验。 这个过程并没有什么塌缩。因为所谓先验的波函数也只是一种主观的想象和解释。 对于薛定谔的猫来说, 所谓猫又死又活的状态是观察者一种主观的信念,并不是猫的客观状态。之所以这样理解, 是没有更多的认识和线索。揭开盖子的时刻,也只是通过观察猫真正的死活来修正自己的信念而已。在贝叶斯理论里,概率都来源于信念(belief)。这样就没有什么塌缩的矛盾之处了。

对大多数物理学家来说, 接受贝叶斯的观点很困难,因为这样想可能过于主观了。有关量子的波函数是什么肯定还要继续吵下去。但是有了这些讨论,我们可以大概说说所谓的光量子计算机是什么了。

首先先说量子计算机是什么? 量子计算机并不是一种通过编写程序,可以做各种通用计算的图灵机。所谓的量子计算机, 是利用量子的这种叠加态来解决优化问题的计算装置。把量子叠加态的波函数理解为一种分布,比如说单个量子同时处在0,1,2,3四种状态, 而把两个量子在放在一起叠加,就可以代表4*4, 16种状态。 n个量子就有4的n次方个状态。如果n比较大,比如64, 这就是一个极大的数字。按照贝叶斯的观点,这是我们的初始信念,有4的n次方种可能。然后信念或者说状态就开始演化,可能越来越少,最后剩下一个最可能的就是所谓最优结果。这样我们就求解了一大类所谓组合优化问题。

就算是不能通用计算,能做这一大类优化问题也很了不起, 比如密码的破解,神经网络的学习也可以分解成优化问题。然而事情并不是那么简单, 想做量子计算,先要有量子。

做出一台量子计算机, 大概要这么几步, 要有量子, 可能用来计算的叫所谓量子比特,要控制量子波函数的演化,还要有量子门,这些东西现在已经有了。下一步是多个量子和量子门纠缠起来,还要稳定可控这一步就相当难了,大部分目前的研究还都在这一步。第三步就是要保证计算过程不出错,就是所谓量子纠错。量子计算机总能给你一个结果,但是这个结果是不是你想要的,并不那么容易验证。最简单的办法就是再做一次,看结果是不是一样,要达到这一点,要保证计算过程不出问题,出现了偏差要纠正回来。直到今天,理论问题都还没有解决, 我们还不知道如何做出这样的量子计算装置。

那有人要问,google不是做了D-wave量子计算机吗, 据说是49个量子位可以做计算。其实google也同样没有解决纠错问题, google只是设想即使这样,面对组合优化问题,我们也还能得到不错的结果,不是最优解,可能是次优解,而且这样的解可能比目前传统计算机给出的结果更好。

而媒体所谓世界首台光量子计算机。只是在上述过程的第一步到第二步之间,一个能让10个量子纠缠的实验装置。更确切的说,甚至不是光量子,而是所谓超导比特。google搞的那个也是。

如果不看媒体的吹嘘,这个所谓的光量子计算机还是很牛的,探讨通过一些机制如何更好的保持和控制量子纠缠。原文在 ht tp://www.nature.com/nphoton/journal/vaop/ncurrent/full/nphoton.2017.63.html. 文中对比之前的方法,性能提升了很多。可以算作一个科学研究的突破进展。

媒体动不动就要搞个大新闻,宣传一个科技进步有多么多么牛,吊起公众的胃口,马上大家就能进入未来世界,以此来吸引眼球。可能今年,我们还能看到google又搞出了不起的量子计算机的媒体报道(按计划今年要发布)。

然而事实是:没个几十年的努力研究探索,看不到能用的量子计算机。而一旦炒作的热度过去,媒体又会翻脸如翻书,让搞研究的人背锅,斥之为“一群骗子”。vr里的明星公司magicleap已经有此遭遇。在当下最火的人工智能领域,目测一大拨搞自动驾驶的,机器人的骗子正在涌来。

撇去表面浮华,请多一点耐心。路漫漫,其修远兮。

 

 

 

 

 

 

 

 

 

武术还是舞术?功夫的沿革

最近有一场所谓武林大战刷了屏。按照媒体的报道, 是某格斗专家打假,挑战冒充大师的太极掌门人,结果出人意料几秒钟掌门人就被ko。这一段对打视频在网上广泛流传,也许能成为小视频创业的助推剂。

本来只是一场热闹, 闹着闹着就变了味。有说是纯粹炒作的,有说不是打假是假打的,有说有各种黑幕的。事发快一周热度还未消退,在眼球稀缺的今天,也算是极其成功的营销了吧。借这个事情, 一大波人跳出来揭批武术,甚至上升到全面否定,说到最后就变成了你国不行。实在看不下去,就在这里掰扯两句吧。

中华武术,源远流长,是中国传统文化中一颗璀璨的明珠。这是官方提及武术的标准套路。因此不管你认不认, 武术是代表文化的。作为传统文化的一颗明珠,否定武术,当然可以借机否定传统文化,同时大力宣扬西方搏击,就可以达到一石二鸟的目的。这不是扣大帽子, 事情就是这么演变的。

但是武术真假,到底能不能打, 终究还是得打一打。人家打过了, 说你不行, 这个锅要不背,就得打回去,光扯嘴皮子没用。这个要等业内人士去打过了才有说服力。就不继续掰扯了。文字的作用是澄清概念,本文只讲武术是怎么流传至今的,帮助理解武术内涵,也有助于看穿表面的混乱。

武术起源于狩猎, 随后在战争中得到了发展。 狩猎作为获取食物的主要方式,原始人不能打就要饿死。虽然有各种辅助工具比如石头,木棒,特别是后期还发明了投枪弓箭这类高级货,原始人打猎随时都可能得肉搏。这里推荐一本美国小说, 洞熊家族,就是写三万年前原始人的日常生活的。作者对已有的资料做了很认真的考证和研究,所以小说写的很接地气。从书中描述看来, 只用石头和木棒打架,类似现在街头小混混斗殴还在用的方式,原始人习得了很高的技能。现代人一定打不过原始人。现代人虽然营养更好,但是缺乏生死之间的搏杀体验。

历史上智人通过狩猎消灭了原本主宰大地的各种大型动物。从剑齿虎到长毛象都被赶尽杀了。打完动物,就要自己打自己了。从部落和部落之间的争斗开始到国与国的大战, 人类打来打去也已经数万年。后来的武术发展,大部分时间都围绕着军事和战争。

从中国的文字历史上看,春秋时代,武术叫技击。春秋早期打仗靠贵族坐着战车对冲。所以当时的教育里,君子六艺有两艺,射和御是用来打的。射就是射箭,御就是驾车。射箭就有养由基这样的名人,放在今天可能也是奥运冠军水平。

那会儿的贵族高高在上,讲礼仪秩序,两个人在地上肉搏撕扯这种没有面子的事情是不干的。然而有了礼仪秩序,就有不服之人。有天子守九鼎,就有问鼎轻重的。贵族老爷很快就被拉下车了。到了战国, 农民都得拉出来打仗。于是战国推崇勇士。

有几种人是典型代表。一种是所谓力士。 战国有很多大力士的故事。 比如史书记载,齐襄公图谋不轨宴请鲁桓公,先把鲁桓公灌醉,然后让大力士彭生抱桓公上车, 这一抱就把桓公给抱死了。还有一种是所谓刺客,刺客专门需要单兵对战的本事。战国时候有四大刺客,专诸,要离,聂政,荆轲,大概都得有些功夫在身上。还有被提到最多的就是剑士。比如庄子里就说吴王好剑,养了三千剑士没事就比剑。金庸的小说越女剑也有历史原型。

秦吞并六国,统一天下,收缴天下兵器,铸成12铜人放在咸阳。是中国历史上明确记载第一次禁武。不知对武术发展有多大负面影响。三千剑士练剑的盛景应当是没有了。不过秦朝很短命。到了秦汉之交,又开始有大将登场了, 西楚霸王项羽据说是特别能打的,还有流传至今的霸王枪。。。先打住。随后的汉朝,中国的武功很盛。就看大大拓展了国家的边界,应当是有真本事的。从汉朝开始, 武术就叫武艺了。

汉朝到两晋再复归统一,紧接着是唐朝,人民都一直很能打。也出了无数传说中的高手,比如中学课本里那个除三害的周处,实有其人,这里就不一一列举了。说唐演义里还有个武功排名,李元霸之类传说中的人物,让大家从小津津乐道。抛开传说吹牛皮,唐朝的李靖是非常能打的。李靖的武学本事被他打仗的光芒遮盖了,大家都说李卫公带兵第一,只有只言片语提到武功,可能注意的人不多。对了,我并不是看了大唐双龙传才这么说。

唐朝之后的宋朝, 打仗一直不如北方。似乎给人武功很弱的样子。事实上宋朝弱的是军事体制。单轮武艺并不弱。偶尔突破一下体制,比如岳家军,就打的北方人嗷嗷叫。宋朝民间有专门的武术团体,各种社,动不动就打个擂台啥的。而且开了真正的武举(唐朝武举是面向贵族子弟的形式主义),因此习武之风很盛。有关武术理论的书,武经总要,武经七书等都成于宋朝。甚至还有太祖长拳流传至今。有一种说法,宋朝拳术等武艺大发展,除了民间爱习武,还因为没有马骑。练不了传统的骑马射箭,就只好琢磨近身功夫了。

宋朝之后的元朝是中国文化的一次灾难。作为异族统治者,元朝收缴汉人的兵器,民间也禁止习武。元朝虽然不太长, 但是大大打断了正向的历史进程。虽然明朝时期有所恢复,汉人武功却再也没有恢复到唐宋的盛景。明朝武功开始讲师承,流传至今的武林各个门派大体都是在明朝成型的。然而满清入关,当时的异族统治中原,又一次禁武。各种武术门派转入地下,变成了秘密组织。

前文说过,武术是来源于军事技能, 在元之前,不管是汉晋,还是唐宋, 最牛的武术家,都是军中的大将。而因为元朝,清朝两次打断,武术渐渐变成民间武术家主导。当然,另外也是因为火器的影响越来越大。从明朝开始军队就玩起了枪炮,琢磨拳脚功夫的越来越少。一代名将戚继光可能是军事武术的最后一点回光返照。

脱开军事, 武术的强身健体功效开始占越来越大的比例。其实早在战国,武术就有一个分支是用来表演的,有剑舞,刀舞,钺舞等等。 汉代还有专为强身健体模仿动物发明的六禽戏,五禽戏,马舞等等。这样的武术,可以称之为舞术。和用来打仗的技术是完全不同的两种东西。

武术和军事分家之后,民间还有争强好胜的,有所谓擂台赌斗一直在继续。一直发展到今天的竞技体育。这样的比试通常只为取胜,并不以最高效率的杀人为目的。因此也有人说中国传统武术不如人是受到了限制。这里不赞同这种论调。因为自明清开始,武术尤其是拳脚就不再用于军事了。有几百年功夫研究足够转变,不能找这种烂借口。

满清中后期禁武开始松动,各大门派可以松口气从地下转入地面活动了。不幸的是又碰上了千年未有之变局,来了一伙西方强盗用坚船利炮敲开了中国的大门。战场上屡屡打不过人家,从上到下都很迷茫,甚至玩了一出义和拳。

直到民国时期,按照当时的媒体报道,一个俄国大力士在各种地方被各种门派打败了九次。而且这个所谓大力士实际上是个江湖骗子。这就不能不说是荒谬了。战场上的输掉的自信,只能在战场上找回来, 打败一万个大力士也没用。 打仗拼的是组织和纪律,并不是个人武勇。积弱的宋军在岳飞的带领下就能完胜北方,也不是因为在神秘山谷中挖出了武林秘籍。

回到现代竞技体育,比如说开头提到的那个擂台赛。中国武术就真的不行了吗?这也未必。之前我们曾经提到过武术的三种境界,技,术,道,分开点评如下:

在技的层面, 拼的主要是力量,速度和所谓技巧。力量,速度来源于肌肉的练习,需要长期锻炼。 其实按照现代科技,肌肉锻炼配合刺激肌肉生长的激素更有效率。这些激素因为导致了严重的不公平,和据说对人身体的伤害,公开层面都被禁了。在私下可能是不用不行。 技巧的运用仍然是练习,需要熟悉人体的结构,关键节点,运动的方式和角度,借此研究下手最有效率的角度和套路。这些东西,西方科学领先,传统武术应当借鉴吸收西方。

在术的层面,也就是方法论,中国传统比较重视意志的养成和所谓心的修习。在练力的同时要养性。西方搏击更讲以力制胜。路径不同,各有千秋,谁厉害就看谁理解的更到位,下的功夫更多,掌握的更好。术要有技的依托,光谈术就成了打嘴仗了,必须注重这一点。

术拔高一层是道,东方的道比西方的要更曲折些。因为讲阴阳,讲循环,构成了复杂,也带来更多理解上的困难。道本身没有高下之分,只是个人选择。

文章的结尾还是回到文化上来。武术这个武字,发音是借用了舞,而字面意义是止戈。所以武的形式包含了舞,武的目的是为了阻止争斗。中国文化包容吸收,一直是开放的态度,有好的就吸收,再拔高利用,拳术,柔道,摔跤也一样应当能玩好。在冯骥才的小说神鞭里就讲过这个,能做好这一点 ,是比打赢九个俄国大力士更有意义的事情啊。