大数据时代与中国人的机会
核心提示:人类所有的知识、经验和科研成果,都是以碎片化形态存在的大数据。在四维时空结构的指导下,这些东西犹如大自然赋予我们的矿藏,可以按照一定逻辑,从中找出某些隐藏着的脉络及规律。还可以逐级提炼、组装,或者像搭积木那样创造性排列组合,进而产生明显的加速效应。物质世界存在着进化链和创造链,大数据挖潜同样如此。
中国人的思维在某种程度上,具有较强的整体性和综合性,这种特征的思维往往会滑向大而化之的境地。在各细分领域数据已经呈现“大数据特征”的前提下,这种思维也绝非一无是处,是比较适合用来做数据挖潜的。自文艺复兴运动以来,西方更多走的是“细分差异化”的路子,并以此为基础不断跑马圈地、开拓创新。他们整体上的受教育程度和科学素养都比较高,五六百年来在具体问题上面的突破都异常惊人。
如果你将前人所思考过的一些细节,所取得的突破,汇集成一个“大数据”的话,你会发现绝大多数具体内容,前人都已经说得十分到位了,你根本不太可能超越什么了。他们只是谈的不太系统,只是在这些东西的排列组合之上可能做得还不是太好而已。实际上这种现象在西方*近几百年来所积累的“数据库”中表现得更为明显。我们谈到的这种现象,貌似不好理解、不可思议,如果仔细分析,实际上还是非常现实的。
*,某些案例、事情、道理和感悟的发生,虽然都存在着比较苛刻的前提,但毕竟是概率性事件,只是其概率到底有多大而已。我们已知的概率区间,是大于等于零、小于等于一的。现实中的概率,基本也呈现出一种正态分布的特征。很多我们通常认为不可能的事情,仅仅是概率超低而已。低到了千分之一、万分之一、亿分之一甚至是十亿分之一的程度。
*二,自从人类告别洪荒时代开始,我们这颗蓝色星球上所存在过的个体意义上的人,都是数以百亿计的。这个数量已经构成了天文级的数量基数,只要不是受整个时代科技水平限制而为彻彻底底不可能的事情,即使某个事情的发生概率为十亿分之一,在历史上或现实中都一定会有人遇到过,甚至利用某种特殊的形式记录了下来。我自己梦过很多稀奇古怪的梦,后来证明相当多的人都梦到过。这都没什么奇怪的,概率和基数使然。
*三,*近几百年来,西方人整体上的教育普及和文化素养程度都比较高。他们做事情更多以“细分差异化”为导向,还都习惯于记录。他们在有记录可考的具体细节方面的突破,其数量和质量都是异常惊人的。这在英文数据库检索当中可见一斑。如果用谷歌来搜索有关英文内容,你的这种感觉将会更加强烈。
*四,在“大数据”和“云计算”时代,如何将这些近乎完美的“零部件”找出来,按照一定的逻辑和原理搭积木,创造出更加具有传奇色彩、更加富有颠覆效果的东西,就显得极其关键了。
*五,按照西方那些优质且基数庞大的人力资源状况以及传统的“细分差异化”创造与创新理念,再加上信息化的驱使,只需要十多年时间,一个细致入微、功能强大和配套齐全的“零部件库”“总成库”同样能够基本成型。维基百科、IT及人工智能的现状,就很好地说明了这一点。
(咨询特价)年以来,我们中国人在相当多的领域也确实发生了很大改观,但整体上所呈现出来的不足还是显而易见的。时至今日,我们在科研创新领域的成就依然不算太理想。这种特征的民族思维所导致的一个结果,就是以中文为基础的“数据库”,无论在数量还是在质量上,都不理想。同以英文为基础的主流数据库相比,只能望其项背,依旧不能同日而语。甚至同日文数据库相比,也还是要差一些。
*近十五六年时间,我们确实是与全球同步进入信息化时代的。而且数据库无论在“质”上还是“量”上,与以往相比都取得了突飞猛进的发展。并且到目前为止仍处于加速发展过程当中。然而非常令人奇怪的是,尽管西方这段时期内,在社科、管理、教育和创新等方面都取得了非常重大的突破,你通过英文数据库也可以发现大量这些方面的东西,但如果利用中文进行检索,绝大多数内容却根本看不到。即使偶尔有一点,也是一两句话的介绍,延伸不出什么更多的背景性东西。
按照统计学原理进行推算,我们基本可以认定,整个“中文圈”实际上对西方*近10多年来各个领域所取得的进铂近乎一种无知和漠视的状态。每每想到这些事情,我就不寒而栗。我们不但在数据库的存量,而且在数据库的增量上,跟欧美相比,相差都很远,而且差距还在不知不觉中进一步拉大。尽管我们在个别领域还是有特色和优势的,但这根本弥补不了整体上的弱势,避免不了差距的进一步扩大。
时代发展到今天,无论是谁积累和沉淀的东西,大数据和云计算都输越来越成为全人类共同的资源,很多时候都难以分清你我。欧美人发震来的体系及其对应数据库,也并非他们所独享。对于每个有进取心的个体和群体来说都是开放的,差别只在于你如何对待和利用这些东西。20世纪90年代以来,中国高等教育进入了快速普及化时代,尽管中国教学质量和教育体制一直为人们所诟病,引发的争议不断,但无论怎么讲,高等教育的普及都是好事情。虽然我们的创造能力整体上不尽如人意,但在各个领域的基本理论框架和基本实践基础方面,以及国人整体上的英文能力,还是能够达到及格水平。这就意味着将某些西方的东西拿过来,大致上还是能够看懂,能够琢磨明白的。
你别小看这个基础,这是非常关键、非常重要的一环。这意味着华人圈中的相当一部分人士,只要改变一下思路,就可以很好去利用透明和开放程度相当高的英文数据库。在知识整合、数据挖潜和总成制造等方面跑马圈地、高歌猛进。毕竟欧美人士已经在“细分差异化”惯性思维的指导下,制造好太多的优质数据、素材、案例、零部件和总成了。我们并不需要在每一个具体的细节上都重头来过,只需要按照一定的“结构”和“框架”,大力发扬“拿来主义”精神,将其圈过来即可。只是在个别仍需要强化的地番再进一些适当的补充和深化。
我有位朋友,国内某*高校理工科毕业。在大型国企和同行的几家*跨国公司,都做过技术研发或服务工作,还在一家中等规模的民营企业当过CEO。现在40多岁,自己创业独立运作项目。由于他在圈子里具有良好的理论和实践基础,并拥有20多年扎实的职业生涯积累,因此对同行的大量的专利配方理解得较为透彻。
当然,光看一家的专利,你也根本掌握不了什么。但当他将好多家好多个配方放在一起进行比对、然后做拼图,并将结果通过实验验证之后,相当多的诀窍和优化替代方案,就会很清晰地浮现出来。到了*后,他*擅长的事情就是破译某些竞争对手的产品配番并推出性价比更高的替代性方案。在此过程中,他用的都诗开资源,做的是大数据挖潜,不涉及其他法律问题。
他*先通过自己的理论框架和知识储备,推导出一个可能的方案。然后通过谷歌用英文搜索相关的技术性资料甚至是专利配番并在此基础上进行确认和优化。个别不太明白的地方向圈内朋友咨询,或者给国际上相关原辅料、备品备件厂家的中国代理商打询问。利用这么一个流程,绝大多数问题都可以得到完美解决。他一个人设计配方、委托生产和进行销售,每年轻轻松松赚取500多万的纯利润。当然这种替代性配番也不可能保守得太久,利润也会逐渐下降,但总归有2-3年的周期。两三年之后再设计一个全新的替代性配方就可以了,反正他对这个在行。
据这位朋友介绍,实际上国内已经有一些技术专家在这么操作了。欧美人擅长的是细分差异化研究,在传统行业的太多领域和问题点上,已经研究得足够细致了。物极必反,太注重差异化细分的结果,就往往会在不知不觉中忽视整体、系统和综合。相对而言,中国人思维在后者之上还是具有一定优势的。这位老兄*快的一次,在招标过程中仅仅花了两个小时,谷歌了一圈,打了几个,就把主要竞争对手的配方给彻底破译了。实际上,他是在技术领域获得丰富资源积累、理论和实践融会贯通的情况下,利用中西方思维的高度融合,找到了西方某些东西的命门,并很好地把握了商机。
当我认识他的时候,这位朋友自发应用这种方法,已经有五六年的时间了。用现在时髦一点的概念来说,就是基于人机互动思维的“大数据挖潜”。只不过是他将这种数据挖潜方式应用在了非常具体的产品和替代性配方开发领域。这些年来他通过这种方法,不但破译和替代了不少国际品牌的专利配番还在全球范围内开创了某些产品前所未有的全新开发思路。比如固态和液态添加剂应用思路的相互借鉴和转换。
欧美人在思维上更偏重于差异化和细分,而不太擅长整体思维和综合思维,但这是相对而言的。在“大数据”时代,欧美人的思维也正在发生着巨大的变化。大数据和云计算时代,除了数据的积累之外,大家比拼的都是“数据挖潜”,整体、系统、拼图、整合及综合思维都有应用。在“大数据”的推动下,欧美人恶补上面提到过的这些思维,10~20年的时间就足够了。欧美人整体上的思维方尸本身就具有很大的性和适应性。其自身又具有很强的“求真”精神,一旦客观条件具备且实践环节也需要他们这么做,其调整是非常迅速的,速度之快往往会远远超过我们的预期。
换而言之,整体思维、系统思维和综合思维,根本不是我们中国人的专利。过去不是、现在不是、将来也不是。我们只是这些方面的思维特征相对更加明显一点而已。千万不要把幻觉当作真实。我们必须有一个清醒的认识,即使我们在这方面真的有那么一点点优势,在大数据时代,也是非常容易被迎头赶上甚至超越的。
大数据时代确实给中国人带来了千载难逢的时机,可以帮助我们在各个领域迅速缩短与西方的差距,并得以同步。但“大数据挖潜”是赋予全人类的礼物,并珐中国人独享。全世界人民机会是均等的,你不好好把握,别人照样还会尽*努力,去利用和开发这些资源,继续执创新潮流之牛耳。*后,让我们张开双臂为这个伟大的时代欢呼,以更加开放的心态,尽情吸收和创造人类*文明成果吧,不要辜负时代所赋予我们的机遇。
人机互动思维,直通智能化时代的主流思维
核心提示:整个宇宙都是沿着四维时空结构自组织、自进化的,这个过程还一直在延续。在信息化和智能化技术的支撑下,全人类正在快速进化为一个全新的体,“碳-硅”智能一体化的新物种呼之欲出。在新的体中,计算机和智能化技术,会成为重要的有机组成部分,而个体意义上的人,只相当于其中的细胞,人机互动思维成为全新思维方式。
进入21世纪以来,以互联网为代表的信息化技术得到了长足发展,网络社区、专栏博客、即时通讯、搜索引擎、维基百科、SNS社交应用、视频分享、文档分享、位置服务、卫星地图、问答服务、网络游戏、电子商务和公开课,等等,数以百计的应用如雨后春笋般涌现了出来,极大丰富了我们的工作和生活。智能、平板电脑,以及即将到来的智能电视、谷歌眼镜、智能汽车,更是将“触网”变成了随时随地都可以实现的事情。
同时由于物联网、人工智能、大数据、云计算和云端服务等技术的兴起,网络正在由一种信息化工具,转变成人类的一个特殊的“器官”。甚至有人为此而惊呼,人类在短短的二三十年时间内,“进化”成了“碳—硅”智能一体化的新物种。在这种背景下,人机互动思维,也将会成为这种新兴“物种”的主流思维模尸颠覆、包容和兼容以往其他思维发展方式和运行模尸成为思维进化史上的一个新的里程碑。
从人类思维发展历史来看,可以粗略分为“原始思维”“逻辑思维”“科学思维”和“人机互动思维”四个阶段。每个阶段都与不同的文明形态所对应的。“原始思维”更多对应的是前工商业时代。“逻辑思维”和“科学思维”大致对应的胜商业时代。而“人机互动思维”则基本上是与智能化时代所匹配的。“科学思维”本质上还是一种“逻辑思维”,是“逻辑思维”发展的*阶段。但他显得更为精细化,对事物的思考类似于“四维结构”的扫描和透视。在社会整体处于“原始思维”的发展阶段,创新活动更多来源于个体,创新主要是在模仿,带有很强的偶发性特征,凭的是经验和直觉。
在“逻辑思维”和“科学思维”居主导的社会,创新主要靠的是团队,且后者对团队和协作的要求比前者更强,创新建立在理论和逻辑推导基础之上,多化立体式创造的特征也越来越明显。在“人机互动思维”主导的社会中,由于人类大脑已经“去孤岛化”,且架构在互联网等信息化技术平台上,这个阶段上的创新属于开放式创新、大众创新阶段。对同一个问题感兴趣的数以万计的“大脑”被信息化技术有机连接在了一起,产生的是一个前所未有的“群新创新加速”效果。
在新兴信息化条件下,以谷歌为代表的整个互联网,可以虚拟整个人类的大脑,也可以虚拟我们每一个人的大脑。智能等便携式互联网接入终端,也使得越来越多人的大脑在“去孤岛化”,逐渐成为“碳—硅”有机集成体当中的一个件。人机互动思维,*直观的是人与互联网之间的互动。这里的“互联网”既可以是抽象和整体意义上的互联网,也可以是一个又一个非常具体的互联网应用。从*意义上来讲,人机互动思维,是个人与非特定的海量的大脑、个人与全人类大脑之间的互动。
互联网和人工智能在集成群体性或全人类大脑的同时,会产生“1 1>2”的协同效应。在人机互动模式下,人们可以根据自己的喜好,随时随地进行交流,而且整个过程可以是碎片化的,不是非集中安排不可。在“逻辑思维”和“科学思维”盛行的工业化大生产时代,由数百个人组成的有组织的“创新团队”,往往可以非常轻松打败数万个属于离散状态的散兵游勇。而在“人机互动思维”时代,大脑“去孤岛化”的数万人,可以用极低的成本,轻松打败传统企业数百人组成的“研发团队”。
《大英百科全书》曾被全球知识分子奉为*百科全书当中的翘楚。其质量之高、内容之丰富,举世公认。但它毕竟胜业大生产时代的产物,所组建的团队,动用的资源和专家数量,近乎华丽和*。*个版本的大英百科在1768年开始编撰,历时3年,于1771年完成共3册的内容。在240多年的漫长历史中,也产生了太多与《大英百科全书》相关的传说与美谈,这些东西甚至可以归纳为一类独特的文化现象。
然而就是这样一个在工业化时代接近传奇的东西,于2012年3月13日,宣布停止印刷纸质版,未来只提供电子版本的内容。耐人寻味的是,维基百科的命运与之形成了鲜明的对比。维基百科创建于2001年,到现在也就10多年的历史。与大英百科不同的是,维基百科“是一个动态的、可自由访问和编辑的全球知识体”。截至2013年1月,维基百科条目数*的英文维基百科,已有415万个条目,而全球所有282种语言的独立运作版本共突破2100万个条目,总登记用户也超越3200万人,其总编辑次数更是超越12亿次。
维基百科应用的是典型的“人机互动思维”。受众、编辑和专家的身份,基本上融为了一体。所有词条都处于动态完善过程中,总有数以万计的人同时在线、几乎不间断地将自己知识体系中*精华的内容奉献出来。可能他们绝大多数人并不专业,但协同和滚动完善之后产生的东西,其质量还是有所保障的。更为重要的是,运营平台的边际成本很低,相对于所产生的信息量及其品质而言,成本近乎微不足道。维基百科模式后来又被叫作“开放式创新”模尸其产生的效果也被称之为“群体创新加速”,给其他很多领域的创新带来了巨大启发。
*近一些年来,包括TED在内的国际*大学及相关机构的公开课,像潮水一样被引入中国。每个课程都对应着中文字幕,其推出速度之快,甚至会令你瞠目结舌。按照传统的*机构团队翻译模式的话,这些事情*起码也够多少年做了。但在人机互动思维以及群体协作模式下,无非是每人翻译三五分钟内容,甚至是三五句话的事儿。成千上万人在线协作,即便是一部长达几个小时的片子,整个中文字幕出来,也仅仅需要一两个小时。
至于人机互动思维模式下,所产生的“人肉搜索”魔力,更是令一些人谈虎色变、闻风丧胆。人机互动思维是现代科技高度发展的结晶,一个国家、民族、组织和个人的人机互动思维发育程度,将直接影响到他们的竞争力。从进化角度来看,人机互动思维可以兼容原始思维、逻辑思维和科学思维,但后面这三种思维并不能直接兼容人机互动思维。
作为一种信息化技术的产物,人机互动思维在未来的智能化时代将扮演着极为重要的角色,总体上来说,这种新兴思维具有如下几个方面的重要特征。
*,人机互动思维具有非常鲜明的多媒体特征。文字、语言、程序、图片、图形、图表、声音、光影、色彩和通感等手段,使得人机互动思维相对于其他思维模式而言更具有梦幻色彩。作为一种目前*为*的思维模尸人机互动思维涵盖了直觉、形象、逻辑和数理等传统门类,此外还可以可视化和视听一体化,甚至能够采用4D技术进行更为直观和生动的模拟。统计可视化、数据可视化、思维可视化,便是其中重要的表现形式。
*二,“碳—硅”联合所形成的数据库,是有史以来*为庞大的数据库,而且这个数据库还将一直处于快速膨胀状态之中。这个数据库大致上将人类有史以来的各种知识体系和相关信息都囊括了进去,具有较强的独特性、全球性、整体性、互联性、动态性和高效检索性。其功能远远超越了原来孤岛化、碎片化和局域网化状态下的个人和组织所拥有的数据库,大大降低了人们阅读、记忆和检索的压力。
*三,具有关联信息瞬息抓取、聚合、激活、整合、运算和反应的多种功能,人脑可以在此基础上灵光一闪,得到更有价值的东西。在此过程中应用到了大数据、云计算及数据挖潜等大量新兴技术,像“天河二号”这样千万亿次计算机,对于人机互动思维潜力的充分挖掘,可以提供强大的硬件支持能力。
*四,人机互动思维模式下,实际上已经产生了一种“去中心化”的效果。每一个应用者,在扮演策划者和组织者的同时,在“碳—硅”联合体的整张巨网中,更多只是一个信息“节点”,人们既是信息接收者,同时又是加工者和传播者。
*五,人机互动思维,又可以细分为“人人互动”“人机互动”和“以机为媒的人人互动”等不同侧面。而且互动的方式与对象是可以多化的,既可以是特定的又可以是不特定的。这种互动甚至可以超越时空局限,利用你的碎片时间“随时随地”与他人/网络进行互动。即使你暂时懒于思考,只要通过特定方式持续不断“产生和储存数据”即可。在更多时候,素材和资料的价值在于“储备”,“生成——储备——整理——互动——挖潜”,便是其进一步延伸出来的一条方法链。而这条方法链,实际上更加适合于人机互动思维。
如果非要形象描述人机互动思维的话,我们大致可以将整个物联网及互联网世界,看成是一款快速升级换代中的网络游戏,我们数以万计的个体,通过这款“游戏”,超越时空界限链接在了一起。人机互动思维是一个极富性和博大精深的体系。目前只能简单去描述一些特征,介绍其中隐藏的一些理念。而更多的东西需要我们不断去摸索、领悟和总结。
人机互动思维在实践中的应用,可以根据自身基础条件,形成若干变形,转化成适合自己使用的某些方式。我介绍几个自己常用的、比较原始的“又土又笨”的方法。
其一,尽量让自己的“意识流”“生活流”产生数据,并原生态记录下来。打造一个非常独特的“数据库”“素材库”和“资料库”。譬如网上聊天内容随着“意识流”走,不设主题,稍微有价值的内容,按照不同主题形成相应片段,随手简单整理入库。
其二,交流、学习、记录、写作和研究努力融为一体,变成同一件事情。沿着某个专题及相应的关键词链检索和组织相关内容。动用自己独特的数据库、互联网大数据、自有思维模式体系,以及互动对象大脑数据库。然后在对这些数据进行结构性挖潜。
其三,尽力使自己的生活结构化,给各类生活预留一定时间。避免单一化,通过多化的生活,通过关注不同领域的东西,输相互激荡产生加速效应,持续不断获得高品质的源头活水。尽管研究和写作每天都在进行,但在任务分解的基础上,设定上下限,每天完成即可,不追求太快的进度。
其四,师法自然,不追着理论体系和大师兜圈圈。压缩知识和信息体系所产生的“生态冗余”,合并“同类项”。使得知识、信息和方法论体系建构更*。祭起“加减乘除”大法,专题和类别上“做加法”,通过剔除知识和数据冗余来“做减法”,以知识、模型和方法论在更多领域迁移应用“做乘法”,用“做除法”来消除思维体系中似是而非的东西。
其五,打造“思维链”体系,尽量去避免简单重复性劳动,尽可能把握某些事物的规律、原理和模型等方面的东西。突破时效性局限,有意识构筑积累和沉淀的纵深。为瞬息灵感的质量和数量作准备,以达到厚积薄发的效果。
其六,以有“缘”遇到的身边万物为素材,尽量用“四维”思维结构进行透视和扫描。在训练自己思维和分析能力的同时,将素材和分析结果“入库”,作为相关“储备”,以便在合适的时候使用。与此同时,以滚动的方尸将自己某些方面的理解和想法,贴在一些论坛上,借助别人的补充和评价,激发新的超文本链接,以此来扫除自己的思维盲区,并使整个体系在后续滚动中不断得到完善。