煎蛋科学第33期:机器学习 - 人工智能(一)

2019-05-20 13:14:01 4773
声音简介

第33期,2019年5月19日,机器学习 - 人工智能(一)


相信经常听我们煎蛋节目的朋友都会发现,蛋博士有时候会提到闪避,大招,大核这样的词汇,这些词汇都是来自于多人在线战术竞技游戏,英文叫做Multiplayer Online Battle Arena,或者简称MOBA,比较流行的有王者荣耀,虚荣,Dota,英雄联盟。前两个是手游,后两个是电脑上运行的。尽管蛋博士喜欢玩游戏,在虚荣和Dota上花的时间也不少,但是我们讲这些并不是鼓励大家玩游戏,而是想跟大家讨论一个现象,就是这类游戏都是有职业比赛的,而职业比赛的巅峰竟然无法和人工智能抗衡。2017年,美国DeepMind公司推出的阿尔法狗就战胜了世界著名围棋选手柯洁。同年,美国OpenAI推出的OpenAI Five就在Dota中单单挑比赛中战胜了NaVi战队的灵魂人物,世界著名中单选手Dendi。17年的OpenAI还是一个只能单挑的电脑,而今年4月,OpenAI Five就在5对5的正规Dota比赛中战胜了去年Dota世界锦标赛的冠军OG。有人说一般游戏队伍在世界锦标赛前都会保存实力并且不在大赛中使用自己擅长的英雄,避免世界锦标赛的时候被针对。关于OG是不是放水我们先不评论,但是在此前,OpenAI就已经赢过一些职业选手组成的队伍了,所以OpenAI的实力,肯定是有的。


无论是DeepMind还是OpenAI,都是花了很长的时间去训练他们的人工智能,这跟人类选手是一样的。没有人生下来就是围棋冠军或者Dota万分大神。人工智能,简单讲就是用人工的方法,让机器拥有智能。现在遇到朋友你不说自己做人工智能,真心不好意思跟人打招呼,不仅仅是游戏,无论是新材料开发,还是癌症药物开发,还是银行反欺诈系统,都离不开人工智能。所有智能实现的步骤其实都差不多,所以关于人工智能的研究主要也是集中在机器感知,机器学习,和机器行为这个方向。第一是输入,机器感知,这就像人一样,如果一个人看不见也摸不到,那脑子再好使也没用。给计算机配上摄像头和话筒,计算机也就有了视觉和听觉。第二是机器学习,这个步骤往往是大家经常讨论的,也是近几年来发展最快的,机器通过不断学习和训练自己,从一个小孩逐渐成长为一个领域的顶尖人物。第三当然就是输出,也就是机器行为,这个跟过程控制就息息相关了。机器手协调运作,机器狗在跳跃中保持平衡,这些过程都是需要智能控制的。其实图像处理和音频处理和机器学习关系很大,比较高级的图像处理和音频处理,特别是模式识别,也用到了不少机器学习中的技术。而现在比较主流的PID过程控制,也正在被深度学习和评价学习强化。所以机器学习,也是现在最火的词汇,几乎涵盖了当今人工智能领域进步最快的所有方向。


现在问题来了,为什么机器学习这么火呢?为什么以前没见它火呢?我们简单说说机器学习的历史。蛋博士认为最早的机器学习,应该追溯到线性回归。但是线性回归是谁发明的,勒让德和高斯,大家应该都知道,19世纪初还没有机器能干这事。所以我们从有机器开始讲,那就是埃尼亚克之后,也就是1946年以后。这里我们就不去讨论埃尼亚克到底是不是第一台电子计算机了,图灵的机器,还有阿塔纳索夫-贝瑞其实都比埃尼亚克早,但是埃尼亚克能编程啊。上世纪五六十年代,就开始陆续出现了一系列比较优秀的监督学习和无监督学习的算法,比如我们经常用到的KNN,逻辑回归,还有大名鼎鼎的罗森布拉特开发的感知器算法。感知器,英文叫做perceptron,on结尾的单词,都有一个基本单元的意思在里面,像neuron,神经元,proton,质子,eletron,电子。设计感知器,就是为了模拟神经元的行为,也为后来开发的深度神经网络奠定了基础。正是这些优秀的算法,引领了人工智能的第一次兴起。七十年代,人工智能的发展就停滞了,这是因为在电子计算机诞生的早期,有限的运算速度制约了人工智能的发展,并且当时也没有足够的数据给机器学习。这就像人一样,人要读书和受教育,才能进行高级的生产和科研活动,计算机也得读书。计算机的书就是数据,计算机的大脑也要经过不断成长的过程。八九十年代,人工智能的第二波兴起,当时的计算能力有了大幅度提升,也涌现出了一些优秀的算法,比如马尔可夫随机场和卷积神经网络等等。虽然有了运算能力和好的算法,但是没有足够的书读,没有好老师教,人工智能的成绩自然也没有特别突出。直到21世纪初,生物医疗领域产生了大量的数据,特别是DNA和RNA的测序数据,运算能力也在继续突飞猛进的发展,出现了GPU和TPU这样的非常利于机器学习的处理器。很多听友们经常听说GPU,但是可能不知道GPU到底和我们个人电脑使用的CPU到底有什么区别。简单说,GPU核多,缓存小,每个核只进行简单的数学计算,CPU核少,缓存大,每个核都能进行复杂的逻辑运算。好像也不简单,那我们来总结一下,这样的差别给GPU带来了什么优势呢?数据并行的优势。我们个人电脑处理器,依然使用的是CPU,因为个人电脑需要安装操作系统,需要各种复杂功能,CPU也非常善于任务并行,比如蛋博士一边给大家做煎蛋科学的视频,一边跑着一些分子模拟程序。但是CPU的核心数量,也不过几十个,GPU一般都有好几千个核心,可以进行大规模的数据并行,对于大规模的数据处理和机器学习都很擅长。从这时候起,人工智能终于集齐了发展的三大重要条件,数据,运算能力和算法,于是就起飞了。


机器学习和过程优化实际上是密不可分的,举个比较简单的机器学习例子,就是线性回归和逻辑回归。比如我们有一些病人的测量数据,血压,血脂,体温,和视力。我们就可以建立一个线性回归的统计模型,通过病人的血压血脂和体温来预测该病人的视力,比如beta1 * 血压 + beta2 * 血脂 + beta3 * 体温 = 视力。你可能觉得这三个指标和视力关系不大吧。但是有时候新的知识就是通过这种方式发现的,比如我们之前讲过的,PM2.5暴露量就能够很好的预测心血管疾病致死率。在我们有纳米科技和氧化逆境的知识以前,我们是无法想象空气中的尘埃能够和心血管疾病的致死率关联上。我们这一期主要还是讲讲人工智能的概述,我们没有办法在第一期就跟大家讲明白阿尔法狗是如何设计的,因为先得讲神经网络,不过我们一定会在这个系列中跟大家讲到这些有趣的细节。人工智能这个话题,我们随便讲讲就能讲20期,所以如果大家有什么想听的细节或者方向,欢迎留言。今天我们的节目就到这里,感谢大家收听,我们下期再见!



用户评论

表情0/300

160160034

难得当今社会有这样的科学严谨的主播

SimpleScience 回复 @160160034

谢谢支持,建议1.25倍速播,前期怕录制出错,所以语速比较慢

Spark618

不完整

Mr勇仔

支持你,讲得越来越自然了

SimpleScience 回复 @Mr勇仔

谢谢支持!

猜你喜欢
煎蛋科学 | 实用的科学前沿

内容简介:《煎蛋科学》用最简单的语言介绍最实用最硬核的科学知识和科研前沿成果。与其他类似节目不同的是,我们的团队成员都是理工医学博士,我们的节目介绍的知识和论点...

by:SimpleScience

孕期科学养护

怀孕是一个女人在一生中最为重要的几个过程之一。在孕期,准妈妈会经历孕吐、心态调整等环节。此外,妈妈最为关心的莫过于腹中的宝宝如何能够健康成长,因此我们开设了“孕...

by:孕产宝妈商学院

科学留声机

《科学留声机》是一档由光明网科普事业部制作发行的科学文化音频节目,节目通过留存科学家珍贵采访原声的方式,记录我国科研工作者在工作道路上矢志不渝的爱国情怀,艰苦探...

by:科学留声机

剑桥科学史 第三卷(现代早期科学)

这一卷大体覆盖从1490年至1730年的时期,被英语世界的欧洲历史学家们称为“现代早期”,一个预示着事物即将来临的术语。

by:1660423nrjh

某不科学的机械师

一个二次元军宅扑街带着系统穿越到高达00中,成为天人光荣的机械师,到底是人性的沦丧还是道德的扭曲,下面我们连线人革联ms驾驶员为我们提供现场报道:谁特娘的告诉老...

by:宋江看上了黛玉

孕期产后的科学保健方法

怀孕到生产,孕妇的注意事项,及一些科学有效的医学保健知识,产后康复注意事项和康复要点。

by:何云静

宝妈孕期营养&宝宝科学喂养

生命早期1000天营养攻略、科学应对孩子挑食偏食、催奶秘方、宝宝过敏、生病宝宝应该怎么吃?如何让宝宝爱上吃饭?孩子如何增高?儿童医院权威营养专家临床经验丰富,为...

by:江苏声入人心文化

危情总裁:天价前妻不好惹|全本免费丨茵蔚&煎蛋饼饼双播

【内容简介】靠她的设计图扬名天下的未婚夫婚前出轨,而小三竟然是她的闺蜜!撕破脸后还恶毒的给她下药,庄晓晓可以说是倒了八辈子的霉了。可没想到,一夜过后,那个被她睡...

by:茵蔚有声

计算机科学速成课

CrashCourse的计算机速成课,是一门很好的关于电子和计算机的入门课,该课程有以下特点:1.每节课的课时很短,一般为10~12分钟,比较易于接受,而且...

by:simonwoodsheep