5月20日谷歌DeepMind的巨大突破,会干600多种活儿,通用AI的时代来了吗?

2023-06-12 06:03:4604:46 4787
声音简介

【王煜全 要闻评论】粉丝群已经开通

欢迎加入前哨粉丝群,在这里你可以和科技投资人、创业者、各行业专业人士互动沟通,分享心得体会,也可以第一时间了解到前哨相关活动动态,结交志同道合的小伙伴。

入群方式:
微信扫码下方二维码即可入群


如果您想洽谈合作,请添加创新地图的微信:innovationmap ,并附上简介。

你好,我是王煜全,这里是王煜全要闻评论。


5月12号,谷歌旗下的AI研发公司DeepMind发表了一篇论文,在产业圈子里引发了不小的轰动。里面展示了最新的研发成果:一个叫做Gato的人工智能系统。


图片


以往的AI系统只能执行单一任务,比如击败人类职业围棋冠军选手的AlphaGo只能下围棋,碾压人类电竞选手的AlphaStar只能玩《星际争霸》,都是单一领域里的"专家"。但是Gato这一个AI系统,居然能够去完成超过600种不同的任务,包括聊天对话、给图像输出字幕、玩不同种类和玩法的游戏、控制机械臂等等。


也是因为Gato的这个特性,很多人惊呼通用人工智能的时代快来了。这里解释一下:只能做一个特定领域的事的智能只能叫专用人工智能,或者叫弱人工智能,特点就是输入数据的来源单一、输出目标简单而明确;而能够接近人类学习水平,完成很多不同任务的智能叫做通用人工智能,或者叫强人工智能。


对于研究方法,DeepMind解释说它其实是把不同数据的信息统一化了。背后的核心技术叫Transformer,中文意思就是"转换",本质是把数据的信息转换为另一种AI能读懂的信息。顺便说一句,著名的电影《变形金钢》,英文就是这个词Transformer。


可以给Gato提供的数据种类非常广泛,包括图像、文本、机械臂的力矩数据、游戏方向键的按压数据等等,DeepMind是怎么变形,从而把这些数据都统一起来的呢?


其实很简单:文字天然就是一种序列数据,直接喂给AI就好了;如果是图像,就分割成一个一个的像素,然后编上号处理成跟文字一样的序列数据,再喂给AI;玩游戏的按键操作无非是"上下左右"的操作,也可以转换成序列数据;机械臂稍微复杂一点,可以随着机械臂的运动,可以把关节力矩和传感器信号提取出来,转换成跟文字序列一样的数据。


总之,不管是图像、文字还是别的什么数据,在Gato眼里都一样,不会区别对待。最终,所有的数据都交给同一个Transformer算法来处理,这就是Gato的原理了。


现在Gato还在研发的初期,虽然能实现不同的任务了,但处理每个任务的能力都还不是很强。就拿语言处理来说,GPT-3有1750亿个参数,但是Gato只有12亿个,看来它未来还需要不断提升算力来弥补目前的不足。


图片


为什么要开发一个能做很多事的AI呢?DeepMind公司的说法是,“通用性”往往会让 AI 取得更大优势。从过往70年的人工智能发展史中可以看到,计算的通用模型最终倾向于超越更专业的特定领域的专有模型。自然,很多专家也认为通用人工智能最终会胜出。


不过根据维基百科的解释,通用人工智能“能表现正常人类所具有的所有智能行为”,要具备逻辑推理、学习知识、做判断等等自主行为能力,这些目前看还有点遥远。


因为从这次Gato模型的原理也容易看出,不管这个模型有多大,不管你喂多少数据给这个模型,它都还是个数据驱动的、有限制条件的学习系统,只能在人类定义的规则下做识别,还没有人类这样的自主行为的能力。


这也是为什么DeepMind并没有使用“通用人工智能”(Artificial General Intelligence)这个词,而是基于学术的严谨性,把这个模型称为“具有通识能力的智能体”(Generalist Agent)。


尽管离终极目标还很遥远,但今天达到这一步已经很了不起了,是AI领域迈出的一大步。就拿自动驾驶来说,要实现真正的无人控制的自动驾驶,具备一定通用能力的AI是必不可少的,因为绝大多数AI是在理想化的模拟环境中开发,但现实世界中有很多意想不到、无法预料的情况,这就需要全方位地接近人类认知能力的AI。


上面提到的Transformer,最早是2017年由谷歌开发的,在使用过程中发现比以前的传统算法(比如卷积神经网络),更接近人类大脑的思考方式,准确性更高,于是很快成为了今天主流的AI应用采用的底层算法。


特斯拉的无人驾驶、OpenAI的GPT-3、英伟达的Omniverse软件等等都用上了Transformer,看来是真正得到了产业界的认可。而Gato则代表了AI在通用能力上的一次突破,可以同时做语音语义、图像识别、机械臂移动这些跨界任务。


图片


让我们来畅想一下未来,随着AI通用能力的增强,不同行业之间的壁垒会消失,或许整个产业格局都会被改写呢。当人工智能具有很强的通用能力的时候,今天说的"弱人工智能比人强,强人工智能比人弱"的规律也会被打破,很多行业边界、行业壁垒也有可能会打破。


所以,对于中国的企业家来说,要尽快引入人工智能技术,同时紧盯着通用人工智能的进展。如果通用AI能够成立,或许下一个人工智能的革命就要到来了。这样的时代,我们千万不能错过!


我在科技特训营里反复强调,对产业的理解不是一次性的,而需要抓住重点,持续观察。我们理解产业变革,要关注那些可能会带来革命的关键技术,技术革命也不是一蹴而就的,总有个从原理确认到性能胜出的过程。


现在看,Gato背后的transformer就有这样的革命潜力,至于会不会给人工智能的应用带来革命,从而影响到各个行业,就需要我们持续观察了。


以上就是今天的内容,更多科技产业的底层思考逻辑,会在科技特训营里分享。欢迎关注全球风口微信号,报名加入!


王煜全要闻评论,我们下周见!



用户评论

表情0/300

1823957ygtn

科学家想做人工智的主子吗?

1823957ygtn

游戏属于儿童,产业属于商人

1823957ygtn

有多强?除了游戏

莫尔强

对transformer的解读暴露了王老师不懂transformer。

猜你喜欢
谷歌SEO

不管你是SEO的新手,还是想学习高级策略的老鸟,这里始终是您的SEO知识学习中心。

by:CrossBorderDigital

谷歌赚钱

要说竞争者最少的,当属海外的互联网市场,毕竟信息最为不对称。要说海外互联网中用户最多的,当属谷歌。相信包括听友的你,也不太了解谷歌上是怎么赚钱的,也心存怀疑,但...

by:精神小鱼

谷歌创业帮

当来自最伟大公司的年轻人遭遇最好的创业时代,他们的内心会迸发出怎样的火花?谷歌是公认世界上最伟大的公司之一,是天才最密集的地方。一批从谷歌走出来的华人天才创立...

by:无离_f1

谷歌团队五法则

日更5集,不定期爆更!订阅可以收到更新提醒哦~【内容简介】如何改变团队缺乏创新、成果提升不上来的企业现状,成为众多企业迫在眉睫的关键问题。对此,谷歌...

by:浙江人民出版社电子书

谷歌的运营模式-商业

创业管理资源整合财富成功《重新定义公司:谷歌是如何运营的》该书的作者是谷歌执行董事长埃里克施密特和前高级副总裁乔纳森罗森伯格,他们亲自分享十余年来帮助...

by:兔先森助理5

谷歌的故事 | 普利策奖得主揭开谷歌基业长青的秘密

从稚嫩的初创公司到互联网企业巨头,谷歌始终保持着创新、潜力很大和生机勃勃的企业形象。本书完整讲述了谷歌20年背后的故事。谷歌创始人如何运用各种关系获取资金和人...

by:中信书院

谷歌翻译20次古诗(转载)

谷歌翻译20次,超级无厘头,你不笑,算我输

by:儿子的儿子的爸爸