这款世界级产品的诞生,离不开盖茨对研究团队指引的方向以及明确的要求。
创业邦(ID:ichuangyebang)原创
整理丨邦德
图源丨摄图网
作为一款科技产品,ChatGPT有多么伟大?
两个月前,它是全世界成长最快的科技产品,60天收获一亿用户。上周,我们又见证了ChatGPT+插件,API成为商业模式,OpenAI从研究实验室转型为一家有无限想象力的消费级平台。
ChatGPT和OpenAI火爆的背后有着众多科技大佬的身影。其中,比尔•盖茨发挥的作用日渐清晰。他不仅是ChatGPT最好的吹鼓手,更是这个现象级消费产品背后的关键推手。
在3月的一档播客节目Behind the Tech中,盖茨与微软CTO凯文•科斯特进行了一场对话。我们看到,盖茨对ChatGPT方向的指引和标准的设置,有决定性的贡献。他向团队提出了二个非常具体,但难度极高的要求,即AI需要回答训练集之外的问题,需要具备通过大学生物学考题的能力。幸运的是,团队给出了的答案。一个伟大的产品就此诞生。
盖茨把AI的进展比作是人类进入PC和互联网时代。有网友问,盖茨会不会是出于私心,替微软站台而一味鼓吹?未必没有这种可能性。但硅谷创投圈有个经验:当你就某个想法向行业大佬请教时,大佬反对的,你听听就好。大佬支持的,你的想法很可能是对的。
盖茨肯定算科技大佬。如果你是AI技术的信徒,认真对待他的观点应该是明智的态度。
以下内容经创业邦编辑整理。出于篇幅考虑,存在较大幅度删减。
凯文•斯科特:大家好,我是主持人凯文•斯科特,是微软公司的首席技术官。欢迎来到“技术的背后”,我们和一些塑造了现代科技世界的领军人物展开对话,了解他们创造和创新背后的驱动力。
今天,我们请来了比尔•盖茨,此人无需介绍。在过去的几十年,他对科技和全世界都产生了令人难以置信的影响。在过去的几个月里,他一直与微软和OpenAI的团队密切合作,帮助我们思考什么是最令人惊叹的科技,以及我们正在经历的AI革命对OpenAI、微软、乃至社会都意味着什么。
盖茨先生,我知道您对AI的期望值非常高,我主要想聊聊最新的GPT-4、ChatGPT以及微软与OpenAI的合作。您去年8月与霍夫曼(Open AI创办人和投资人之一)、阿尔特曼、Greg Brockman和Satya等人有一场晚宴。我的问题是,那个晚宴上发生了什么?你之前是怎么想的?在看到GPT-4之后,您的想法发生了哪些变化?
比尔•盖茨:AI是计算机科学的圣杯。在我年轻的时候,斯坦福大学研究院就有一个试图捡东西的机器人Shakey。人类一直在研究各种逻辑系统,希望它能产生某种推理的能力。但在机器学习出现之前,AI的总体进展相当有限。因此,机器学习方面的进展,特别是在感官,识别语音,识别图片方面进步,让AI有了巨大的加速,而且它的进步日新月异,也让它越来越好。
但是,我们仍然缺失了一些与复杂逻辑有关的东西,比如阅读文本并做人类所做的事情,即引用和理解文本中的内容。随着微软在OpenAI的深入合作,我有机会经常去见他们,他们正在做大量的文本生成。
早期的文本生成缺乏广泛的理解力(broad understanding)。比如,它可以生成一个句子,“乔在芝加哥”,几句话之后,又说,“乔在西雅图”,这在局部概率意义上是很好的句子,但人类从自己的经验和阅读中所了解的世界并不仅仅如此。
他们当时正在做GPT-3,还有GPT-4的早期版本,我对他们说,能否让AI有能力通过大学的生物学考试,这需要AI回答一些训练集里没有包括的问题。如果能够做到这一点,那就是一个里程碑。所以,请继续努力。
我当时认为,他们会就此消失两三年,因为我的直觉是我们需要以更明确的方式理解知识表示和符号推理,这需要一二项非常有用的,涉及阅读和写作的发明,AI才有可能成为人类的助手。
但在夏天的时候,Greg、阿尔特曼还有你都对我说,科学学习方面的进展非常快,可能用不了多久就可以做一场演示。于是在8月份,这一切就开始安排起来了。
9月初,我邀请了30多人到家里吃晚饭,其中有很多了不起的OpenAI的员工、微软方面的人也相当多。他们让我向AI提了很多关于AP生物学的考题,除了一个答案之外,AI都回答得非常好。这个例外与数学有关,我们可以稍后再谈。
这是一个惊人的进展,令人兴奋。之后,我让他们输入“你对一个有生病孩子的父亲说什么?”机器也给出了一个非常仔细和出色的答案,质量可能比房间里的任何一个人都好。所以,我当时的感觉就像:哇,是这样!这个东西还能干什么?这个东西比过去好太多了!
之后的整个晚上,我们向它询问了一些历史方面的问题,比如怎么看待丘吉尔之类的。这一切都太令人着迷了。
之后的几个月,我们又做了些测试,比如让它来写大学申请,或是重写《独立宣言》。它的能力很强,能写诗,可以让它听了Hey Jude之后写个感想,等等。
总而言之,从9月的那天起,出现了根本性的变化。我不是说它已经没有问题要解决,但这是一个根本性的进步。有时它让人困惑,比如它还做不到这个,做不到那个,这个或那个方面还不完美。但是,不可否认,这是一个非常、非常巨大的进步。
凯文•斯科特:的确如此。我们想讨论的问题有很多,但我首先想谈谈AI不擅长的事情。因为我们最不希望看到的就是给人一个错觉,它是一个通用AI,或者它是完美的,改进它很容易。你提到的数学就是它的一个缺陷。我的问题是,这些系统有哪些需要改进之处?我们需要集中精力先改进哪些地方?
比尔·盖茨:首先,关于背景的理解(knowledge of context)是个普遍存在的问题。
我告诉你一些东西,你就生成一些东西。但如果我编造了一些东西,比如提供了错误的建议,让你买错了股票或是吃错了药。这方面,人类对事情发生的背景是有深刻理解的。AI需要知道你是否已经切换了上下文。
比如,你一开始让它讲笑话,之后问它一个严肃的问题。人类会从你的脸部表情里感知到变化,或者体会到变化的本质,我们已经不是在开玩笑了。总之,在“背景感(sense of context)”方面,AI还需要改进。
至于在一个难题上该花多少时间,你和我都看到了它在数学方面存在的问题。数学是一种非常抽象的推理类型,我认为这是系统目前最大的弱点。
奇怪的是,系统可以解决很多数学问题。比如有一些数学问题,如果你要求它以抽象的形式解释它,它能做得很好。但如果你让它自己计算,它又经常出错。
但我不认为这些问题是根本性的。有人说这是统计学,机器永远做不了,这是胡说八道!他们给出的那些机器不能做的例子,只要过几个月,机器就能做得很好。
所以,那些吹嘘它有多好,贬低它有多糟,还有说它是AGI的人,都是错误的。我们这些身处中间立场的人只是希望让它以正确的方式得到应用。
凯文•斯科特:我想谈谈它如何能够使用工具来帮助推理。我举一个我14岁女儿的例子。老师布置了一个作业,给了一个有115个单词的词汇表,学生要写一篇1000个单词的文章,尽量多用词汇表里的单词。
她写完之后,需要手动计算用了多少词汇表里的单词。这件事很无聊。她让我用ChatGPT-3帮她算,结果没算清楚。我觉得GPT-4也算不清。后来,我和女儿发现,可以让GPT-3直接去写这个作业。结果,它完成得非常好。
我女儿并不会编程,但她能理解发生的一切。当我们试图解决一个复杂的数学问题时,我们的脑袋里装满了我们可以使用的认知工具,帮助我们把复杂的问题分解成我们可以解决的更小的、更简单的问题。所以,一个非常有趣的问题是考虑这些系统将如何使用代码来做到这一点。
比尔•盖茨:是的,AI非常擅长写作,这非常令人振奋。比如,你想做一个绘画的程序。虽然菜单上需要能够添加颜色的功能,但如果你的主要界面是使用自然语言时,仍然可以使用AI。如果您想要对一个文档进行总结,AI可以做得非常好。
再比如,医院和保险公司需要沟通账单。医生可以用ChatGPT-3写信给保险公司,解释为什么某一笔费用应该由保险公司来负担。这是非常复杂的事,所以有很大的应用价值。在ChatGPT-4上,我们就能够做到这一点。
因此,AI在提高生产力方面,有很多工作可做,包括处理大量的文件、应付账款、账户、应收账款,等等。仅就健康和卫生体系而言,AI软件能处理和分类的文件就是海量的。
凯文•斯科特:同意。我还想和您聊聊其他方面。您参与并构建了技术领域的几个重大转折点,您帮助PC和互联网走进了家庭。对于那些掌握了AI新技术的人,应该如何去思考和如何使用这些技术,你有哪些建议?他们在多大程度上应该更迫切地追求他们的想法?现在的情形和当年PC和网络时代有哪些异同?
比尔•盖茨:刚开始,PC行业非常小,没有个人计算机,然后通过微处理器还有包括IBM和苹果等大批的企业,人类有了个人电脑。微软公司主要是在软件方面的参与。比如,Apple II上的BASIC解释器,就是我为苹果公司做的。这是一个工具,至少对于编辑文档而言,你需要写很多东西。之后,通过互联网将它们连接起来真是太神奇了。再然后,将计算转移到手机中绝对是惊人的进步。一旦你有了PC、互联网、软件和手机,数字世界就会极大地改变人类的活动。我刚刚在印度见证了这一刻。那里人们在用数字方式支付账单。这些人可能从来就没有过银行账户,因为使用的成本太高,程序也太复杂。
因此,我确实认为,从能够帮助人类的读写开始,计算机每一点点进步都能产生像在印度那样深远的意义。但过去,机器人技术的发展比我预期的要慢。我指的不是自动驾驶。那是特别困难的应用,它涉及开放式环境,以及安全方面的难度。
有一小撮人说,有些人总是过于乐观地预测(over predict),这是事实。但就这个具体的AI领域,我们其实是低估了自然语言和计算机处理问题的能力,以及它如何影响白领的工作,包括销售、服务、帮助医生考虑将什么放入健康记录,等等。
而这一切还只是开始。你可以称之为“狂热”(mania),像当年的互联网热一样。但是,当年的互联网狂热虽然有不可理喻(insanity)的一面,但回头看,这确实是一个具有深远意义的工具,只是现在看起来稀松平常而已。正如我年轻时见证的那些数字计算领域的里程碑一样,AI现在的进展就是一个巨大的科技突破。
凯文•斯科特:过去,您经常会说,某一个想法很愚蠢。我想听听您对这个问题的反应。过去,技术工作是有门槛的。掌握技术的人预设一些人类的需求,设计出软件,替人类工作。但现在这样发展下去,普通人都有能力用机器做非常复杂的事情,而不必具备像你我这样花很多年去掌握专业知识。这是一个愚蠢的想法吗?
比尔•盖茨:当然不是。每一项进步最好都能降低使用者的门槛。电子表格(spreadsheet)就是一个例子。即使你仍然需要理解这些公式,但使用者实际上根本不需要理解太多的逻辑或符号。它在“直奔主题”(directness)方面是非常强大的。如果数据的结果显示出了问题,就做出改变。
大多数企业学习涉及的,无论是查询、报告,甚至是一个简单的工作流程,所有的行为都是希望触发一个“动作”。每一个层级的员工都可以通过提问,获得解决问题的方案,而从中获益。
对于其他人来说,比如申请大学。我想知道下一步该做什么,做这件事的门槛是什么?现在的很多事情都太不透明,让人们能够直接进行互动,这就是AI能够努力赋能的地方。
凯文•斯科特:您非常关心教育、公共卫生、气候和可持续能源。我想知道您个人或是基金会最感兴趣的技术应用是什么?这些应用会如何影响这些事情?
比尔•盖茨:我认为教育是最有趣的应用,第二是健康。当然,在销售和服务领域会有商业机会,而且肯定会发生。但这类事情不需要基金会的参与。
我们与可汗(Sal Khan,教育性非盈利组织可汗学院的创始人)有过很多次头脑风暴。一个班级有20-30人,老师很难有针对性地给予每一个学生足够的关注,无法理解他们的动机或是保持他们的学习兴趣。而通过对话和反馈,AI将第一次成功地改进教育。
我们必须承认,除了查找百科和打游戏方面,以往计算机并没有彻底改变美国的教育。过去30年,美国学生的平均数学成绩并没有提高多少。显然,计算机没有在那方面创造出奇迹。但在未来5-10年,我们将会用一种非常不同的方式来帮助人类进行学习,而不仅仅是查资料。
凯文•斯科特:是的。你我都看到了一个共同之处,就是父母的参与对孩子的教育成果会产生很大的影响。硅谷有很多移民子女,父母经常打二、三份工,他们太忙了,很难有时间与孩子相处,有的人甚至不会说英语,但技术可以帮助他们弥合父母和老师之间的鸿沟,不管他们说的是哪种语言。比如,帮助父母了解孩子的学习障碍在哪里,甚至可以个性化地解决孩子的痛点。
比尔•盖茨:是的,语言障碍的问题,我们往往容易忽视。在发展中国家,比如印度有很多种语言。我去了班加罗尔的研究实验室,他们正在采用这些先进技术来处理这些小语种的问题,所以未来这不是一个大的障碍。
凯文•斯科特:您在那次GPT的家宴上说,当年在微软看到的一个演示,改变了对PC业将如何发展的思考方式,并导致您改变了公司的发展方向。您能再谈谈这段早期的历史吗?
比尔•盖茨:当时,施乐公司在复印机上赚了很多钱,他们有专利。那时日本的同行也没有进来。因此,他们在硅谷创建了一个研究中心(PARC),聚集了一批人才。这些人创建了一个图形用户界面机器,虽然他们不是世界上唯一在做这件事的人,欧洲也有人在做,但他们将它与很多事情结合起来,比如把它放在网络上,用了激光打印机。查尔斯•西蒙尼(Charles Simonyi,软件专家/Windows核心架构师)编写了这个程序,并做了一个文字处理器。
一天晚上,我去PARC拜访了查尔斯,他演示了他用这个Bravo文字处理器所做的事情。然后,他在激光打印机上打印了一份文件,上面列出了如果市场上能有更便宜、更普及的计算机应该做的所有事情。我们一起做了头脑风暴,他更新了文档并再次打印出来,这让我大吃一惊。微软未来的方向呼之欲出。
我雇用了查尔斯。他完成了Word和Excel以及我们许多伟大的事情。最终,在他向我展示他的想法,以及我们头脑风暴之后的15年,我们通过Windows和Windows和Mac上的Office实现了这些想法。
所以,我告诉大家,这是又一个让我大开眼界的演示。它让我思考未来5-10可以实现什么。
凯文•斯科特:您刚刚分享了一个非常有力和激励人心的轶事。还有最后一二个问题,您认为未来5-10年我们应该考虑的重大挑战有哪些?
比尔•盖茨:嗯,关于如何执行这些算法、大量芯片、从硅到光学的一些移动以降低能源和成本,将会有一系列创新。英伟达是今天许多创新的领导者,但其他人会尝试挑战它,甚至会使用一些激进的方法,因为执行成本,甚至训练成本都需要大幅降低。理想情况下,我们希望能移动它们,让大家可以在独立的客户端设备上执行它们,而不必从云上获取这些东西。
另外,还有软件方面的挑战。要弄清楚是分别做各种专业领域的版本,还是做一个统一的、不断改进的版本。两种路径并行会产生巨大的竞争。即使在微软,我们的做法也是同时追求两者。
除此之外,还有很多社会问题。比如如何推动教育?这并不是说它马上就能了解学生的动机或是认知,但我们必须进行大量训练,并将它嵌入到成年人看到学生参与并看到动机的环境中。
因此,微软的说法是提高人类的生产力。有些事情会实现自动化,但很多事情最终还是需要人的参与,只是参与的效率会比过去提高了很多。
因此,AI的进步带来的挑战和机遇之多是令人难以置信的。我看到OpenAI团队的投入程度,而且肯定还有很多我看不到的团队正在推动这一点。
我每周都会收到一份关于AI的不同文章的摘要。我们可以用它来解决道德问题吗?对我来说,这个问题很愚蠢,但优秀的人可以问他们想问的任何问题。有这么多的人,这么多的资源,这么多的企业参与了这个进程,一定能够取得比我当年有幸经历过的更大的突破。
凯文•斯科特:最后一个问题。我知道您非常忙,但还是想问您工作之余有哪些消遣?
比尔•盖茨:我现在阅读很多东西,经常打网球,还要参加基金会的一些线下会议,包括微软和OpenAI的一些会议。我还在打匹克球,我已经打了50多年,再加上网球和读书,大概就这些。
凯文•斯科特:我想多聊几句阅读。您说的大量阅读和常人可能不一样,因为我们都知道您总是随身带一个巨大的,装满书的手提袋。不仅书多,而且很杂,从科学读物到小说。您实际上能读多少书?平均的阅读速度有多快?
比尔•盖茨:如果我一周不读一本书,我真的会反思那一周我在做什么。如果我度假,那么我希望能多读五、六或七本书。当然,一本书的篇幅有长短,如果以年计算,我一年应该能读80多本书。阅读让人放松。我应该多读小说。非虚构的东西我看得太多了。
凯文•斯科特:非常感谢在过去的六个月里,您帮助我们思考的哪些AI方面的事情,这真的很棒。
(原文参见:https://www.microsoft.com/en-us/behind-the-tech)