来源:刺猬公社(ID:ciweigongshe)
从这场发布会开始,OpenAI展露野心。
当OpenAI CEO 山姆·奥特曼(Sam Altman)走上讲台时,或许很多人会幻视2007年的乔布斯,梦回上个科技时代的初始。
连山姆·奥特曼自己也没有想到,只是短短一年时间,仅凭借口口相传,OpenAI就成为了全世界使用最广泛的人工智能平台之一,ChatGPT也成为了全球AI领域“王者”一般的存在。
在过去的一年时间里,已经有约200万开发者基于OpenAI的API(应用程序编程接口)进行开发,OpenAI的企业客户包含92%的世界500强公司,ChatGPT更是吸引了超过一亿的用户,他们每周活跃在这个划时代的AI产品上,对于其中不少人来说,ChtaGPT已经成为工作、生活中必备的AI助手。
一个不争的事实是,OpenAI正引领着整个世界前行。
11月7日,北京时间凌晨两点,OpenAI DevDay发布会正式开始。这是继2022年11月ChatGPT发布,引爆全球AI热潮之后的首届开发者日,也是继GPT-4后最重要的发布会之一,足以让全球科技圈震动。
现如今,能够让人兴奋的公司越来越少,连一年一度的“科技春晚”苹果发布会都开始让人失望,在感叹着“苹果拉了拉了”的同时,关注者把未来的希望投射在这家科技新贵身上,“王炸”“碾压”“新的iPhone时刻”,在狂热的口号中,期待着GPT再次引爆全网。
那么,新的奇点真的到来了吗?
01
GPT-4 Turbo,不惊艳,但够强悍
在发布会正式开始前,不少人等待着下一个“iPhone时刻”的到来,尤其是AI从业者们。但他们的情感也无比复杂,期待与恐惧交织着,期待着AI领军者带来的全新技术与无限未来,恐惧的则是自己被OpenAI的强大实力直接淘汰。
然而这一次的OpenAI却走了一条不太寻常的路。在此前的诸多猜测中,许多人预言OpenAI会在本次开发者大会上发布一个新的杀手级应用,也许是GPT-5,它的性能能够秒杀当下所有的大模型产品,甚至将GPT-4斩落马下。
但OpenAI没有。新模型产品是必然会到来的,它的名字被命名为更酷炫的GPT-4 Turbo,主要更新点在六个方面,分别是:上下文长度、控制方法、模型知识内容更新、多模态输入输出、模型定制化、以及更高的速率限制,除此之外还有版权盾等新内容。
简单来说,这是对GPT-4的一次全面升级。首先就是上下文长度的增加,相较之前的版本,用户能够和GPT-4 Turbo实现更长文本的对话了。此前GPT能够实现的最长上下文长度为32k,日常使用中仅有8k,指令输出、深度对话会受到一定限制,难以实现跟GPT“酣畅淋漓的对话”。
这一次,OpenAI直接将上限提升到了128K的tokens,是原有长度的16倍。具象一点,大概是一本300页书的内容体量,想象一下,只需要花费几十刀,你就能跟GPT-4 Turbo聊上一场《海底两万里》那么长的天。从此以后,让GPT帮忙写网文不再成为问题(至少篇幅上可以做到,好不好看另说)。
另一方面,改动体现在细节微调与模型控制。简单来说,通过新发布的JSON等模式,你能够更好地控制GPT,得到自己更想要的回答,同时你也能在使用中调用更多函数,让GPT的响应与回答更加稳定;OpenAI也将提供更多模型微调服务,主要面向单个企业,通过提供模型定制服务,你可以享受到更高性能更专业的GPT产品,但想体验这些服务,得加钱。
剩下的则是一些能够预料到的升级。知识库更新自不必说,自从ChatGPT发布后,外部知识内容的更新一直饱受诟病。例如你问它2022年发生的事件,它只能卖萌告诉你它来自2021年以前。这一次,OpenAI终于将知识内容的更新时间从2021年提升到了2023年4月,尽管还存在着一些滞后,但GPT-4 Turbo总算是“时髦”了一点。
多模态更是必然要来临的。GPT-4 Turbo整合了OpenAI目前已经拥有的视觉、语音等模型产品,未来可以实现图生图、语音输入等形式,甚至还能为开发者提供六种预设声音选择,这不禁让我想起了最近爆火的《完蛋!我被美女包围了!》。
在使用的速率限制上,OpenAI为GPT-4的用户提供了翻倍的“冲浪”体验,如果还不满足,通过自己的API账户,你可以付费申请提高速率限制,让GPT进一步起飞。
但对于许多关注者来说,这些更新仍未达到预期,GPT-4来到了“船新版本”,但却不足以令人惊艳。
“以这次很多人在聊的上下文长度这件事来说,其实无论是竞争对手Anthropic、Claude、甚至国内的百川大模型都已经能实现几万字甚至几十万字的内容输入了,GPT这一次升级优势也不大。”AI从业者、GPT用户攀翔告诉刺猬公社,在他看来,这一次的GPT-4 turbo并不惊喜,反而感觉OpenAI在做一些常规而平庸的事。“多模态这些功能所有大模型开发者都在做,完全不令人意外,我最期待的还是产品的智能性。”
类似的论调在网络上并不少。此前GPT-4的plus版本升级就让不少人直呼GPT-4变“蠢”了,不少用户将希望寄托于GPT-5上,但OpenAI提供的是GPT-4 Turbo。升级能够在一定程度上提升产品的使用体验,但“智力”是否有显著提升,仍旧需要进一步验证。
OpenAI这一次并没有将GPT的智能化提升到下一阶段,而是选择补全“短板”,或者说,通过产品体验升级从而吸引更多用户。一个直接的例证就是,OpenAI决定将API体系全面降价,GPT-4 Turbo的输入价格降低三倍,新价格为每千个tokens一美分,输出价格降低两倍,新价格为每千个tokens三美分。山姆·奥特曼在发布会现场表示,GPT-4 Turbo总体费率比GPT-4便宜了2.75倍以上。
很多人把OpenAI类比成下一个苹果,但在是否降价这一点上两者可不太一样。AI还是太小众了,OpenAI明白扩大用户规模的重要性,顶着烧钱的压力也要降价,整个发布会前半段目的也呼之欲出,山姆·奥特曼和OpenAI铆足了劲要走普惠路线,通过生猛的方式碾压着所有对手:
作为全球最顶尖的大模型产品,OpenAI不仅对产品进行了全面升级,使用成本压得更低了,甚至连用户面临的版权问题都做出了兜底保证(版权盾),千言万语汇聚成一句话,“快来成为我们的用户吧!”。
02
授人以鱼,不如授人以渔
做普惠的产品,不仅验证OpenAI自己提出的规模法则(Scaling Laws,随着模型规模、数据计算规模的增加,模型的性能也会同步提高),也是提升市场占有率的行为。发布会上的更多动作则更能让我们看到OpenAI的野心。
除了发布新模型产品外,GPTs和Assistants API的发布更让人激动。简单来说,OpenAI要建构起一个庞大的大模型生态,通过这个生态,你可以获得任何你想要的AI应用产品,并且通过OpenAI的API体系,成为AI Agent(智能体,智能代理)的开发者。
首先是GPTs,即为特殊目的创造的定制版本ChatGPT,以GPT产品为技术基底,可以衍生出各种各样的GPT。2023年5月,OpenAI开放了GPT产品的插件系统,上线了一批大模型应用,面向各种垂直领域以及专业用途,这正是GPTs的前身。这一次,OpenAI选择将这些应用独立出来,他们不再以插件的形式附着于产品上,而是单独成为独立的应用,并通过GPT Store进行聚合。
类比理解,GPTs就如同移动互联网时代的App,GPT Store就是App Store,只不过这些App全部是以OpenAI的大语言模型为技术基底,是AI时代的产物。
目前GPT Store已经上架了一批应用,除了之前已经存在的插件外,还上架了官方研发视觉模型DALL·E、能够帮忙解析棋类卡牌类游戏的Game Time、能够帮忙了解Z世代最新潮流和热门迷因(meme)的gen z memez等十几个Agent机器人。在发布会现场,OpenAI的工作人员演示了应用Zapier的使用过程,通过AI安排了自己的个人日程甚至进行了实时通讯。
最重要的是,每个人都能自己创建GPT。在现场,山姆·奥特曼打开了GPT Builder,通过几句简单的对话就创建了一个为企业创始人提供咨询服务的GPT,并通过上传自己演讲内容的方式,让这个GPT成为了专业的“创业导师”,整个过程不超过三分钟。
不需要写代码,不需要复杂的UI构建,只需要对话、知识库上传,以及部分动作(action)指令的设定,三分钟内开发一个智能助理,这是只有在AI时代才能实现的“天方夜谭”。
用户不仅可以私人专用自己开发出的GPT,还能将其提供给需要的企业,或者直接公开,通过GPT Store提供给其他用户使用,并且获得OpenAI给予的利润分成。用户不仅仅是花钱用产品,还能通过GPT挣钱。
对于个人开发者来说,能够研发的应用仍旧是相对简单的,但对于专业的研发团队及企业来说,成本问题得到了一定程度上的解决。
而Assistants API正是实现“一键创建GPT应用”的工具。在过去,开发一个Agent的过程非常复杂,需要专业团队完成大量繁琐且复杂的搭建工作。通过Assistants API,开发者能够创建一个具有特定指令、拥有额外知识,还能调用各种模型和工具的“开发助手”,并把最复杂的问题交给它去做。
在零代码的情况下,你只需要输入指令,进行微调就能够创建一个高质量的AI应用程序,即Agent。
直白地说,OpenAI正通过AI将“研发过程”进行封装,动手打字,甚至说几句话就创建应用的时代,真的来临了。未来Assistants API如果面向所有用户开放,那么每个人都能成为产品经理,由AI来做程序员。
站在OpenAI和开发者一方,这无疑是一种“格局打开”的行为,让所有用户受益,共建一个以OpenAI为基底的AI应用生态,必将带来新的繁荣。但对于不少同行来说,这无疑是一场“杀戮”。
早在10月的YC校友分享会上,山姆·奥特曼就曾警告过套壳ChatGPT的所谓“AI”公司,表示OpenAI的模型产品会逐渐拓宽领域,在生存空间越来越有限的情况下,这些公司必将走向消亡。
这次发布会证实,那只是山姆·奥特曼的“勿谓言之不预也”,GPT不仅要在使用体验上要打败所有人,还要通过GPTs和Assistants API在垂直应用、开发者的争夺领域竖立壁垒。“学我者生,像我者死”已经不再是真理了,因为在OpenAI的攻势下,竞争对手们都得面临“死亡威胁”。
部分关注者并不能理解OpenAI在这些领域所作出的努力,在他们看来,很多动作只是为了占有市场。“现在OpenAI很多动作完全是出于商业逻辑,比如GPT Store,除了能够构建生态,挤压对手生存空间外,其实并不需要做这么大的投入。”
AI领域关注者蓝琦认为,OpenAI正在逐渐成为一个传统的科技公司,商业竞争已经成为除研发外最重要的手段。“很多老用户对GPT-4的表现还不够满意,或许他们应该继续把精力放在大语言模型的智能研发上。而且很明显现在的开发型产品并不能承担高质量的应用研发,只会导致大量低质的应用泛滥。”
对于这样一家先发优势明显的独角兽企业来说,走向规模化、甚至垄断或许是自然而然的事,而推进应用的实际落地则是最重要的一步。
目前OpenAI的研发重点之一,正是让AI开始不断落地,不仅能够通过规模化推动AGI(通用人工智能)的实现,还能解决现实面临的经营问题。“所以也能够理解,但总是会不自觉地希望他们,走得更快一点。”
03
OpenAI之烦恼
在ChatGPT正式发布前,OpenAI确实在一条鲜有对手的赛道上狂奔。
10月的YC校友分享会上,山姆·奥特曼分享了一个关于OpenAI的小故事,他坦言在OpenAI建立之初,大语言模型并非机构的主要研究方向,他们尝试过机器人、游戏AI等多个领域的研究,只有毕业于富兰克林·欧林工程学院的本科生亚历克·拉德福德(Alec Radford)始终关注大语言模型方向。
七年之后,其研究的领域最终成就了OpenAI,也改变了全世界科技发展的方向。一个本科生的坚持,最终作用到整个科技领域,这样精彩的故事构建了OpenAI的发展基础,带有象牙塔属性的科技创新,一直被认为是OpenAI的成功原因之一。
尽管背靠马斯克等企业家的丰厚赞助,但此前OpenAI最大的亮点便在于他们并不热衷于参与资本游戏,而是选择潜心研究。山姆·奥特曼自己也坚定认为,获得高额收益并非自己投资创业公司的目的,推动颠覆一切创新的发生才是他最想要的。
但当ChatGPT横空出世,一切都在迅速改变着。OpenAI的对手已经变成了所有人,研发不再是他们需要考虑的唯一问题。
回看过去一年,OpenAI获得的越来越多,面临的选择也越来越多。
作为一个非上市公司,其估值已经达到900亿美元之巨,但像其他独角兽一样,OpenAI也正面临着最基本的经营问题。
GPT是一把钥匙,它带领OpenAI走向广阔的世界,同时也把最沉重的负担——现实——带到这家公司面前。“科技新贵”的终极目标不仅仅在“新贵”二字,如何稳住地位,始终立于紫禁之巅,才是真正的难点,毕竟ChatGPT还没有真正做到“秒杀一切”。
于是OpenAI需要不断做出选择,持续推动产品化、通过扩大规模均摊成本、构建强悍的AI应用生态,正是在这种情况下所作出的选择。
另一方面,算力、芯片等领域的局限性,也不断催促着OpenAI展开新布局。尽管背后已经拥有微软的支持,但OpenAI也将投资作为自己重要的“底牌”。目前,OpenAI已动用1.75 亿美元投资下一代人工智能初创公司,同时也通过“技术入股”养活了一大批科技创业公司。
从非营利性机构到科技独角兽、产品公司,甚至是科技巨头,短短一年时间,OpenAI正面临着剧烈的转变。可以确定的是,让产品实现商业化,覆盖高昂的研发及算力成本,才能让微软等投资者放心,才能在与谷歌、meta等巨头的竞争中不落下风。
这一次发布会上,微软首席执行官萨蒂亚·纳德拉(Satya Nadella)也来到了现场,山姆·奥特曼再度强调了与微软之间的关系,“我们正在深化与微软的合作关系”。
在此之前,对于两者合作关系的猜测甚嚣尘上,甚至有消息称微软AI业务受到OpenAI的威胁,合作可能走向终止。这一次微软首席执行官的站台,更像是一次“辟谣”,OpenAI需要这样的对话,让用户和投资者们对自己更有信心,尽管他们已经非常有信心了。
值得庆幸的是,OpenAI仍旧以实现AGI为最终目的,并且始终站在世界最前沿,它就像一把锋利的剑,不断开拓着前路,与之相对的,各种对手也被斩落马下。
在发布会结束后,一张梗图传播甚广,一位受邀参与开发者日的创业者直言,山姆·奥特曼毁掉了自己价值300 万美元的创业公司,而自己只得到了500美元的OpenAI API积分(OpenAI为现场的每一个开发者准备的礼物)。无论巨头之间的竞争如何,AI应用领域的初创公司无疑正面临着一场噩梦。
在X上,另一位网友把这场发布会比喻为美剧《权力的游戏》中著名的阴谋“血色婚礼”,代指OpenAI把开发者们请到现场见证自己创业梦碎的“地狱笑话”。有人将这条推文喂给了GPT-4 Turbo,后者准确的概括出了这条推文的含义。
一条评论如同寓言:最妙的是,这个谜语的猜谜者正是谜底。