来源:道总有理(ID:daotmt),作者:道总
每个巨头都想做大模型,可能每家都做不大
不到三个月,国内大模型已经遍地开花。
百度文心一言,阿里巴巴通义千问、商汤日日新、SenseNova体系、华为云盘古、知乎“知海图 AI”、360GPT、昆仑万维“天工”大模型、京东言犀…互联网各个领域的巨头们争相推出了自家的大模型,伴随而来的还有大佬之间许久未见的口水战。
跨界而来的更是不少。4月14日,专注造车的雷军发微博称小米要全力以赴、坚决拥抱大模型和生成式人工智能(AIGC),而由美团联合创始人王慧文、创新工场创始人李开复、搜狗创始人王小川等企业高管领衔的“AI大模型创业军团”,也早对AI大模型风口“虎视眈眈”。
互联网正在迎来“人人都做大模型”的时代。据不完全统计,截至目前,我国已有超过40家公司、机构发布了大模型产品或公布了大模型计划。
这一幕似曾相识。前两年,无论是车企还是手机厂商又或是互联网大厂,接二连三地扎进“造芯”赛道,甚至于连地产、家电、百货、水泥厂等企业也直接横跨到科技业,开始了造芯之路。这些造芯企业发展得如何?一个不乐观的消息是,2022年国内注销吊销的芯片企业高达5746家,同比2021年增长68%。
可以说,风口之下难免导致整个产业鱼龙混杂,而在劣币驱逐良币的效应下,过热可能并不利于产业发展和技术突破。
风口里的“灯下黑”
轰轰烈烈的全民造芯运动,一度把国民对于芯片行业实现国产替代的期待推向高潮,在这种热烈的氛围之中,“造芯”企业如雨后春笋般涌出。
根据企查查数据显示,2020年新增芯片相关企业2.37万家,同比增长160.69%,2021年新增4.79万家,同比增长102.30%,而仅2022年上半年,新增芯片相关企业就高达3.08万家。
图片来源:每经记者
当前的大模型热潮,一如当初的芯片产业,尽管技术壁垒极高,但并不妨碍巨头及创业者们一拥而入。4月18日,仅一天,6个关于大模型的重要消息密集公布:钉钉宣布正式接入阿里“通义千问”大模型;字节跳动旗下火山引擎发布自研DPU(数据处理单元)芯片;斑马智行宣布接入“通义千问”大模型,智己汽车成为首个上车品牌…
这场全球性技术浪潮由ChatGPT的爆火而起,ChatGPT在聊天对话、创作剧本、撰写研报、应用编程等方面表现出的能力惊艳四座,让外界看到了生成式AI在生产力和生产效率提升上的巨大变革性力量。或许也是因为在应用层的率先破局,最初国内互联网的关注点更多聚焦在谁能创造出下一个类ChatGPT产品,然而,现在国内的风口却明显转向了大模型。
这其中不单单是阿里、字节跳动、百度等巨头,像商汤科技、昆仑万维等不具备足够数据体量和资金规模的企业也纷纷下场。
在海外,其实切入大模型赛道的还是原来那么几家,而在国内,短短两个月内搞大模型的比美国多出几倍。这固然是因为通用大模型极高的技术门槛让其拥有最大化的价值,吸引了企业的进入,可另一个更为现实的缘由是相比ChatGPT这种能够应用到场景、用户可以看得见摸得着的产品,大模型的认知度较低,显然更容易讲故事、炒概念,获得资本的青睐。
股市已然说明了这一点。昆仑万维宣布联合奇点智源共同研发国产大语言模型“天工”3.5后,次日股价最高涨近16%,两个交易日累计最大涨幅超22%;周鸿祎高调宣布拥抱大模型后,三六零股价也终于摆脱了长期的低迷状态。
根据Wind数据显示,截至4月24日收盘,三六零、昆仑万维、云从科技今年以来股价涨幅达153.52%、287.23%、155.58%。另外,招银国际发表研报指出,因近3个月ChatGPT对相关概念股股价的拉动,芯片、光模块、PCB、服务器年初至今已各涨65%、146%、45%、62%。
虚火过旺,市场泡沫就越大,浑水摸鱼的投机者就越多。当初全民造芯如火如荼,无论大小企业都给自己带了顶“自研”的帽子,但如今那些高喊着实现国产替代口号的企业,早已把所谓斥巨资的造芯计划抛之脑后。而各地产业园,则留下了越来越多烂尾的芯片项目。
自研AI大模型并不比自研芯片容易,且不说当前存在的技术差距,过热的大模型开发赛道,一方面容易衍生出造假骗局,一旦造假成风,真正想搞自研的会越来越少。更重要的是,在围绕生成式AI的庞大产业生态中,当大小巨头们都集中搞大模型去了,相互内耗,反而可能导致停滞。芯片产业便是如此。
内耗“扼杀”科技
ChatGPT的成功得益于微软慷慨的资金和算力支持。美国市场研究机构TrendForce推算称,处理ChatGPT的训练数据需要2万枚GPU芯片,随着OpenAI进一步展开ChatGPT和其他GPT模型的商业应用,其GPU需求量将突破3万张(该报告计算以A100芯片为主)。
而除了微软,还有一家开源公司帮着做部署,也有专门的公司来进行数据清洗,OpenAI只聚焦在模型上。这是基于庞大的产业链和生态所需,从通用大模型到模型训练再到应用开发,以及与特定场景的融合,一家公司根本难以全部包揽,由专攻各个环节的企业之间相互协同,才更有可能实现突破。
在这点上,芯片产业与之极为相似,芯片架构、芯片设计、芯片制造的设备和材料、封测…围绕不同领域、不同行业、不同环节,经过多次竞争、重组和整合,已经形成了专业的、规模化的半导体巨头,各司其职,上下游相互配合,共同推动半导体产业前进。
然而,国内的造芯进程并没有沿着这种脉络推进,大小公司涌入芯片产业,哪种芯片的市场热度高、哪个环节的技术门槛低、哪种芯片项目更容易获得当地政府扶持,他们就一窝蜂似的跑到哪里,因此导致众多芯片企业或跨界造芯的企业往往集中在一个领域抢夺市场和人才,造成内耗,最后谁也无法从国外芯片厂商的口中分到蛋糕。
这尤为表现在相互挖角上。在国内芯片产业存在严重人才缺口的背景下,高精尖人才或者经验丰富的工程师本就不多,全民造芯运动让这个行业又涌入了一大批参与者,他们用尽各种办法从半导体企业挖人。
“在某些关键岗位上,薪资翻了两倍甚至三倍”,一位曾经在中国大陆头部晶圆代工厂的研发人员表示,他所在的大厂,在过去几年里,研发人员流失了近七成。而很多时候,受高薪酬的刺激,一名主管跳槽后可能会带走一群人,这群人负责的项目就会被耽误,从而影响到生产进度。
在国内,大模型掀起的资本和创业浪潮才不过两三个月,也已拉开了人才争抢的序幕。
2月14日,脉脉创始人、CEO林凡在自己的社交媒体上发了一段话:“ChatGPT带动的AIGC创业热潮要来了!猎头已经开出10万月薪抢人。”而据一位业内人士透露,“在一个算法团队中,对领头的Leader来说10万月薪并不高,毕竟如果没有Leader,再多薪资也有点赌博的成分”。
近日还有传言称,字节跳动开出140万美元年薪,挖角了ChatGPT的研发公司OpenAI团队成员。
“聚是一朵花,散是满地沙”,一位半导体咨询机构首席分析师曾在文章中这样表述国内的芯片产业,而如果看向当前的大模型风口,可以发现,主力集中在大模型或大模型概念的现状,让国内巨头之间有了直接的竞争关系,这是“散”,而不是“聚”,每个巨头都想做大模型,可能每家都做不大。
更困惑的是,国产大模型进入井喷期,但没有一个能打过GPT-4的,再做这种重复性的工作究竟有没有价值呢?
资本不长情,国内“无微软”
2015年左右,当互联网经济在创新力量的带动下热火朝天,资本的目光几乎全部放在互联网商业上,此时的半导体则是投资圈的“冷门项目”。转折发生在制裁事件之后,芯片技术被卡脖子的痛楚让行业不得不走向国产替代的计划,全民造芯的推动下,资本闻风而动。
数据显示,2021年,中国芯片半导体融资事件达超800起创下历史记录,进入到2022年,截至11月22日,行业融资事件为675起,融资规模达1116亿元。
而从中国芯片半导体行业单笔事件融资平均金额来看,2013 年及以前行业平均单笔融资较少,未超过4000万,2014 年之后单笔平均融资金额迈向亿元级别,而在2017年,创下至今最高历史记录,单笔平均融资达到 8亿元。
芯片行业烧钱,甚至远超过互联网风口的烧钱大战,资本的进入和追逐,可以说是国内芯片产业发展的一大助力。但是庞大的造芯“大军”,让不断增长的资金体量似乎显得仍然有些不足,人才、生产线、场地、设备都需要持续的投入,且资本无情,一旦长时间看不到回报,或市场突变,很少会继续坚持。
如射频芯片,被股民称为“半导体茅台”射频前端巨头卓胜微,股价在2021年下半年开始暴跌,如今,卓胜微的市值已经缩水至657亿元,仅约为其最高点时的三分之一,受其影响,射频行业中的资本正在全面撤退。
论烧钱,大模型及大模型训练自然不遑多让。单是运营成本,半导体研究公司SemiAnalysis称,以GPT-3模型推算,ChatGPT每天的运营成本高达70万美元,按每日70万美元计算,则ChatGPT一年的运营成本高达2.555亿美元(约17.6亿人民币),因此,新一代的GPT-4模型只会更烧钱。
一位投资经理表示,过去,团队健全的大佬创业项目,一般第一轮估值2-3亿元就已经很高,但放到大模型创企来说,光1年租1000张GPU卡就要花大几千万到1亿元的支出。
过高的进入门槛,让很多投资机构望而生畏,不过基于大模型构建的各类生成式AI创业项目,以及在这场技术热潮中被重新捧红的相关AI企业,还是让各路资本心动不已。权威数据统计机构之一PitchBook的数据显示,全球对生成式AI的投资从2020年到现在增长了425%,仅2022年的投资额就多达21亿美元。
虽然从融资主体来看,当前获得较高资本注入的多是海外企业,但国内大模型之战已然拉开序幕,这场科技浪潮必然会裹挟更多的资本。当然,资本是把双刃剑,从芯片产业来看,资本的输血,造成了射频行业的内卷,过度竞争的趋势下,使得国产射频芯片仍然摆脱不了高端不足、低端过剩的现状。
另一方面,国内资本固然雄厚,可对大模型及模型训练赛道而言,互联网或其他行业巨头能否像微软一样“培育”出下一个“OpenAI”,着实令外界质疑。从区块链到元宇宙再到Web3.0,国内巨头们对技术性风口的追逐和热爱,似乎总不怎么坚定,也缺乏足够的耐心。
二三十年前,我们抓住了互联网的变革时机,二三十年后,我们还能立于新一代技术变革的潮头上吗?