5月27日,创业黑马在北京举办“2023•黑马AIGC峰会”。此次大会的主题为“预见新世界,构建新格局”。有“AI女王”之称的卡耐基梅隆大学计算机学院前副院长、达沃斯世界经济论坛(WEF)计算机全球未来理事会前主席贾斯汀•卡塞尔,以及360集团、智源研究院、昆仑万维、云知声、蓝色光标、万兴科技、知道创宇等众多行业内企业高层到场,与上千位参会者进行了深入交流。
在峰会现场,昆仑万维CEO方汉分享了《天工大模型的探索与应用》主题。
以下为分享内容整理:
今天,我首先会先过一下国内大模型的发展进程,然后再简单介绍一下昆仑万维进入大模型的由来,最后是思考。
大模型本质上特别像操作系统的CPU,它可以控制很多AI和工具完成工作,大模型的出现会带来整个应用市场的重构。我们现在从大模型已经落地的一些行业来看,我们的看法第一是应用能否在线上形成完全闭环,完成闭环越完善的行业和应用,它的大模型就会越容易。
举个例子,游戏研发的过程也是对美术依赖的过程,在游戏研发的美术制作过程中,从原画到3D,再到游戏引擎的流程,如果能按照文本生图的方式,那么游戏研发效率就会得到的极大提升。在实际应用的过程中,我们发现在原画这一步骤,文本成图会有极大的技术加成;但当原画完成之后,还会有2D到3D的过程,正是这一步导致了游戏研发的美术制作流程效率本质上并没有提高,因为2D转3D这一步仍然需要大量的人工介入。任何一个行业,如果全链条不能得到提升,那么大模型的介入就不能带来生产效率的提升,这有点像木桶理论。
第二是应用场景的容错率,如果容错率越低,大模型起到的效果越少。所以我们现在最看好的大模型应用方向是内容和社交这两个领域,因为内容社交领域的容错率非常高,在文生图中把一个人画成五根指头或者六根指头都是可以忍耐的。但如果在金融领域应用大模型,哪怕只少算了一个小数点,带来的损失却是几百亿。
另外,行业小模型的发展也极具潜力,每个行业的数据质量千差万别。举个例子,大家知道GPT-4用的数据主要来自大的数据集,虽然英文数据集的质量比中文高,但是中文有一类数据集远远超过英文,就是中小学的题库。由于在线教育的蓬勃发展,目前中小学的中文数量大概有近1.5亿道题,全世界其他任何一个语种都没有这么多的中小学各科的题库。但由于中国题库的数据质量没有经过处理,大多数的题仍然是以图片格式而存在,所以各科题库的数据没有办法被大模型所使用。所以我们当初在做题库数据预处理的时候,就花了大量的时间去撰写图片。而且我们很多题库只有问题和答案,没有中间的解题步骤,所以大模型就没有办法理解为什么、以及这道题的答案是多少。
预训练大模型的能力也决定了AIGC的能力,我们中国和海外在路径上也有一些差异:海外是研发先行,中国是模型+应用同步研发,但也是走得非常蓬勃。
下面简单介绍一下昆仑万维的情况。目前我们分成海外信息分发与元宇宙,旗下有全世界第三大浏览器Opera,我们的通用人工智能与AIGC板块与奇点智源在4月17号还合作发布了天工大模型,还有一部分是科技股权投资。
我们从2020年就开始投入预训练大模型的研发,在2020年6月份GPT-3.0发布以后,我们认识到内容领域的拐点已经到来,所以我们成立了一个团队开始做中文预训练大模型研发,跟奇点智源合作自研国产大语言模型,不仅在去年底开源了一些中文的预训练模型,还在今年4月17号正式发布了国产大语言预训练模型-天工。天工大模型有几大优势,比如支持1万字以上的文本对话;实现20轮以上的问答交互;擅长语义理解、文本写作,实测能力出众等。
最后给大家分享一下我们对于大模型产业机遇的理解。
首先,在国内市场一定是2B和2C战略并重。但在海外,目前基于GPT大模型的盈利模式是订阅模式,有大量的人购买了OpenAI公司的服务。我们认为在中国这条C端的盈利模式应该是不成立的,因为中国的C端用户一定会使用免费的大模型服务,所以说国内的2C市场肯定是免费为王。
预训练大模型在B端可以做的工作非常多,而且从中国B端的企业市场历史来看,没有一家大模型可以垄断B端市场。因为B端市场的碎片化程度非常高,各行各业、各种各样的数据需要进行的预处理和再加工能力是非常难以统一化的。我们认为所有做预训练大模型的公司,除了能够提供一个良好的底座大模型以外,如何快速地帮助各个行业赋能,即为各行各业补上欠缺的“解题步骤”,比如行业数据再加工、行业数据的补齐等,就能在很多行业起到赋能的作用。
我们认为首先得到赋能的行业应该是拥有大量成熟的序列化文本数据的行业,比如金融行业、教育行业等,这些行业一定是第一波在预训练大模型里得到加持或者赋能的行业。此外,我们还认为底座大模型企业将向头部汇聚。
在海外市场,我们是面对2C市场,2C市场的逻辑跟其他企业不太一样。我先说一下我们的背景,我们的出海经验非常丰富,我们拥有丰富的海外C端市场拓展经验,以及庞大的用户群。目前很多中小企业的创业是做各种各样的B端工具,去帮其他的企业降本增效,我们认为在C端,这样的创业机会非常多,也非常适合中小企业来做,但对于我们这样的企业,去做B端工具来降本增效,其实它的天花板不会特别高。
现在所有的B端工具生成的都是素材,而不是内容,生成的图片是最终用户不能直接消费的,必须把这些图片素材通过二次加工才能变成用户最终可以消费的内容。而用户最终能消费的内容形态也不多,从小说到漫画,从音乐到视频,以及视频里包含的短视频、长视频、电影、电视、动画等领域,我们认为这才是C端市场最终可以消费的内容。所以我们的目标也非常明确,我们将基于天工大模型提供端到端的内容生成工具,对于最终用户来说,由于他完全不会懂技术细节,所以我们必须把所有的技术细节都隐藏起来,同时让用户创作内容的成本降到极低。
现在能看到的文生图、图片生成等都已经比较成熟了,下一步AIGC工业产品上的皇冠肯定是视频生成。我坚信在1-2年之内,这些问题都会得到解决。像宫崎骏这样的导演不再需要雇佣200人以上的动画团队,花费两年的时间制作一部顶级动画片。届时规模人数会呈10倍的下降,日常消费的小说、漫画、短视频、音乐等领域,所有的创作范式将会被改变,能够创作音乐、视频、影视的人群将急速扩大,优秀的内容产出也将更多。
最后,在应用场景方面,就像我前文说的,永远是容错率高的场景最先落地,容错率低的场景落地稍晚一些。希望大家都能够在AIGC或者AGI的通用大潮中寻找到自己志同道合的人,并最终创造出改变世界的产品。
黑马AIGC产业营
读懂AIGC底层逻辑,一步接入产业未来
3大核心认知,6大前沿主题
(扫描下图二维码,即刻加入)
↓↓↓