推广 热搜： 免费网赚论坛中国网赚网赚qq群福缘网赚如何网赚网赚博客酷我网赚在家上网赚钱外国网赚网赚任务平台

首页 > 资讯 > 教程 > 创业指南

亲测百度文心一言，没有惊喜

日期：2023-03-20 16:36:29 浏览：47

核心提示：亲测百度文心一言，没有惊喜

勇气可嘉，功力尚浅。

3月16日，百度创始人、董事长兼首席执行官李彦宏亲自上阵，为大家揭开了百度文心一言的面纱。随后，外界对文心一言的讨论都没有停止，百度的股价也跟着起起落落。

首先是发布会进行到半个小时左右，百度的股票就下跌超过7%，甚至一度跌破10%。这似乎源自被寄予厚望的文心一言在产品力上让外界略有失望，尤其是文心一言的展示并不是“直播”而是“录播”。

图/百度股价走势图（3.16日）来源/老虎证券燃次元截图

“作为一个交互产品，演示都不是现场的，这会让投资者和意向用户的体验大打折扣，也会不禁让人怀疑，百度自己是不是对产品都没有100%的信心。”一位看了全场直播的从业者聊起发布会的感受时，如实说道。

而随着发布会结束，第一批用户对文心一言开始了真实地测试后，百度股价有所回升。截至3月19日，百度港股股价报收142.2港元/股。一位百度工作人员对燃次元表示，“很多人都说文心一言实测体验比发布会看起来好很多。”

除了简单的测试，有才的网友们开始抛出五花八门的问题，把文心一言与ChatGPT作比较。比如“什么工作钱多活少离家近？”“模仿李白的《将进酒》写一首诗，主题是肯德基疯狂星期四。”而针对这些问题，文心一言给出的回答，颇令网友满意。

不过，也有一部分网友对文心一言的能力提出质疑。小红书ID为“易安学姐”的用户评价道，“文心一言的回答完全没有上下文链接。”网友makima评价道，“百度真的有测试过自己的AI吗？是放出来让别人替它训练吗？”

图/网友测试文心一言与ChatGPT对比图来源/小红书燃次元截图

与此同时，燃次元与多位测试文心一言，以及使用过ChatGPT的用户进行了交流后发现，大家对文心一言的看法很自然地分成了两派——鼓励派和批判派。

鼓励派表示，“ChatGPT对行业带来的场景化和用户习惯的改变将会是颠覆性的，文心一言的诞生是大势所趋，也是未来的趋势。”

批判派则反之，“文心一言在信息库更新、底层数据质量上和ChatGPT有很大的差距。且由于规范性不明确，从长远来看，并不看好国内ChatGPT类产品的发展。”

对于大家的批评，李彦宏表示，“文心一言并不完美，因为有市场需求，所以现在发布。大预言模型一旦发布，迭代速度会非常快。”

事实上，不论对文心一言看好还是看坏，市场对百度推出文心一言的原因都心知肚明。面对放缓的营业收入增速，和逐渐显现的人口红利天花板，百度急需第二增长曲线的切入口。

然而，尚不成熟的文心一言能成为这个切入口吗？国内大厂纷纷布局ChatGPT下，其商业化又有什么难以突破的瓶颈？

带着这些问题，燃次元也开始了对文心一言的测试... ...

01 文心一言，就这？

“感谢百度，我的工作保住了。”百度文心一言发布会结束后，一位投行人员打趣地对燃次元表示。

ChatGPT横空出世后，打工人最关心的问题莫过于，“如何利用ChatGPT赚钱”，以及“如何不被ChatGPT取代后赚不到钱”。

而百度文心一言的发布，无疑是给大家吃了颗“定心丸”。

但玩笑归玩笑，自文心一言推出后，确有不少人将它和ChatGPT尤其是GPT-4进行比较。在第一时间拿到文心一言的测试码后，燃次元便让其为汽车品牌极氪的车型“极氪001”写一则广告文案。文心一言迅速给出了回答，“极氪001，超越想象！”

相比之下，燃次元在文心一言发布前一周，问过ChatGPT类似的问题，“为理想L7写一份宣传语”，ChatGPT给出的回答，虽说不是完美，但却也包含了对理想L7性能的介绍以及亮点的总结。

当然，文案风格上，各花入各眼，没法评论好坏，文案的“功底”也很难评胜负。但就核心优势总结、对文案本身的内容理解，以及在信息的准确性和及时性等可以明确量化的方面，ChatGPT似乎略胜一筹。

燃次元曾让ChatGPT帮忙整理特斯拉已经发布的所有车型。根据ChatGPT的结果，其按发布时间分别罗列了Roadster、 Model S、 Model X 、Model 3和 Model Y。除了车型，还包括发布时间和性能简介。

然而，当燃次元把同样的问题，抛给文心一言时，文心一言不仅没能给出车型发布的时间，甚至连车型都没能给全，少了Model Y和Roadster。

图/上：文心一言回答；下：ChatGPT回答来源/燃次元截图

与此同时，文心一言提供的信息也不完全准确。

当燃次元要求其“整理理想汽车2022年交付数据”时，文心一言回答，“理想汽车在2022年共交付了100054辆纯电动车型……”但事实上，理想并未推出纯电车型，当燃次元进一步说明其错误时，文心一言也没有及时修正。

图/文心一言回答燃次元截图

当然，在类ChatGPT的产品中，回答出现事实性错误的，也并非只有文心一言一家。

此前，谷歌推出的Bard也出现了类似错误。对此，技术专家林宇表示，深度学习模型的输出结果会有不可解释性，这与其学习模型的属性有关，所以，类似的错误会有一定的出现概率。

除此之外，文心一言对同样问题的理解能力也会出现偏差。

比如，燃次元在体验其发布会上展示的图片输出功能时，就屡屡碰壁。最开始，当发出生成海报、图片等指示时，文心一言在超过30秒钟的加载后都会显示，“当前与我互动的人过多，请稍后再试。”

随后，当燃次元要求文心一言为迪士尼画一张海报时，文心一言却输出了语言描述的回答；当再次要求其用图片展示上述回答的时候，出现的海报却与迪士尼没什么关系。而再一次做出尝试，让其为迪士尼画一张海报时，终于，一张更类似迪士尼画风的画作被展现。

图/文心一言回答燃次元截图

同一个问题得不到准确的回答或得到的答案不同，这或许与文心一言测试版的不稳定性有关。但也意味着，文心一言的底层理解能力尚待提升。

02 ChatGPT的“大混战”

就在文心一言的理解能力被多方调侃时，GPT-4的能力已经惊艳到了第一批试用用户。

海外投资经理科林表示，“我将一份长文的超链接发给GPT-4并要求其解读，GPT-4不但可以完全理解我的重点，还能将长文中的重点准确地摘取和总结出来。”

科林进一步表示，GPT-4在响应时间和文字承载量上也有很大进步，可以接受上限达2.5万字的长文，“对于我这种每天都要读几百页文字的金融从业者来说，非常有用，其会大大提高我的生产力。目前，我还在不断探索工具更多的可能性。”

图/GPT-4的回答来源/科林供图

在GPT-4被用户追捧的同时，微软也推出了AI助手Copilo。结合GPT-4，AI功能被直接集成到Word、Excel、PowerPoint、Outlook和Teams等应用中。用户可以提出问题，将文字提炼、转化、生成PPT等，被称为“打工人的福音”。

北大在读博士小孔看完了Copilo的展示后感叹道，“我们要学习的东西还有很多。在我看来，将来不会使用ChatGPT类工具的人，在研究上效率会非常低。”

不只微软，谷歌、腾讯、科大讯飞、美团等多家国内外大厂都在陆续布局ChatGPT。一位脉脉从业人员对燃次元透露，从今年2月份开始，包括百度、阿里、腾讯等在内的科技巨头，都在陆续招聘ChatGPT相关的AIGC岗位，很多猎头也纷纷下场，最高开出了10万元的月薪。

BOSS直聘上，也有美团、BOSS直聘、百度文心产品线等企业和项目在招ChatGPT相关岗位。

图/BOSS直聘招聘来源/燃次元截图

大厂为什么会在这个时候纷纷布局ChatGPT？

在科林看来，重要因素有两个。“第一是大厂们自身业务增长困境。以百度为例，百度整体的营收增速水平从2021年第一季度的24.79%下滑至2022年第四季度的0%。而作为百度主营业务的线上广告业务，收入在2022年更是出现了6%的同比下滑。”

数据来源/百度财报燃次元制图

“除此之外，更重要的是ChatGPT带来的应用场景的迭代。”科林进一步分析，“ChatGPT会彻底改变人们工作的方式，尤其是以搜索引擎为基础产品的百度。与其说百度布局ChatGPT，不如说布局ChatGPT是百度顺应时代的必要之举。而搜索引擎和ChatGPT本身的自然语言对话形式很相近，对于接入ChatGPT有属性上的天然优势。”

欧科云链研究院高级研究员蒋照生补充道，通过AI技术的落地，可以解决C端用户很多实际需求，比如大大提升工作、学习效率和生产力。

“大厂通过布局ChatGPT可以触达更多有需求的C端用户，不仅可以扩大自己的用户市场占有率，也可以进一步向TOC、 TOB等多种形式的商业化探索。”

03 让ChatGPT多“飞”一会

不难看出，未来ChatGPT或将是一项可以改变世界的技术，但大厂想要用ChatGPT实现新的突破，还需要经过重重考验。

首先，是信息的准确性。不论是向用户收费还是向企业收费，产品一旦开始收费，用户对失误率的包容性就会减弱。现在，大家还会对文心一言、ChatGPT偶尔的失误回答吐槽、打趣，但如果打工人利用这项工具输出工作内容，却发现错漏百出，那彼时，这种失误就会从“笑话”变成“事故”。

对此，科林直言，“大模型输出内容的准确性和及时性与其底层数据质量有极大的关系。目前国内类ChatGPT产品的底层数据质量尚待提升。”

其次，是产品的规范性。蒋照生分析，国内很多类ChatGPT产品的系统依然存在不稳定性，这最后会导致生成内容质量不一致。燃次元多次向文心一言发出相同请求，得出不同回答就是个典型的例子。对于商业化产品，这种不稳定性会存在风险。

再次，如何保证ChatGPT类产品的原创性、避免版权问题，以及保证ChatGPT类产品输出的内容符合法律和道德标准，也是不得不重视的问题。蒋照生补充道，以AIGC为例，大多数AIGC系统仍然缺乏创造力，不能独立生成原创内容，只能根据给定的模板或指导内容生成相关内容。

而ChatGPT作为人工智能工具，是没有任何“道德”标准的，开发者需要避免ChatGPT类产品给出的回答不与主流价值观相悖。林宇表示，“摘除一些敏感词汇的标签，是其中一个方式，但一个标签所衍生出的内容很广泛，摘除一个标签对于大模型学习的影响是极大的。这中间尺度的把握，是个挑战。”

除此之外，大模型所需要的海量算力，需要资金、人才、软硬件设施等各个环节的配合，缺一不可。

最重要的是，大厂如何能开发出让用户可以实际体验到有改变的ChatGPT类产品？比如，把一个PDF扔进ChatGPT，后者能生成一个准确概括重点内容的PPT，这是有效工具。但和ChatGPT闲聊，得出一些百度百科都能给出的信息，这只是“虚假”的创新。

尽管目前来看，规模化的商业变现对ChatGPT产品来说，还需要一段距离。但是，ChatGPT已经可以给一些业务和行业带来改变，帮助大厂优化成本、提升用户体验。

林宇、科林等多位业内人士均对燃次元表示，机械性高、重复性强的工作是可以利用ChatGPT优化的——人工客服就是最典型的一项。“事实上，现在已经有很多企业采用人工智能客服，但是他们能够理解的问题还是非常有局限的。ChatGPT可以理解更长、更复杂的问题，且交互形式更自然，能够进一步优化用户体验。”

而ChatGPT类产品，本身也会随着用户使用频次的增多，不断学习、更新。以百度文心一言为例，在公开测试后的短短几天，就已经有所进步。

比如，3月16日晚，燃次元第一次要求文心一言整理出百度公司2022年的现金流情况时，文心一言似乎并不能理解“整理”的意思。而到了3月18日下午，燃次元再次问出相同的问题时，文心一言已经可以准确理解问题并给出了百度现金流的信息。

图/文心一言回答燃次元截图

由此不难看出，文心一言在不断地学习和纠错。

其实，不管是文心一言，还是其他类ChatGPT产品，是“黑”是“吹”都为时尚早。ChatGPT无疑是颠覆性的创新，但谁能因此获利，“子弹”还得再“飞”一会才能见分晓。

*文中林宇、科林均为化名。

文章链接：http://900614.com/news/show-17682.html 内容来源:

标签： 创业小项目个人创业

更多>同类资讯

推荐图文

推荐资讯

点击排行

• Sora降世，短视频真的会更好吗？	• 红杉高瓴加持，苏州又将诞生一个明星IPO
• 被罗永浩质疑抄袭，荣耀急需拥有技术优势	• 中老年人开始“统治”直播间
• 哈尔滨，整活儿了	• 2023年，互联网没有顶流
• 靠情怀收割的“怀旧零食”，能走多远？	• 美团的酒，抖音要干了
• 出海中东，泛娱乐社交不可错过的“年末赛点”	• 峰瑞资本李丰：AI在中国怎么应用？历史上能找到