百度文心一言是干嘛的?

燃次元(ID:chaintruth)原创作者 | 吕敬之编辑 | 曹杨3月16日,百度创始人、董事长兼首席执行官李彦宏亲自上阵,为大家揭开了百度文心一言的面纱。随后,外界对文心一言......

百度文心一言是干嘛的

百度文心一言(ERNIE Bot)是百度基于文心大模型技术推出的生成式对话产品,于2023年8月31日面向公众开放。作为一款生成式对话产品,百度文心一言可以为用户提供多种功能和应用......接下来具体说说

百度文心一言首次亮相!还对标不了ChatGPT,但别急着失望

最近 AI 真是火得没边了。

OpenAI 靠着 ChatGPT 实力吸睛,Google 带着 Bard 紧随其后,就在昨天,GPT-4 模型又抢尽风头。你方唱罢我登场的 AI 领域,今天,轮到了百度了。

百度文心一言是干嘛的?

就在今天下午,备受期待的百度文心一言如期而至。不过在发布会一开场,百度 CEO 李彦宏先给大家打了一剂预防针:

从某种意义上说百度为此(发布文心一言)已经准备了多年,我们十几年前就开始投入 AI 研究,2019 年就推出了文心大语言模型,今天的文心一言是过去多年努力的延续。

但也不能说我们完全 ready 了,文心一言要对标 ChatGPT、甚至是对标 GPT-4 的门槛是很高的,全球大厂还没有一个做出来的,百度是靠前个。我自己测试感觉还是有很多不完美的地方。

姗姗来迟的文心一言表现如何?和 ChatGPT 的差距有多少?能满足市场对中文大语言模型的需求吗?我们对它做了一次全方位解析。

新一代大语言模型、生成式 AI 产品文心一言,能做什么?

五大要点:

  • 文学创作;
  • 商业文案的创作;
  • 数理逻辑的推算;
  • 中文的理解;
  • 多模态生成。

针对这五大场景,李彦宏分别进行了演示。值得一提的是,这些演示并非现场操作,而是录播。

百度文心一言是干嘛的?

首先是文心一言的文学创作能力,李彦宏连续对文心一言提出了与《三体》相关的若干问题。

百度文心一言是干嘛的?

首先从演示视频看来,文心一言的回答速度很快,比 ChatGPT 快很多,另外出来的内容都挺不错的,后面我们也会把相同的问题扔给 ChatGPT 和必应 Chat,看看三者之间的区别。

百度文心一言是干嘛的?

▲动图未加速

针对商业文案创作,李彦宏向文心一言提问:

如果要成立一个用大模型服务中小企业数字化升级的科技服务公司,可以起个什么公司名?

以下是它的问答。

百度文心一言是干嘛的?

别说,还挺像样的。

还能用它生成新闻稿,可以说是把 AI 从头用到脚,很符合这家公司的定位。

在数理逻辑推演环节,百度问了个鸡兔同笼的问题,文心一言先是发现了题目出错,后来换了个题目,它就能准确回答出来。

文心一言发布前,已经有人猜测这个语言模型会比 OpenAI、Google、微软做得更好,因此百度也在这部分炫了个技,文心一言不仅准确回答了成语「洛阳纸贵」的含义,还对背后的金融现象进行了解释,最后还用这个成语写了首藏头诗。

李彦宏在现场也提到,中文是文心一言的优势,反过来说,对英文素材的解析则成了它的劣势。

最后介绍了文心一言的多模态生成能力,画图、写长文、根据文字生成短视频内容,它都一一完成,这是 ChatGPT 所不具备的能力。

▲还能用生成方言语音

李彦宏还提到,百家号已经在利用文心一言的多模态生成能力,把文字内容视频化。

会后,首批用户通过百度提供的内测码,可以抢先体验到文心一言,我们已经提交内测申请,未来将在靠前时间给大家带来体验内容。

在这之前,我们把会上演示的几个场景,分别喂给了 ChatGPT(3.5 版)和 Bing Chat,看看他们输出的结果如何。

对比 ChatGPT&Bing Chat,文心一言体验如何?

演示过程中,李彦宏多次强调百度在中文语言的处理上,处于独一无二的位置。

相比 ChatGPT 和 Bing Chat,现在的最大的不同点在于多模态生成,即可以通过语言生成海报、语音甚至视频内容。

发布会演示中,李彦宏展示了使用文心一言生成活动海报、方言语音,并根据提问内容生成与活动相关的视频。不过生成视频的成本较高,现阶段尚未对所有用户开放。

图片、视频的生成能力确实让我们眼前一亮,李彦宏也表示,「多模态生成式 AI 是一个明确的发展趋势」。

除了这一特色功能,我们也很好奇其他能力相比 ChatGPT、Bing Chat 孰强孰弱,所以就用发布会中演示的内容去询问了 ChatGPT(3.5 版)以及 Bing Chat。先说结论:文心一言在中文领域的表现,确实要优于 ChatGPT、Bing Chat 这两个前辈。

首先是关于《三体》的提问,Bing Chat 和文心一言均能正确回答作者是谁、来自哪里的问题,而 ChatGPT 则把刘慈欣的籍贯错标成了山东。

有趣的是,Bing Chat 的信息来源是百度百科。

而在关于 2023 年初上演的《三体》电视剧版演员的问题中,信息库停留在 2021 年的 ChatGPT 再次吃瘪,表示《三体》电视剧暂未开拍,而 Bing Chat 则在豆瓣中找到了答案。

在商业文案创作方面,三者均可以给出它们的看法,ChatGPT 还贴心的附上了英文名,方便我们进行步入国际市场。

而 Bing Chat 则在靠前次询问时识别错了问题含义,没有给我准确的公司名,而是提供了如何起一个公司名的解决方案。

至于三家起的名字哪个更好,就留给大家评判了。

不论是 ChatGPT 还是 Bing Chat,它们在做数学题时并不能让我们完全放心,不过百度发布会中提到的鸡兔同笼问题并没有难倒二者,均准确的做出了解答。

相比之下,我更喜欢 Bing Chat 的解读,它更像是一位循循善诱的老师,而文心一言的回答则有点像课后的参考答案。

中文理解方面,文心一言的优势就体现出来了。

在询问「当时洛阳的纸到底有多贵」时,ChatGPT 误以为我询问的是唐代的物价,告诉我洛阳的纸一点都不贵,Bing Chat 识别上没有问题,但也没有给出准确数据。

而文心一言给出两三千文的价格,至少与我搜索得到的数据是一致的。

相信你也注意到了,且不说写的内容如何,ChatGPT 和 Bing Chat 都没有理解什么是藏头诗,相比下来,百度文心一言的表现确实出色。

当然,这样的比较对 ChatGPT 和 Bing Chat 是不公平的,毕竟我们还没有正式体验到文心一言,只是与发布会演示比较而已。获得测试机会后,我们会靠前时间体验文心一言,表现如何到时再见分晓。

李彦宏在发布会中也提到,虽然中文方面优势明显,但文心一言针对英文语种、代码场景的训练还不够多,表现也不够好,相信接下来百度会迅速提升。

脚踏实地,仰望星空

毫无疑问,文心一言的发布对于中文互联网来说是个标志性的事件。

正如李彦宏开场时所言,百度是推荐做出可以对标 ChatGPT 的产品的大厂,实现了中文语言大模型 AI 生成式产品从无到有的突破。

但另一方面,我们也需要正确看待文心一言与 ChatGPT 之间的差距。

我们今天所说的 ChatGPT,或者其背后的 GPT-4 语言模型,是一个花了 5 年时间、经历了 4 次迭代,完成了从量变到质变过程。想让文心一言在这么短的时间内实现赶超,几乎是不可能的事情。

从今天的发布会来看,文心一言并不是人们预期中那样具有**性的产品,而更像是对百度 AI 技术储备的一次中期考验,展现百度也有追逐最先进人工智能产品的研发能力。

面向公众开放后,文心一言可以通过用户们大量的搜索请求进行学习和改进,从而提升处理相应问题的准确性和速度。在 ChatGPT 上,我们已经见识过 AI 语言模型进化的速度。

亲测百度文心一言,没有惊喜

燃次元(ID:chaintruth)原创

作者 | 吕敬之

编辑 | 曹杨

3月16日,百度创始人、董事长兼首席执行官李彦宏亲自上阵,为大家揭开了百度文心一言的面纱。随后,外界对文心一言的讨论都没有停止,百度的股价也跟着起起落落。

首先是发布会进行到半个小时左右,百度的股票就下跌超过7%,甚至一度跌破10%。这似乎源自被寄予厚望的文心一言在产品力上让外界略有失望,尤其是文心一言的展示并不是“直播”而是“录播”。

图/百度股价走势图(3.16日)

来源/老虎证券 燃次元截图

“作为一个交互产品,演示都不是现场的,这会让投资者和意向用户的体验大打折扣,也会不禁让人怀疑,百度自己是不是对产品都没有100%的信心。”一位看了全场直播的从业者聊起发布会的感受时,如实说道。

而随着发布会结束,靠前批用户对文心一言开始了真实地测试后,百度股价有所回升。截至3月19日,百度港股股价报收142.2港元/股。一位百度工作人员对燃次元表示,“很多人都说文心一言实测体验比发布会看起来好很多。”

除了简单的测试,有才的网友们开始抛出五花八门的问题,把文心一言与ChatGPT作比较。比如“什么工作钱多活少离家近?”“模仿李白的《将进酒》写一首诗,主题是肯德基疯狂星期四。”而针对这些问题,文心一言给出的回答,颇令网友满意。

不过,也有一部分网友对文心一言的能力提出质疑。小红书ID为“易安学姐”的用户评价道,“文心一言的回答完全没有上下文链接。”网友makima评价道,“百度真的有测试过自己的AI吗?是放出来让别人替它训练吗?”

图/网友测试文心一言与ChatGPT对比图

来源/小红书 燃次元截图

与此同时,燃次元与多位测试文心一言,以及使用过ChatGPT的用户进行了交流后发现,大家对文心一言的看法很自然地分成了两派——鼓励派和批判派。

鼓励派表示,“ChatGPT对行业带来的场景化和用户习惯的改变将会是颠覆性的,文心一言的诞生是大势所趋,也是未来的趋势。”

批判派则反之,“文心一言在信息库更新、底层数据质量上和ChatGPT有很大的差距。且由于规范性不明确,从长远来看,并不看好国内ChatGPT类产品的发展。”

对于大家的批评,李彦宏表示,“文心一言并不完美,因为有市场需求,所以现在发布。大预言模型一旦发布,迭代速度会非常快。”

事实上,不论对文心一言看好还是看坏,市场对百度推出文心一言的原因都心知肚明。面对放缓的营业收入增速,和逐渐显现的人口红利天花板,百度急需第二增长曲线的切入口。

然而,尚不成熟的文心一言能成为这个切入口吗?国内大厂纷纷布局ChatGPT下,其商业化又有什么难以突破的瓶颈?

带着这些问题,燃次元也开始了对文心一言的测试... ...

01

文心一言,就这?

“感谢百度,我的工作保住了。”百度文心一言发布会结束后,一位投行人员打趣地对燃次元表示。

ChatGPT横空出世后,打工人最关心的问题莫过于,“如何利用ChatGPT赚钱”,以及“如何不被ChatGPT取代后赚不到钱”。

而百度文心一言的发布,无疑是给大家吃了颗“定心丸”。

但玩笑归玩笑,自文心一言推出后,确有不少人将它和ChatGPT尤其是GPT-4进行比较。在靠前时间拿到文心一言的测试码后,燃次元便让其为汽车品牌极氪的车型“极氪001”写一则广告文案。文心一言迅速给出了回答,“极氪001,超越想象!”

相比之下,燃次元在文心一言发布前一周,问过ChatGPT类似的问题,“为理想L7写一份宣传语”,ChatGPT给出的回答,虽说不是完美,但却也包含了对理想L7性能的介绍以及亮点的总结。

当然,文案风格上,各花入各眼,没法评论好坏,文案的“功底”也很难评胜负。但就核心优势总结、对文案本身的内容理解,以及在信息的准确性和及时性等可以明确量化的方面,ChatGPT似乎略胜一筹。

燃次元曾让ChatGPT帮忙整理特斯拉已经发布的所有车型。根据ChatGPT的结果,其按发布时间分别罗列了Roadster、 Model S、 Model X 、Model 3和 Model Y。除了车型,还包括发布时间和性能简介。

然而,当燃次元把同样的问题,抛给文心一言时,文心一言不仅没能给出车型发布的时间,甚至连车型都没能给全,少了Model Y和Roadster。

图/上:文心一言回答;下:ChatGPT回答

来源/燃次元截图

与此同时, 文心一言提供的信息也不完全准确

当燃次元要求其“整理理想汽车2022年交付数据”时,文心一言回答,“理想汽车在2022年共交付了100054辆纯电动车型……”但事实上,理想并未推出纯电车型,当燃次元进一步说明其错误时,文心一言也没有及时修正。

图/文心一言回答 燃次元截图

当然,在类ChatGPT的产品中,回答出现事实性错误的,也并非只有文心一言一家。

此前,谷歌推出的Bard也出现了类似错误。对此,技术专家林宇表示,深度学习模型的输出结果会有不可解释性,这与其学习模型的属性有关,所以,类似的错误会有一定的出现概率。

除此之外,文心一言对同样问题的理解能力也会出现偏差

比如,燃次元在体验其发布会上展示的图片输出功能时,就屡屡碰壁。最开始,当发出生成海报、图片等指示时,文心一言在超过30秒钟的加载后都会显示,“当前与我互动的人过多,请稍后再试。”

随后,当燃次元要求文心一言为迪士尼画一张海报时,文心一言却输出了语言描述的回答;当再次要求其用图片展示上述回答的时候,出现的海报却与迪士尼没什么关系。而再一次做出尝试,让其为迪士尼画一张海报时,终于,一张更类似迪士尼画风的画作被展现。

图/文心一言回答 燃次元截图

同一个问题得不到准确的回答或得到的答案不同,这或许与文心一言测试版的不稳定性有关。但也意味着,文心一言的底层理解能力尚待提升

02

ChatGPT的“大混战”

就在文心一言的理解能力被多方调侃时,GPT-4的能力已经惊艳到了靠前批试用用户。

海外投资经理科林表示,“我将一份长文的超链接发给GPT-4并要求其解读,GPT-4不但可以完全理解我的重点,还能将长文中的重点准确地摘取和总结出来。”

科林进一步表示,GPT-4在响应时间和文字承载量上也有很大进步,可以接受上限达2.5万字的长文,“对于我这种每天都要读几百页文字的金融从业者来说,非常有用,其会大大提高我的生产力。目前,我还在不断探索工具更多的可能性。”

图/GPT-4的回答

来源/科林供图

在GPT-4被用户追捧的同时,微软也推出了AI助手Copilo。结合GPT-4,AI功能被直接集成到Word、Excel、PowerPoint、Outlook和Teams等应用中。用户可以提出问题,将文字提炼、**、生成PPT等,被称为“打工人的福音”。

北大在读博士小孔看完了Copilo的展示后感叹道,“我们要学习的东西还有很多。在我看来,将来不会使用ChatGPT类工具的人,在研究上效率会非常低。”

不只微软,谷歌、腾讯、科大讯飞、美团等多家国内外大厂都在陆续布局ChatGPT。一位脉脉从业人员对燃次元透露,从今年2月份开始,包括百度、阿里、腾讯等在内的科技巨头,都在陆续招聘ChatGPT相关的AIGC岗位,很多猎头也纷纷下场,*高开出了10万元的月薪。

BOSS直聘上,也有美团、BOSS直聘、百度文心产品线等企业和项目在招ChatGPT相关岗位。

图/BOSS直聘招聘

来源/燃次元截图

大厂为什么会在这个时候纷纷布局ChatGPT

在科林看来,重要因素有两个。“靠前是大厂们自身业务增长困境。以百度为例,百度整体的营收增速水平从2021年靠前季度的24.79%下滑至2022年第四季度的0%。而作为百度主营业务的线上广告业务,收入在2022年更是出现了6%的同比下滑。”

数据来源/百度财报燃次元制图

“除此之外, 更重要的是ChatGPT带来的应用场景的迭代 。”科林进一步分析,“ChatGPT会彻底改变人们工作的方式,尤其是以搜索引擎为基础产品的百度。与其说百度布局ChatGPT,不如说布局ChatGPT是百度顺应时代的必要之举。而搜索引擎和ChatGPT本身的自然语言对话形式很相近,对于接入ChatGPT有属性上的天然优势。”

欧科云链研究院高级研究员蒋照生补充道,通过AI技术的落地,可以解决C端用户很多实际需求,比如大大提升工作、学习效率和生产力。

“大厂通过布局ChatGPT可以触达更多有需求的C端用户,不仅可以扩大自己的用户市场占有率,也可以进一步向TOC、 TOB等多种形式的商业化探索。”

03

让ChatGPT多“飞”一会

不难看出,未来ChatGPT或将是一项可以改变世界的技术,但大厂想要用ChatGPT实现新的突破,还需要经过重重考验。

首先,是信息的准确性 。不论是向用户收费还是向企业收费,产品一旦开始收费,用户对失误率的包容性就会减弱。现在,大家还会对文心一言、ChatGPT偶尔的失误回答吐槽、打趣,但如果打工人利用这项工具输出工作内容,却发现错漏百出,那彼时,这种失误就会从“笑话”变成“事故”。

对此,科林直言,“大模型输出内容的准确性和及时性与其底层数据质量有极大的关系。目前国内类ChatGPT产品的底层数据质量尚待提升。”

其次,是产品的规范性 。蒋照生分析,国内很多类ChatGPT产品的系统依然存在不稳定性,这最后会导致生成内容质量不一致。燃次元多次向文心一言发出相同请求,得出不同回答就是个典型的例子。对于商业化产品,这种不稳定性会存在风险。

再次,如何保证ChatGPT类产品的原创性、避免版权问题,以及保证ChatGPT类产品输出的内容符合法律和道德标准,也是不得不重视的问题 。蒋照生补充道,以AIGC为例,大多数AIGC系统仍然缺乏创造力,不能*生成原创内容,只能根据给定的模板或指导内容生成相关内容。

而ChatGPT作为人工智能工具,是没有任何“道德”标准的,开发者需要避免ChatGPT类产品给出的回答不与主流价值观相悖。林宇表示,“摘除一些敏感词汇的标签,是其中一个方式,但一个标签所衍生出的内容很广泛,摘除一个标签对于大模型学习的影响是极大的。这中间尺度的把握,是个挑战。”

除此之外,大模型所需要的海量算力,需要资金、人才、软硬件设施等各个环节的配合,缺一不可。

最重要的是,大厂如何能开发出让用户可以实际体验到有改变的ChatGPT类产品 ?比如,把一个PDF扔进ChatGPT,后者能生成一个准确概括重点内容的PPT,这是有效工具。但和ChatGPT闲聊,得出一些百度百科都能给出的信息,这只是“虚假”的创新。

尽管目前来看,规模化的商业变现对ChatGPT产品来说,还需要一段距离。但是,ChatGPT已经可以给一些业务和行业带来改变,帮助大厂优化成本、提升用户体验。

林宇、科林等多位业内人士均对燃次元表示, 机械性高、重复性强的工作是可以利用ChatGPT优化的——人工客服就是最典型的一项 。“事实上,现在已经有很多企业采用人工智能客服,但是他们能够理解的问题还是非常有局限的。ChatGPT可以理解更长、更复杂的问题,且交互形式更自然,能够进一步优化用户体验。”

而ChatGPT类产品,本身也会随着用户使用频次的增多,不断学习、更新。以百度文心一言为例,在公开测试后的短短几天,就已经有所进步。

比如,3月16日晚,燃次元靠前次要求文心一言整理出百度公司2022年的现金流情况时,文心一言似乎并不能理解“整理”的意思。而到了3月18日下午,燃次元再次问出相同的问题时,文心一言已经可以准确理解问题并给出了百度现金流的信息。

图/文心一言回答 燃次元截图

由此不难看出,文心一言在不断地学习和纠错。

其实,不管是文心一言,还是其他类ChatGPT产品,是“黑”是“吹”都为时尚早。ChatGPT无疑是颠覆性的创新,但谁能因此获利,“子弹”还得再“飞”一会才能见分晓。

*题图及部分内文配图来源于视觉中国。

*文中林宇、科林均为化名。

百度文心一言向全社会全面开放 它是什么 我们怎么用

百度文心一言(ERNIE Bot)是百度基于文心大模型技术推出的生成式对话产品,于2023年8月31日面向公众开放。

作为一款生成式对话产品,百度文心一言可以为用户提供多种功能和应用场景,例如问答系统、聊天机器人、语言翻译等领域。用户可以通过输入文字或者语音指令来与百度文心一言进行交互,获取相关信息或服务。

使用百度文心一言非常简单,只需要在百度搜索框中输入问题或指令,然后点击“一言”按钮即可启动百度文心一言进行对话。此外,百度还将在百度搜索App、百度地图、百度输入法等应用中集成百度文心一言服务,让用户更加方便地使用这项功能。

需要注意的是,百度文心一言是一种人工智能技术,其回答可能存在不准确或错误的情况。因此,用户在使用时需要谨慎对待,并注意信息的真实性和权威性。

除了基本的问答和聊天服务,百度文心一言还可以提供一些更高级的功能,例如:

文学创作:用户可以向百度文心一言提出创作需求,例如“写一篇关于春天的文章”,百度文心一言可以根据用户的需求进行文章创作。

商业文案:百度文心一言可以帮助企业撰写各种商业文案,例如广告语、营销策略、品牌策划等。

语言翻译:百度文心一言可以翻译多种语言,帮助用户快速翻译文本。

代码生成:用户可以向百度文心一言提出编程需求,例如“实现一个简单的排序算法”,百度文心一言可以生成相应的代码。

知识推理:百度文心一言可以基于已知知识进行推理,为用户提供更准确和实用的信息。

举一个例子来说明百度文心一言的应用。

比如,你是一个小型企业主,需要为你的企业制作一份商业计划书。你可以使用百度文心一言来帮助你完成这项任务。

首先,你可以在百度搜索框中输入“商业计划书”,然后点击“一言”按钮启动百度文心一言。接下来,你可以向百度文心一言提出你的需求,例如“帮我写一份针对目标市场的商业计划书”。

然后,百度文心一言会根据你的需求自动生成一份商业计划书。你可以根据实际情况进行调整和修改,直到你满意为止。

最后,你可以将商业计划书导出或者打印出来,或者将其保存到云端或者本地设备中。

以上就是百度文心一言是干嘛的?的详细内容,希望通过阅读小编的文章之后能够有所收获!

版权:本文由用户自行上传,观点仅代表作者本人,本站仅供存储服务。如有侵权,请联系管理员删除,了解详情>>

发布
问题