硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有的东西
“大(dà)家好,我是刘强东,今天是不是看起来有些不(bù)同?很久没(méi)直播(bō),还(hái)有些许紧张……话不多说,老刘的数(shù)字直播带货现在(zài)开始。”4月16日,京东创始人刘(liú)强东在(zài)京东平台开启数字人直播。
“东哥”数字人直播,迅速引起广泛关注(zhù),数字(zì)人替代真人直播的时代(dài)来临了(le)吗(ma)?
4月(yuè)18日,数字人(rén)头部厂商硅基智能创始人司马华鹏接受(shòu)了《每日经济 新闻》硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有的东西记(jì)者的专访。司马华鹏表示:“刘强(qiáng)东这次数(shù)字人直播(bō),对(duì)我们行(xíng)业是非常(cháng)大的品牌宣传(chuán)。他使用(数字人直播),说(shuō)明这个行业得到了一次非常重要的认可。”
对于AI的使(shǐ)用(yòng),司马(mǎ)华鹏建议:“未来所有(yǒu)使用AI的人,应该(gāi)专注到人(rén)类特有的东西,比如创意,比如有温(wēn)度的东西。”
拆解数字人(rén)技术(shù)
“数字人刘(liú)强(qiáng)东”是否有硅(guī)基智能技术的支持?司马华鹏表示:“我们(men)不(bù)太方便对外公开,但(dàn)这些技术最早的开创者肯定是我们(men)。我们在整(zhěng)个(数字人(rén))直播上大概(gài)有40多项发明专利,在(zài)申请的也有几十项。现在行业内有很多在使用我们的(de)技术授权,也有很多(duō)在使用硅基智能的API(应用程序编程接口)。”
“东哥”数字人究竟是如(rú)何打(dǎ)造出来的?司马华鹏介绍:“它(数字人)这些内容是(shì)用AI渲染(rǎn)出来的。如果现在(zài)想做东哥同款,你(nǐ)需要提供几分(fēn)钟的视频。然后(hòu)我们会将其(qí)训练(liàn)成一个数字人模型。这个数(shù)字人模型背后,将由大模型(xíng)驱(qū)动它。定时去(qù)上一些产品(pǐn)、定时回复一些客户(hù)需求、定时作一些记(jì)录,这(zhè)些都是事先做好的剧本,这些(xiē)剧 本实质由大模型驱动,比较接近于(yú)人类的行为和反馈。”
那么,除了上述AI渲染技术外,数字人直播还需要哪些(xiē)技术支(zhī)持?司马华鹏称:“我们的大模型是多模态的,是(shì)文本生成、声音(yīn)生(shēng)成和数(shù)字人生(shēng)成 的结(jié)合。其实很多人在反馈,他(刘(liú)强东)声音和节奏感与他原来讲话不太一样。这很(hěn)可能克隆的是平时的语速,但是直(zhí)播(过程中),一个用户停留时长 是比较短的,你必须在很短时间内(nèi)把大量的信息披露出来,所以必须把声音放得快一些。”
对(duì)于语(yǔ)音合成技术,司马华鹏表示:“我们全(quán)部(bù)技术都是自己的(de)。从目前端到端的生成来讲(jiǎng),(语音合成)已经是(shì)一个非常成熟的技术。”
数字人形象、语音合(hé)成,都是(shì)外在展现(xiàn)形式,数字(zì)人(rén)直播内容(róng)仍(réng)旧离不开文本。对于文本,司(sī)马(mǎ)华鹏称:“文本(běn)大(dà)模型方面,我们基本上都是原创的技术,最近(jìn)‘炎帝’大模型刚刚通过网信办的备案。”
能否替代真人直播?
目前,大家看到的直播带货,很(hěn)可能就是(shì)数字人。司马华鹏介绍(shào):“我们在2021年开创AIGC直播的大方向,(刘强东数字人)基(jī)本上是我们2023年产品能够呈现出来的效果,这样的(de)直(zhí)播 间我们(men)已经卖掉(diào)了(le)上万个,京东、淘宝、抖音、快手和视频号平台都有。”
真人直播会面临各种复杂场景,特别是情感交流,数字 人可以做到(dào)吗?司马华鹏表示:“我们在看东哥直播的(de)时候,会不会把他(数字人)当(dāng)作真正 的东哥来(lái)看,这是决定数字人智能化程度的重要标志(zhì)。从开播到现(xiàn)在,行业有非常多的评价,大家觉得还是能看到一些机械的痕迹。”
“这个(数(shù)字人)行业发展的 核心就是‘看不(bù)出来’。”司马华鹏强调。
其认(rèn)为:“我(wǒ)们现在也有大量的直播间,效果比这(zhè)个(刘强东数字人)要好很多。如果他这个直播不是在(zài)自(zì)家平台,而(ér)是在其他平(píng)台,很容易被(bèi)机(jī)器识别出来(lái),很快就会被限流。”
因此(cǐ),在司马(mǎ)华鹏看来,数字人行(xíng)业的核心是让整个直播间符合图灵测试(shì)。对于数字人行(xíng)业的(de)发展(zhǎn),其认为:“(该领域(yù))图灵测(c硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有的东西è)试1.0是分不清(是(shì)人类还是AI);图灵测试2.0则是(shì)双向(xiàng)情感交互(hù);图(tú)灵测试3.0就是(shì)‘死生相契’,未来我(wǒ)们与AI之间(jiān),可能是Soul Mate(心灵伴侣)的关系,它是你非常重要的助(zhù)手、朋友,也可能是你(nǐ)亲密的合作(zuò)伙伴。”
目前,很多问(wèn)答式大模型主(zhǔ)要(yào)给受众提供专业(yè)类辅(fǔ)助,但若诉诸情感,是否兼具图像、声音和文本的多模态(tài)大模型更具(jù)优势?对此,司马华鹏(péng)表示认可(kě)。“人类(lèi)大脑的设计中,90%以(yǐ)上(shàng)是针对图(tú)形,所以我们(men)说(shuō)有图有真相(xiāng)。基于文本,产生的是想象力,(阅读文本)的能(néng)力确实(shí)非(fēi)常重(zhòng)要,但对(duì)大部分(fēn)人而言,(自己的(de)大脑)生成图片,然(rán)后再想象出一个空(kōng)间,还原出这个东西,是非常累的。因此,多模态或者视(shì)频化交互能(néng)力,能够大大降低我们(men)之间信息沟通对应的脑力消耗(hào)。”
对于未来AI电商的形态(tài),司马华鹏认为,未来更大(dà)的价值是专业(yè)性。比如说,假设我们在(zài)食(shí)品领域有一个很好的 AI专家,它可以从数(shù)据(jù)、算法的角(jiǎo)度给我(wǒ)们(men)提供很多的专业内容。这样的专家,它带来 的影响力会超过现有的人类专家,这会(huì)带来真正的、更好(hǎo)的(de)电商交易。
其进一步解释称:“人类在做很多行为的(de)时候,有一定的偏颇或者偏见,或者(zhě)带有(yǒu)一(yī)定的商业目(mù)的。而以数字和算法驱(qū)动的AI专家,会成为我(wǒ)们的朋(péng)友、我们的伙伴,很有可能成为AI电商未来(lái)的主(zhǔ)流。现在(zài)这些成本还比较高(gāo),只是出现在奢侈品领域。我希望未来每一类(lèi)小产品上,都有(yǒu)这样一个(gè)专家顾问,来给我们(men)提供非常好的沟通交流方式。这是AI电商未来非常重要的一部分。”
未经允许不得转载:天津电机维修_天津进口电机维修_天津特种电机维修_天津发电机维修 硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有的东西
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了