硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有的东西
“大家好,我是刘强东,今天是不(bù)是看起来有(yǒu)些不同?很久没(méi)直播,还(hái)有些许紧张……话(huà)不多说,老刘的数(shù)字直播带(dài)货现(xiàn)在开始。”4月16日,京 东创始人刘强东在京东平台开启数字人直播。
“东哥”数字人直播,迅速引 起广泛(fàn)关注,数字人替代真人直播的时代来临了吗?
4月18日,数字人头部厂商硅基智能创始(shǐ)人司(sī)马华鹏接受了《每(měi)日经济新闻》记者的专(zhuān)访。司马华鹏表示:“刘强东这次数字人直播,对我们行业是非(fēi)常大(dà)的品牌宣传。他使用(数字人直播),说明(míng)这个行业(yè)得到了一次非常重要的认可。”
对(duì)于AI的使用,司马华鹏建议(yì):“未来(lái)所有使用AI的人,应该专注到人类特有的(de)东西,比(bǐ)如创意,比(bǐ)如(rú)有温度的东西。”
拆解数字人技术
“数字人刘强东”是否有硅基(jī)智能技术的支持?司马华鹏表示:“我们不太方便对外(wài)公开,但这些技术最早的开创者肯(kěn)定是我们。我们在整个(数字人)直播上大概有40多项发明专利,在申请的也有几十项(xiàng)。现在行业内有很多在使用我们的技术授权,也(yě)有很多在(zài)使用硅基智能(néng)的 API(应用程序编程接口)。”
“东哥”数字(zì)人究竟是如何打(dǎ)造出来的?司马华鹏介绍:“它(数字人)这些内容(róng)是用AI渲染出来的。如果现在想做东哥同款(kuǎn),你需要提供几分钟的视频。然后我(wǒ)们会将其训练成一(yī)个数字人模型。这个数字人模型(xíng)背后,将由大模型驱(qū)动它。定时去上一些产(chǎn)品、定时回复一(yī)些客户需求、定时作一些记录,这(zhè)些都是(shì)事先做好的剧本,这些剧本(běn)实质(zhì)由大模(mó)型驱动,比(bǐ)较接近于人(rén)类的行为和反馈。”
那么,除了(le)上述AI渲(xuàn)染技术外,数字人直播还需要哪些技术支持?司(sī)马华鹏称:“我们(men)的大模型是(shì)多(duō)模态的,是(shì)文本生成、声音(yīn)生成(chéng)和数(shù)字人生成的结合(hé)。其实很多人在反馈,他(刘强东)声音(yīn)和节奏感(gǎn)与(yǔ)他原来讲话(huà硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有的东西)不太一样。这很可能克(kè)隆的是平时的语速,但是直播(过程中),一个用户停留时长(zhǎng)是(shì)比(bǐ)较 短的,你必须在很短时间内把大量的信息(xī)披(pī)露出来,所以(yǐ)必须把声音放得(dé)快一些。”
对于语音合成技术,司马华鹏(péng)表(biǎo)示:“我们全部技术都是自己的。从目前端到端的生成来讲,(语(yǔ)音合(hé)成)已经是一个非常成熟(shú)的技术。”
数字人形象(xiàng)、语音合成(chéng),都是外在展(zhǎn)现形式,数字人直播内容仍旧离不开文本。对于文本,司(sī)马华鹏称:“文本大(dà)模型方面,我们基本(běn)上都(dōu)是原 创的技术(shù),最(zuì)近‘炎帝’大模型刚刚通过网信办的备案。”
能否替代真人直播?
目前(qián),大家看到的直播带货,很可能就是数字人。司马华鹏介绍(shào):“我们在(zài)2021年开创(chuàng)AIGC直播的大方向,(刘(liú)强东数字人(rén))基(jī)本上是我们(men)2023年产品能够呈(chéng)现出来的效果,这样(yàng)的直(zhí)播间我们已(yǐ)经卖掉了上万个,京东、淘宝、抖音(yīn)、快(kuài)手和视(shì)频号平台都有(yǒu)。”
真人直播会面临 各种(zhǒng)复杂场景,特(tè)别(bié)是情感交流,数字人可以做到吗?司马华(huá)鹏表示:“我(wǒ)们在看东哥直播的时(shí)候,会不会把(bǎ)他(数字人)当作真正的东哥来看,这 是决定数字人智能化程度的(de)重要标志。从开播到(dào)现(xiàn)在,行业有(y硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有的东西ǒu)非(fēi)常多的评(píng)价,大家觉得还是能(néng)看到一些(xiē)机械的痕迹。”
“这个(数(shù)字人)行(xíng)业(yè)发展的核(hé)心就是‘看不出来’。”司马华鹏强调。
其认为:“我们现 在也有大量的直(zhí)播间,效果比这个(刘强东数字人)要好很多。如果(guǒ)他这个直播不是在自家平台,而是在其他平台(tái),很(hěn)容(róng)易被机器识别出来(lái),很(hěn)快就会被限(xiàn)流。”
因此,在司马华鹏看来,数字人行业的核心是让(ràng)整个(gè)直(zhí)播间符合图灵测试。对于数字(zì)人(rén)行业的发展,其认为(wèi):“(该领域)图灵测(cè)试(shì)1.0是分不(bù)清(是人类还(hái)是AI);图灵(líng)测试2.0则是双向情感交互;图灵测 试3.0就是‘死生相契’,未来我们与AI之间,可能是Soul Mate(心灵伴侣)的关系,它是你非常重要的助手(shǒu)、朋友,也可能是你亲密的合(hé)作伙伴。”
目前,很多问答(dá)式大模型(xíng)主要给受众提供专业类辅助,但若诉诸情感(gǎn),是否兼具图像、声音和文本(běn)的多模态大模型更具优势(shì)?对(duì)此,司马华鹏表示认可。“人类(lèi)大脑(nǎo)的设计(jì)中,90%以上是针对图形,所以我们说 有图有真相。基于文本,产生的是(shì)想象力,(阅读文本)的能力确实非常重要,但对大部分(fēn)人而言,(自己(jǐ)的(de)大脑)生成图片,然后再(zài)想象出一个空(kōng)间,还原出这个东西,是非常累的(de)。因此,多模态或者视频化交互(hù)能力,能(néng)够大大降低我们之间信息沟通对 应的脑力消耗。”
对于未(wèi)来(lái)AI电商的形态,司(sī)马华鹏认为,未来更大(dà)的价(jià)值是专业(yè)性。比如说,假设我们在食(shí)品领域有一个很好(hǎo)的AI专家(jiā),它可(kě)以从数据、算法的(de)角度给我们提(tí)供很多的专业内容(róng)。这样的专家,它(tā)带来的影响力会超过(guò)现有的人类专家,这会带来真正(zhèng)的、更好的(de)电硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有的东西商交易。
其进一步解释称:“人类在做很多行为的时候(hòu),有一(yī)定的(de)偏(piān)颇或者(zhě)偏见,或者带有一定的商业目(mù)的。而以数字和算法驱动的AI专家(jiā),会成为我们的(de)朋友、我们的伙伴,很(hěn)有可能成为AI电商未来的主流(liú)。现在(zài)这些成本还比较高,只是出现在奢侈品领域。我希望未来每一类小产品上,都有这样一个专家顾(gù)问(wèn),来给我们提供非常(cháng)好(hǎo)的沟通交流方式。这是AI电商未来非常重要的(de)一部分。”
未经允许不得转载:天津电机维修_天津进口电机维修_天津特种电机维修_天津发电机维修 硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有的东西
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了