高峰:从私域AI到具身智能
专题(tí):2024中(zhōng)国AIGC创(chuàng)新发展(zhǎn)论坛
2024年服贸会专题论坛之一——“2024中国AIGC创新(xīn)发展论坛(tán)”于9月13日(rì)-14日在北京举行。智 子引擎产品副总裁高峰出(chū)席并(bìng)演讲。
高峰介绍,和大多数大模型企业(yè)一样(yàng),过(guò)去(qù)一 年,智子引擎在垂直领域中做了很多落地项目(mù),但经过内部复盘(pán),发(fā)现很多多模态大模型的能力其实还没(méi)有被企业(yè)充分利用(yòng)。传(chuán)统企业(yè)和(hé)我们AI大模型公司之(zhī)间,似 乎隔着一(yī)层“窗户纸(zhǐ)”。因此,公司(sī)决定走一条艰难但有效的路,这条路就是私域AI。“我们(men)重新思考,企业与AI公司的(de)关系不应该是供需关系,而应是共创关系”。
“积(jī)跬步,行千里(lǐ)”,高峰说,开发私域AI解(jiě)决方案的过程,也是在帮助Awaker逐步(bù)认识和理解世界。“我相(xiāng)信,当我们积 累到一定(dìng)程度时(shí),先进的生产力将会爆(bào)发,而那时我(wǒ)们就可以(yǐ)进行更为先进的通用层 面(miàn)的(de)整(zhěng)合(hé)。那将是一个新的时机,作为一个技术创新型企业,我们更多的是把自己定位在创(chuàng)新领域,推动(dòng)AI给产业的赋能”。
以下为演(yǎn)讲实录:
高峰:尊敬的各位(wèi)来宾,大家好 !非常荣幸(xìng)能代表智子(zi)引擎科技有限公司分享我们的科研成果(guǒ),今天我演讲的主题是《从私域AI到具身智能》。
首先,我想谈(tán)谈过(guò)去一(yī)年我们所(suǒ)做的工(gōng)作(zuò)。和大多数(shù)大模(mó)型企业一样,我们在垂直领域中做了很多落地项目(mù),但(dàn)经过我们内部的复(fù)盘,发现很多多模态大模型的能力其实(shí)还没有被企业充(chōng)分利用。传统企业和我们AI大模型(xíng)公(gōng)司之间(jiān),似乎(hū)隔着一层“窗户纸”。因此,我们(men)决定(dìng)走一条艰难(nán)但有效的路,这条路就是私域AI。我(wǒ)们重新(xīn)思考(kǎo),企业(yè)与AI公司的关系(xì)不应该是供需关系(xì),而应是共创关系。
接下来(lái),我将从四个方面展开我的分享。首先,请允许我简单介绍一下我们公司。
智子引擎科技有限(xiàn)公司(sī)的科研人员主要来自中国人民大学高瓴人工智能学院(yuàn),我们的核心团(tuán)队曾(céng)参与智源研究(jiū)院的悟(wù)道·文澜项目(mù)。我们研发了(le)国产首个国产多模态大模型。
接下来介绍一下(xià)我们的“孩(hái)子”——Awaker,中文名 叫觉醒者。我们希望Awaker能像人的大(dà)脑一样进行思考决策,赋予企业流水(shuǐ)线和机器以生命。Awaker可以像普通人一样思考,也(yě)可以像领域专家或(huò)技术工人一样思考。它由三(sān)部分能力组成:对话能力、检索能力和生成能(néng)力(lì)。你可以从拟人(rén)化的角度来理解它,它能够对话,能够感(gǎn)知外部环境,但(dàn)这(zhè)种感知基(jī)于(yú)数(shù)据进行。Awaker还能生成我们(men)需要的(de)一些(xiē)指令,涵盖感知、理解、决策、规划和控制(zhì)。这些(xiē)能力可以应(yīng)用于有形的硬件,比(bǐ)如四足机器人或两(liǎng)足(zú)机器人,也可以应(yīng)用于无形的(de)系统,比如程序大脑、企(qǐ)业大脑,甚至私人管家。重点(diǎn)在于Awaker如何感知、理解(jiě)、决策、规划并最终实(shí)现控制。
感知(zhī)可以通过语言交流,也可以通(tōng)过声音传感器接收音频信(xìn)号(hào),当然还包(bāo)括(kuò)温度、湿度等复杂的传(chuán)感器。Awaker通过多模态数据融(róng)合理解(jiě)外界信息,基于之前学习的知识进行决策(cè)和规划。如(rú)果是(shì)在硬件上,它可以控制机械臂;如果是在软件(jiàn)系统中(zhōng),它可以控(kòng)制API,执行各种操作(zuò)。
这就是我们所谓的“多模态输入、多模态输出”架构(gòu)(PPT图示)。输入(rù)形式是多模态的,比如文本(běn)问(wèn)答、图(tú)片问答、声音问答(dá)。在专(zhuān)业(yè)领域(yù),还包括通过传感 器(qì)采集 的数据。Awaker通过多模态融合理解这些数据后,能进行决策、规划和控(kòng)制。
前面提到的共(gòng)创关系,意味着(zhe)企 业不(bù)只是提供数(shù)据(jù),而是提供学习素材。大模型通过学习这些素材得到只是。大模(mó)型出厂时,可(kě)能就像一个有强烈求知欲望的孩(hái)子,但如果(guǒ)没有学习材料,它仍(réng)只是(shì)一个普通(tōng)的孩子。我们和企业共创,打造先进的生产高峰:从私域AI到具身智能(chǎn)工具。私域AI为企业提(tí)供(gōng)的不仅(jǐn)是降(jiàng)本增效,更是提升核心竞争力的关键。
接下来,我讲一个实际案(àn)例——无人(rén)机(jī)巡检。传统无人(rén)机(jī)通过摄像头、激光(guāng)雷达(dá)等 传(chuán)感(gǎn)器采集农场数据,传输到大(dà)模型数据分析中心,检测农(nóng)作(zuò)物是否异常。如果异常(cháng),传(chuán)统小模(mó)型会直接发(fā)出警告。而Awaker具备农业领(lǐng)域(yù)的知识,它不仅能识(shí)别病虫(chóng)害,还能生成一整套解(jiě)决方案,告诉维修人员(yuán)需要用什么(me)农药、喷洒多少、具体 喷洒(sǎ)位置,并通过API下发工单给相关人(rén)员(yuán)。如果配备(bèi)了(le)喷洒农药的(de)无人机,Awaker可以直接生成报告(gào),并下发任务,自动(dòng)规划喷洒路(lù)径并执(zhí)行作(zuò)业。
这套框架还可应(yīng)用于搜(sōu)救任务,如无人(rén)机通过传(chuán)感器感知受灾区域并(bìng)生(shēng)成救援路径。
第二个(gè)例子,我们先(xiān)看(kàn)一段视频。
(现场播放视频)
通过这个视频大家可以看到,企(qǐ)业内部的系统大多是(shì)通过点击功能(néng)模块来进(jìn)行操作的。而(ér)在AI时代(dài),我们提前预置了指令。大模(mó)型能够(gòu)理解自然语言(yán),在刚(gāng)才演示的变电站案(àn)例中,控制的最(zuì)小(xiǎo)动作其实是通过API来实现的。用户发出的自(zì)然语言指令被(bèi)系统理(lǐ)解为(wèi)中文,之后与(yǔ)原子动作相关(guān)的API进行(xíng)匹配,并最终输出结果。对于大模型来说(shuō),这没有什么神秘之处,关键在(zài)于企业需要(yào)为大(dà)模型提供学习材料(liào),比如相关的(de)知识文档。大模型(xíng)能够自主学习(xí)这些内容,从而提升其能力。
接(jiē)下来谈一下我(wǒ)们的未来(lái)规划(huà)。我们希望与传统企业共创(chuàng),走私域AI解决方案这条路。虽然过程中可能会遇到很(hěn)多不(bù)确定性,但先进的(de)生产力(lì)和优秀的(de)解决方(fāng)案,往往是在双方紧密合作中(zhōng)迸发出来的。如果仅仅是供需(xū)关系,企业可能只会将自己认知范围内的问题交给大模型(xíng)处理,但真正有效(xiào)的合作是要让大(dà)模型参与到企业的核心生产流程中,重(zhòng)塑整个流水线和生产环(huán)境(jìng)。如(rú)果结合云边协同(tóng),整个大模型将变得更(gèng)加强(qiáng)大,因(yīn)为城市中的摄(shè)像头、巡逻车、无人机等都会成为大模型的传感器,城市中(zhōng)各个单位的工作职责和路线关系都可(kě)能(néng)因此发生变化。
“积跬步,行千里”,我们开发私域AI解决(jué)方案的过程,也是在帮助Awaker逐(zhú)步认(rèn)识(shí)和理解世界。我相信,当我(wǒ)们(men)积累到一定程度时,先进的生(shēng)产力将会爆发(fā),而那时我们就可以进行更为先进 的通用层面的整合。那将是一个新的时机,作为(wèi)一个(gè)技术创新型企业,我们更多的是把(bǎ)自己(jǐ)定位在创新(xīn)领 域,推动AI给产业的赋能。
最后(hòu),我(wǒ)真诚期望有(yǒu)更 多(duō)的合作伙伴加(jiā)入到我们的AI事业中,与我们共同打造新质生产力,推动先进流水线的(de)发展。我的分享到此结(jié)束,感谢(xiè)大家的(de)聆听。
新浪声明(míng):所有会(huì)议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递(dì)更多信(xìn)息之目(mù)的,并不意味着赞同其观点或证实其描述。
高峰:从私域AI到具身智能责任编辑:梁斌 SF055
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了