王欣:通用大模型最后只会变成少量的一两家
专题:2024中国(guó)AIGC创(chuàng)新(xīn)发展论坛
2024年服贸会专题论坛之一——“2024中国AIGC创新发展论坛”于9月13日-14日在北京举行。安恒信息中央研究院院长(zhǎng)王欣出席(xí)并演讲。
王欣认为,国内有(yǒu)很多厂商在做通用大模型,但通用大模型最后只(zhǐ)会剩下成少(shǎo)量的一 两家,“我们看到各个垂直领域反而在做各类的垂直模型,我认为这路是对的”,他认为,最终是围绕通(tōng)用大模型或者相对(duì)小参数的模型围绕业务下(xià)沉的(de)模型。
以下为演讲实录:
王欣:大家下午好,刚才两位(wèi)专家都介(jiè)绍了围绕AI大模型运营这(zhè)块的很多时间,我(wǒ)今天围 绕这个话题继续延伸。
过去两年(nián)多时间AI很火,AI破圈,我不是做人工智能,我是(shì)做(zuò)攻防出身的,但现在我(wǒ)也加入到人(rén)工智能序列里,因为(wèi)各行各业(yè)在看到AI这块技术的革新(xīn)之后,我(wǒ)们看到了原来做不好的技(jì)术围绕(rào)着现在整个大模(mó)型(xíng)出现可以达到非常好的(de)效果。
我在比较早期的时候针对于AI已经做了很(hěn)多战略(lüè)层面的铺垫。但客(kè)观地讲(jiǎng),从大(dà)模型这(zhè)件事情上,我们距离国外还是(shì)有比较远的(de)距离。从ChatGPT出现之后,我国各大互联网公司、各大行业在训练(liàn)自己的大模型,去年的时候(hòu)可以理解为是(shì)国内(nèi)外大模型的技术元年,去年一(yī)年时间内,我看到(dào)最多的是几乎每天都有新(xīn)的大模型出现,在每天技(jì)术不断更新过程中,我们思考我们为什么(me)要去做(zuò)这件事情。所以这个PPT里面(miàn)第一页看到所有浪潮(cháo)退去(qù)之后要回归到价(jià)值本质。
对于AI来说,本(běn)质是(shì)一个工具,工具的核(hé)心(xīn)是解决业务问题,无论是在安全行业还是在其 他行业,包(bāo)括前一段时间我参加了Gartner一个会,在很多(duō)企(qǐ)业里面,大(dà)家(jiā)对于AI有什么期待(dài)?核心总结起来是三个方面:第一(yī)是降低生产成本,第二是提高产品质(zhì)量,第三是推动产业(yè)转型。
我们看到各个垂直领域反而在做各类的垂 直模(mó)型,我认为这路是对的,我们可以看到国(guó)内有很多厂商(shāng)过去在做通用大模型,我认为通用大模型最后只会(huì)变成少(shǎo)量的一两家,最终围(wéi)绕通用大模型或者相对小参数的模型围绕业务往下走的模型(xíng)。
安全行业也一样,安全行业发展了二十多年,我大(dà)学毕业(yè)前就开始接触安全,也将近二十年左右的(de)时间(jiān),在整个感(gǎn)触(chù)里面,其(qí)实安全是存在(zài)一个天平(píng)的问题(tí),很多时候我们希望告警(jǐng)比较少,但(dàn)又不希望有漏洞(dòng),我(wǒ)们希(xī)望业务优(yōu)先但(dàn)又希望安全第一,我们希望用(yòng)更少的成 本又希望安全整体防御(yù)做的更好。
在整个技术迭代过程中可(kě)以看到,原(yuán)来出现了很多安全产品(pǐn),但这些安全产品(pǐn)有时(shí)候不能完全去解决客户(hù)问题,在这个情况下怎 么办?堆人。但人是不是(shì)一个最优解?很多,包括(kuò)后面会讲到一些case,我们铺了很多产品不够人去凑,但人的成本持续(xù)上升(shēng),很难通过人去填补最后一公里。所以我们就在(zài)看,围绕(rào)着安(ān)全现(xiàn)在这样一个痛点现状,我们大(dà)模型能否带来这里面的变化,我们把AI作为一个工具,我们核心(xīn)分(fēn)析了(le)痛(tòng)点,看大模型能不能解决。
大模型我总结了几个点,第(dì)一个(gè),就之前人工智能(néng)技术有更强的理解指令(lìng)的能力,这里我认为是两层:一(yī)是(shì)本身为软件工程,对机器理(lǐ)解的指令更强;二是人工智(zhì)能为拟人化的学科,本身(shēn)更接(jiē)近于跟(gēn)人的(de)对话。第二(èr)个,理解意志。就是它有更强的(de)泛化能力,所以我们在安全很多的业务很(hěn)难做到非常标准的SOP。所以我们是希望掌握一些知识(shí)之(zhī)后还(hái)有(yǒu)更强的泛化(huà)能力。第三个,具有更强的COT能力,因为很多安全任务不是一个简单的问题,其(qí)实是一个复(fù)杂问题(tí),所以在很多安全任务处理过程中需(xū)要加一个复杂问题把它拆(chāi)解 成更加简单的问题、多个问题,大模型思维链(liàn)的问题(tí)本身比较(jiào)适合做安全相关(guān)任务。第四个,有快速的学习成长跟复制的能力(lì)。很多安(ān)全行业里(lǐ)面,人的经验复(fù)制是很难的,如何从数据驱动到知识驱动,到变成一个平台级的能力,这个(gè)层面我觉得是大模型(xíng)对这(zhè)个(gè)行(xíng)业来说很大的价值。
所以围绕着上面所有,我认为人工智能可以填补(bǔ)这里面的鸿沟,建立起一座桥梁之后,向左可以提高我们整个产品(pǐn)质量(liàng),向右可以提高整个服务的能效。所以我(wǒ)们不断地(dì)在思考、在(zài)探(tàn)索,在具体的每个业务链上到底有什么(me)样的(de)安(ān)全问题。
在另外一个(gè)层面,刚才余(yú)总也介绍到(dào),大(dà)模型本身偏向于是人的大脑,偏向于类似于咨询专(zhuān)家 。但我们更希望,具体的一(yī)些咨询专家能不能动手帮助完成所有任务(wù),所以我们这上面的思考是通过智能体的放,通过连接下层原来的产品,围绕着上(shàng)述业务场景构建相关智能体,融入(rù)原来的安全(quán)体系。
所(suǒ)以这里我想抛一(yī)个(gè)观点,新的技术(shù)出现不是去解决(jué)新的问题(tí),而是更多和原来(lái)产品进行结合(hé),解决原来传统(tǒng)解决(jué)不好(hǎo)的问题,这(zhè)是王道、是正道。另外(wài),很多时候对于大(dà)模型来说,是不是可以提(tí)高(gāo)很高的效率(lǜ)?在这个(gè)点上,我原来跟很多业内专家去 聊(liáo),其(qí)实它提升的是机器(qì)做不好的、需要人介入的(de)这(zhè)一块的(de)工作效率,对(duì)于现在大模型本身推理和各方面性能原因,原来机器(qì)性能已经这样,在(zài)机器性能(néng)上再叠加,这在 当前技术阶段不(bù)是特别(bié)成熟。
第二个层面,在整个AI这(zhè)一块,我在很多客户聊,大模型是不是很多原来解决不(bù)了的问题现在都可以通(tōng)过人工智能来解决了?其实远远不够,我们的梦想非常(cháng)高,但大模型现在(zài)还在一个技术的(de)爬坡阶(jiē)段,有很多问题,无论(lùn)是幻觉问题、性能问(wèn)题、指令遵循(xún)问(wèn)题等等一系列,并不是在所有任务上都能处理得(dé)很好,但不能低估了这个技术(shù)未来(lái)发展(zhǎn)空间。所以(yǐ)当前阶段要看有哪些痛点,大(dà)模型当前(qián)阶段最合适做什么工作(zuò),主编(biān)边走边(biān)爬坡,边跟(gēn)现在的业务结合,给现在业务痛点带来相关价值 。
过去我们内部做了(le)很多头脑风暴(bào),思考现在有什么(me)样的 痛(tòng)点,大(dà)模型能否(fǒu)解决什么问题,如果可(kě)以,我们就开始(shǐ)组(zǔ)织预演,组织预(yù)演(yǎn)可以,然(rán)后工(gōng)程化 ,工程化再可以(yǐ)给客户(hù)一个(gè)持续的优化过程。所以我们其实做了好多好多的尝试,这里面有很多也是失败了,包括最早的时候我们(men)想说原始流量是否可(kě)以直接丢给大模型,大模(mó)型是否能够独立针对于大型的软件工程,然后进行源代码的挖掘,包(bāo)括能不能(néng)做全自动化复杂场景(jǐng)的渗透。刚才我说的(de)这个场景分别代表了大模型现在的三个缺陷。这里不(bù)展开详细去聊这(zhè)个话(huà)题了。
实践过(guò)程中有几个点做的还可以(yǐ),第(dì)一个是安全运营相关的场景,安全运营,刚才两位专家(jiā)也提到,我们越(yuè)来(lái)越关注安(ān)全,整个法律体系的(de)构(gòu)建越来(lái)越完(wán)善,采集到的(de)日志越来越多,形成的告(gào)警(jǐng)越来越多。第二个是我们对 手整个(gè)攻击越来 越智能化、自动化,包括互(hù)联(lián)网上攻(gōng)击攻(gōng)防之间的博弈越来越强烈,所以(yǐ)我(wǒ)们其(qí)实在现在发现告警越来越多,我走访(fǎng)了很(hěn)多客(kè)户,一天告警可能在几十万到几百万,但是一个工程师一天大概只能(néng)处(chù)理个一千个左右的告警,所以我看了很多客户招了几十个(gè)人专门做安全运营,但(dàn)是几十个人(rén),假(jiǎ)设我(wǒ)们要把(bǎ)所有的日志告警分析(xī)的(de)话,远远不够。我们在思考大(dà)模型在这个点上可以解(jiě)决很好的问题,因为它本身的分(fēn)析逻辑、它的技能(néng)是可以(yǐ)相(xiāng)对(duì)的通过一些知识经验传递的方式给到 大模型(xíng)。但这一块,就不展(zhǎn)开讲了,因为前面(miàn)两位专家主要是(shì)围绕这(zhè)个话题来讲。
大家对于安全运营期待的第二(èr)点(diǎn)是未知威胁的发(fā)现。今年8月份我们团(tuán)队去BlackHat(全球一个(gè)顶尖的黑帽子大会),当时做了一个分享,就是利用大模型进行(xíng)威胁狩猎。这个相关技术成果在2024年国家网络安全宣传周上进行了公布,这个赛(sài)道我们(men)也(yě)是拿到了(le)第一名。因为大模(mó)型有比较强(qiáng)的泛化的能力,对于原来很多(duō)规则(zé)都是从已知到已知问题的发现,但是大模型可以在一定程度上做的一个已知到未知的发(fā)现,通(tōng)过这样的方(fāng)式极大提升了我们整 个狩猎能力包括过去很(hěn)多APT的线索,通过这样的方式得(dé)到了有效的产出。
这(zhè)些相关成果(guǒ)我就不展开讲(jiǎng)了,因为文字比较多(duō),全部阐述清楚需要比较王欣:通用大模型最后只会变成少量的一两家长(zhǎng)的时(shí)间。
前面讲的东西都偏向安全运营(yíng),后面讲数据安全相关的东西。业界做数据安全国内已经推了很多年,但整体落地存在(zài)挑战,这里本身有数据安全跟(gēn)业(yè)务更加连接,跟业务更加相关,不同客(kè)户整个数据安全(quán)需求也不一样。另外一个(gè)层面(miàn),过去很(hěn)多传统技术无法很好的支持数据安全的落地(dì),比如分类和分级,过去客户侧结构化数据有不(bù)同的业务类型和不同程序员开发,数据(jù)库涉(shè)及方式不一样,表字(zì)段命名不一样,很难(nán)通过原来(lái)通过规则或者关键字的方式形成一套识别(bié)的工具,我(wǒ)们过去看过很多数据分类分级的产(chǎn)品,识别率是比较(jiào)低的(de)只有对于他(tā)认识的,之前做(zuò)过关键词(cí)这类的识别的比(bǐ)较高,相对(duì)业务更新一点或者整个数据(jù)库(kù)设计、命名(míng)有一(yī)些特殊性或者有其他差异就(jiù)识(shí)别不出来。
围绕这个,就是我画的(de)图,前面产品,后面堆人,通过这样的方式(shì)堆(duī)了(le)很(hěn)多人(rén),数(shù)据(jù)分类分级,我(wǒ)们知道很(hěn)多客户非结构(gòu)化(huà)数据,然后一个数(shù)据库可能就几(jǐ)千张几万张表甚至十几万表,或(huò)者一个客(kè)户现场(chǎng),一天(tiān)一个人,分析(xī)的大概也是差不多一千个。
我们有一个运营商的(de)客户跟我们说了一个事情,说我(wǒ)这边(biān)有1500万个(gè)字段,能不能做(zuò)相关的(de)数据分类分级。用传统的 方式,不知道大家有没有概念,但做了计算,如果按照传统的方式,大(dà)概需要把两(liǎng)到(dào)三个人从实习阶段直接干到退休。我们去推动这个(gè)点,我觉得(dé)是打 开数据安全的基础,我们也(yě)做了很多实践,其实本身(shēn)是(shì)对于自然语(yǔ)言的理(lǐ)解,结构化数据里面本身字段表之间有关系,所以我们通(tōng)过AI的方式让它自动化的去(qù)推测每一个字段里的含义,并(bìng)且归到相应的内容。这里面我们识别(bié)到的(de)准确率,其实比人工专家(jiā)还要高 ,因为专家有时候是带情绪的,有(yǒu)时(shí)候不是理性(xìng)的(de),认为这一秒应该分到这里,下一(yī)秒做类 似工作认为应该(gāi)在另外一边,整(zhěng)个思(sī)维更加跳(tiào)跃。
在(zài)具体案(àn)例里面我们做了很多的客户(hù)实践 发现,整体效率提升30倍左右,虽(suī)然这里面百万个字段除1000个字段,10万字段除以(yǐ)1000个字段,效率提升不仅30倍,但因为整个项目交付(fù)有其他环节,所以我们整体算下来大概有30倍效率的(de)提升。这后面是具体的项目(mù),我不(bù)展开讲了。
刚刚讲的是结构化数据,数据安全里(lǐ)面(miàn)非结(jié)构化数据,过去(qù)这一块(kuài)也是老大难的问题,因为我们肯定知道(dào)有很多终端的DLP包括网络的DLP去针对于文本(běn)的(de)内容进行识别,过去DLP的初 代、二代更(gèng)多是通(tōng)过一些文(wén)件(jiàn)的格(gé)式、编码(mǎ)、关键(jiàn)词,后面(miàn)又增加了一些NLP的技术,其实整体的识别率是很低的,误报率(lǜ)很高的。
今天是安全场(chǎng),在座很多人可(kě)能是知(zhī)道这一块(kuài)的现状,所以我就不展(zhǎn)开讲了。大(dà)模型(xíng)本身有很强的文本理解能力(lì)、有很强(qiáng)的总(zǒng)结(jié)归纳的能力(lì)。所以我们对于不同的业务数据(jù)进去之后,这边分析(xī)完一个文档之后,认(rèn)为是一个员工工资表,所以认为是一个4级文(wén)档。后面分(fēn)析(xī)完认为是一个技术设(shè)计文档,所以属于(yú)4级高敏感等等。通过这种(zhǒng)方式,原来是把人的思维抽象成(chéng)了一(yī)个规则(zé),而现(xiàn)在是用借助人的思考方(fāng)式、阅读方式、总结归纳的能(néng)力让它去识别相关的 信息。所以我(wǒ)认为在过去原来传统技术叠加是一代二代三(sān)代,大模型在(zài)这个点上的价值是跨代的。如果有兴 趣(qù)后面再详细交流。
关于(yú)API安(ān)全也是一样,在整个API安全这一块也是围绕数据安全这几(jǐ)年比较火的一个点,过去API安全里面(miàn)存在(zài)一些问题,比(bǐ)如API接口识别的准确率,包括API脆弱性(xìng)的一些识别以及研判(pàn)能力,包括API接口(kǒu)调用的敏感数据(jù)以及(jí)敏感数据所对应的行为事件所分析出(chū)来的一些异常行(xíng)为之类等等(děng)安全相关的维度,但过去在这里面处理(lǐ)的都不是特别好(hǎo),然后我们通过让大模型去做API的提纯,包括做异常行为的分析(xī)。这(zhè)是一个真实的例子(PPT图),央(yāng)企的例子,通过 这样的方式(shì)识别到真正某一(yī)个IP在夜(yè)间(jiān)拖(tuō)取相关数据大概达到多(duō)少条,API的安全其实有很多的产品功能,但是我认为对于客户(hù)来说,这(zhè)是最(zuì)最(zuì)关心的,就因为API安(ān)全建好之后,到底有谁(shuí)通过(guò)我这(zhè)个API接口偷数据和爬(pá)数据。
最后一页我快速讲一下,整个数据(jù)大模型这一块针(zhēn)对于安全(quán),包括大模型本(běn)身(shēn)技术当前现状,我们认为还是在爬坡(pō)阶段。过去我们提到的是(shì)偏向于一个智能(néng)问答到现(xiàn)在的一(yī)个辅助驾驶,可(kě)以做大部分(fēn)工作,最后人工做一些check。我相信在不远的(de)将来,在一(yī)些(xiē)关键的任务上可以实(shí)现无人驾驶(shǐ)的效果,因为目前我们在一(yī)些新的领域上已(yǐ)经看到了,已经实践出来了,后面(miàn)找机会再跟各(gè)位(wèi)再做进一步的汇报,我的汇报就是这些,谢谢大家。
新浪声明:所有会议实录均(jūn)为现场速记整理(lǐ),未经演(yǎn)讲者审阅,新浪网登载(zài)此文出于传递更多信息之(zhī)目的,并不意味着赞同其观点或证实其描述。
责(zé)任 编辑:梁斌 SF055
未经允许不得转载:天津电机维修_天津进口电机维修_天津特种电机维修_天津发电机维修 王欣:通用大模型最后只会变成少量的一两家
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了