天津电机维修_天津进口电机维修_天津特种电机维修_天津发电机维修天津电机维修_天津进口电机维修_天津特种电机维修_天津发电机维修

大模型,何时迎来大转折?

大模型,何时迎来大转折?

  “真正的变革是,什么时间点有一个模型可以把错误率降低到个位数(shù)。”

  在经历了上半年密(mì)集的技术和(hé)产品发布后,下半年的AI圈显(xiǎn)得有些平静,不再有如Sora这样引发轰动的产品,在GPT-4o之后,行业 引领者OpenAI也迟迟没有(yǒu)大动作。不少 行业人士认为,技术的迭代放缓了(le)。

  在亚布力企业家夏季(jì)年会上,猎豹移动董事长傅(fù)盛提出一个观(guān)点,AI浪潮(cháo)已(yǐ)出现泡沫迹象,从大模型出现在大众视野以来(lái),已(yǐ)过(guò)去近一年的时间(jiān),但最顶级大模型的模型没有(yǒu)明显提升。“客观来说,谁(shuí)家大 模型有什(shén)么优势,基(jī)本尚(shàng)属(shǔ)‘一家之言’,用(yòng)户(hù)用起来没有感(gǎn)觉到太大差别(bié)。”他认为,当前大模型同质化严重。

  在与MiniMax创(chuàng)始人 闫俊杰的交(jiāo)流中(zhōng),关(guān)于瓶(píng)颈与转折点他提到,现在所有(yǒu)模(mó)型错误率都 是(shì)20%的量级,“真正的变革是,什么时间点有一个(gè)模型可以把错误率降低到个位数,这会是一(yī)个非常本质的变化(huà)。”未来大模型能(néng)否成功,傅(fù)盛也认(rèn)为,大模型(xíng)的天花板(bǎn)能否再上一个台阶很重要。

  “至暗时刻(kè)觉(jué)得技术很(hěn)重要”

  这(zhè)一轮的生成(chéng)式AI是 一场掀起巨大浪潮的社会生产力革命,傅盛(shèng)认(rèn)为,这波(bō)浪潮今天已经呈现出明(míng)显的泡沫迹象。

  何 为(wèi)“泡沫(mò)”,傅盛认(rèn)为,一方(fāng)面是(shì)模型能力没有明显提升。“在一个(gè)以科技为核心的技术浪潮中,这是不太正常的。”每次写不同的东西,傅盛都会用好几个大模型互相(xiāng)比较(jiào),“有(yǒu)时候这个大模型更好用,有时那个(gè)更好用(yòng),当前大模型的(de)同质化很严重。”

  其次,说了这么久人工智(zhì)能,“但真正的Killer APP(杀手(shǒu)级应用)并没有出 现,不仅(jǐn)在C端没有出现,B端也未能出现。很多行业大模型都说自己(jǐ)有不少应用,但真正提效的并不多。”傅盛说(shuō),想要将大模型真正变成一个明显能提效的应用(yòng),还很(hěn)有难度。

  泼了盆冷水的同时,傅盛补充表示,泡沫不见得会 使大模型发展崩(bēng)塌,因为有点泡沫很正常,互联网早期也曾出现(xiàn)泡沫。

  在今年6月演讲时,金沙江创投主管合伙人朱啸虎曾(céng)谈(tán)及GPT-5一直“跳票”时表示,“硅谷也高度怀疑GPT-5还有没有,即使出来在核心推理能力上还 有没(méi)有显著(zhù)的(de)提(tí)高,这是很不(bù)确定(dìng)的东西,今年年底是一(yī)个验(yàn)金石。”他判断,大模型演化速度(dù)有放缓(huǎn)趋势,而迭代曲线放缓以后,应(yīng)用层的机会就会更多。

  不过,在波形(xíng)智能创始人姜昱辰看来,大模型技术迭代(dài)其实并(bìng)没有 放缓,而是保持着2018年以来 的增速(sù),那一年基于Transformer架构的大规模语言模型预训练开始流行。从博士(shì)的(de)自然语言(yán)处(chù)理研究到大模型创业,姜昱辰(chén)更早开始经历这轮大模型技术演化的进程。

  “大家之所以有这样的感觉(技术迭代放缓)是因为 大(dà)众是在2022年底、2023年初第(dì)一次看到这个技术,做了很多短时间(jiān)的(de)learning和追赶,追赶(gǎn)当然比(bǐ)较快 。”姜昱辰(chén)对第一财经(jīng)表(biǎo)示,把OpenAI做出来的技术学一(yī)遍,不叫“技术迭代”。

  虽然行业此前有(yǒu)一句“没有应用的大模型(xíng)一文不值”广为传播,但在很多从业者看来,大(dà)模型的技术同样重要,因为更好的应用一定建立在更好的技术之上,技术和应用是一个相互转化的串联(lián)关系。

  在MiniMax刚(gāng)刚过去的伙伴日活动(dòng)上,闫俊杰在讨论中提(tí)到,“至暗时刻会觉(jué)得技(jì)术很重要。”

  很多时候做技术时(shí),并没有真正意识到(dào)技术为什么重要。闫(yán)俊杰(jié)举例表示,用户(hù)感受(shòu)到(dào)的东西可能来自于一些产品细(xì)节,或者一些品牌,技术本身是好(hǎo)多个环节(jié)在一(yī)起,尤其在繁(fán)荣时(shí)期,可(kě)能分不清什么是主(zhǔ),什么是次,“当在某些时间点遇到瓶(píng)颈的时候,抛开所(suǒ)有的表象东西(xī),会(huì)意识到技术才是最终提升的(de)来源。”

  “技术做不好的时(shí)候,发现所有东西都是问题,当技术做好了,似乎所有问题都被掩(yǎn)盖了,”闫俊杰表示,技术(shù)是(shì)一(yī)家(jiā)科技公司最核心的要素这件事,尽管已(yǐ)深刻意识(shí)到,偶 尔(ěr)还是在继续犯错误,“这(zhè)个(gè)是我在多次至(zhì)暗时刻里最(zuì)有共性的一(yī)件事(shì)。”

  做技术也是一件非常奢侈的事,“如果看一眼我们每个 月的账(zhàng)单还是会非(fēi)常心(xīn)疼的。”在采(cǎi)访中,说到这话时,闫(yán)俊杰几次看向了MiniMax技术总(zǒng)监韩景涛,也就是(shì)“账单的制造者”。

  因为做技术可能会失败,研发投入很大,闫俊杰此前很多时候会想要不要(yào)走点捷径,但实践 经验会证明,走捷径(jìng)就会被“打脸”,“这个事在我这发(fā)生可能超过(guò)十次了。”

  “一个东西要实验三次才能成功,第(dì)三次实验成(chéng)功的(de)时候,会想前面两次是不是可以不用做,就像吃包子吃三个会吃饱,就会想是不是前两(liǎng)个不用(yòng)吃(chī)是一样的。”闫俊杰表示(shì),这是做技术时一个比较容易犯的错误。

  在各(gè)种关于模型技术细节的排行榜上,或许GPT-4o的(de)跑分(fēn)不(bù)常出(chū)现在第一,甚至(zhì)会(huì)在中(zhōng)间,但在MiniMax基于真实(shí)客户的测试集中,OpenAI的GPT-4o是遥遥领先的。

  在大模型时代,如何(hé)判断技术的好坏,大众很迷惑,企(qǐ)业同样觉得很难,但(dàn)这个点很重要,因为(wèi)技术的评价标准(zhǔn)会决定(dìng)模型的迭代方向,如果指(zhǐ)标本身不(bù)对迭代方向(xiàng)可能就错了。

  闫俊杰(jié)提到,MiniMax目前(qián)的一个办法是,基于MiniMax开发平台的3万(wàn)多个开发者和付大模型,何时迎来大转折?费客户,在他们的场景(jǐng)上构建(jiàn)一个真实使用的测试集,有些客户对(duì)他们的场景非常看重,要(yào)求保证产品(pǐn)的效果,基于(yú)这些客户真实(shí)使用的(de)评测是较为客观的。

  “这个测试集 上所(suǒ)有国产化模型相比GPT-4o都相差较多,其他排行榜基本上GPT-4o都要排(pái)到中间去了,但是在我们的排行榜上确(què)实GPT-4o排在最靠前。”闫俊杰提到,国内所有模型都与GPT-4o有本质的差距,且越难的 问题差距(jù)越大(dà)。按照这个评估方式,国产模型(xíng)的提升 空间还很(hěn)大(dà)。

  静待(dài)下一转折点

  大模(mó)型的(de)下一个转折点在哪里?众多创业者有不同的答案,有人认为是错误率的降低,有(yǒu)人觉得是个性化的模型,有(yǒu)人认为关键在于小算(suàn)力训练出大模型,背后或许意味着架构的改进。

  朱啸虎曾(céng)提到,今年的大模型本身还是有很(hěn)多错误,且出来的结果不可(kě)控,今天落地最(zuì)困难(nán)的是,场景下怎么(me)解决错误问题、可控问(wèn)题。

  现在所有的模(mó)型错 误率都在20%左右(yòu),即两位数的错误率,有时惊艳,有时不靠谱,闫俊杰(jié)认为,这也(yě)是制约模型处 理复(fù)杂任务的原(yuán)因,“真正的变革是,什么时间点有一个模型可以将错误率降低(dī)到个位数。”这是能增加用户使用(yòng)深度的核心手段。

  复杂任(rèn)务往往需要多个步(bù)骤“相乘”,较高的错误率导致失败率的指数(shù)增加。闫俊杰表示,即便是GPT-4这样的(de)模型也无法(fǎ)支(zhī)持非(fēi)常灵活的(de)Agent(智能体),这并不是因(yīn)为Agent框架(jià)写得不够好(hǎo),产品做得不 好,最根(gēn)本的 原因是(shì)模型本身不够好。

  但现在可以看到的是,每家公司(sī)有了(le)算力,无论是OpenAI、谷歌还是Meta,都在加码算力。Meta CEO扎(zhā)克伯格曾在社交媒体上表示,要建立一个大规模的计算基础设施,到2024年底,这(zhè)一设施将包(bāo)括35万张(zhāng)英伟达H100显卡,业界(jiè)预估这或(huò)许将耗费近百(bǎi)亿(yì)美元。

  算法也在(zài)进步,OpenAI在(zài)2023年只能做出来GPT-4,但2024年能做GPT-4o,虽然性能差不多,速(sù)度(dù)快了近10倍。

  “计算量多(duō)了(le)不止10倍,算法也快了10倍时,没有道(dào)理说训练不出来一(yī)个更好(hǎo)的(de)模型。”闫俊杰提到,“如(rú)果Scaling law(尺度定律)是对的,未(wèi)来这个模型一(yī)定会出(chū)现,标(biāo)志就是 个(gè)位数(shù)的错误率。”

  在傅盛(shèng)看来,降低错误(wù)率同样重要。“今天的大模(mó)型(xíng)有20%-30%的知识幻觉,而且(qiě)‘它不知道自己不知道’,这是在企业应用上非常重要的一大卡点。”想要真正落地一个应用,得(dé)用大量工程化(huà)的手(shǒu)段去(qù)解决 以前(qián)通用(yòng)人(rén)工智能(néng)认为(wèi)它能(néng)干的活,这中间是有 差距(jù)的。

  问及大模型技术的下一个转折点,姜昱辰给了一个不一样的答案,她认为是“个性化”的技术。

  “ToB的创(chuàng)业者会觉得错误率降低很重要(yào),因为企(qǐ)业级、工业级(jí)场(chǎng)景中要的是极高准(zhǔn)确率,而在(zài)消费场景中(zhōng),要的(de)是‘懂你(nǐ)’的个人助手。因此,对ToC创业者来(lái)说,个性(xìng)化 技术更重(zhòng)要。”对于不同的答案,姜(jiāng)昱辰解(jiě)释,ToB和ToC不同的场景下会有不同的感知。

  从难度上(shàng)来说,大模型幻(huàn)觉是概率模型固有的,不容易解决,但个性化大(dà)模型确实(shí)是技术层面可行(xíng)的。姜昱辰(chén)提到,波形智能目前在做的(de)是这个方向(xiàng),主要的难点是(shì)算法(fǎ),中间需要知道的是,这样的个性化生成式模型(xíng)需(xū)要什么用户信息,如何用于(yú)模型自进化。

  深思考创始人杨志明则认为,下一个转折点是(shì),如何利用小算力训练出大模型(xíng)、做好大模(mó)型的推理,在这背后,当下主流的Transformer架构需要堆(duī)积算力,“性价比太低”。架构的(de)改进或许是(shì)重要(yào)的方向。

  值得期待的是,近日有消息称,OpenAI将在今年秋天推出代号为“草莓”(Strawberry)的新模型。作为核心技术突破,草莓可能集成在ChatGPT内(nèi),帮助解决 当前AI聊天机(jī)器人难(nán)以完成的(de)复杂任务,如数学(xué)和编程问题。此外,草莓更会“思考”,在解决强主观(guān)性问题(tí)上更擅长。

  “草莓”是前菜,消息人士透(tòu)露,OpenAI正在开发下一代大型语言模型 Orion(猎户(hù)座),草莓(méi)将为其生成高质量训练数据,以帮助减少大模型(xíng)幻觉问题。能否突 破瓶颈,带领行业进入(rù)下一(yī)转折点,最大的可能性还在OpenAI。

责任编辑:刘万里 SF014

“真正的变革是,什么时间点(diǎn)有(yǒu)一个模型可以把错误率降低到个位数。”

在经历了上半年密(mì)集的(de)技术和产品发(fā)布后,下半年的(de)AI圈显得有些平静,不再有如Sora这样引发轰动(dòng)的产品(pǐn),在GPT-4o之后,行业引(yǐn)领者OpenAI也迟迟没有大动作。不少行(xíng)业人士认(rèn)为,技术的迭代放(fàng)缓了。

在亚布力企业家(jiā)夏季年会上(shàng),猎豹移动董事长傅盛提(tí)出一个(gè)观点,AI浪潮已出(chū)现泡沫迹象,从大(dà)模型出现在大众视野以来,已过去近一年(nián)的时间,但最顶级大模(mó)型的模型没有明显提升。“客观来说,谁家(jiā)大模型有什么优势,基 本尚属‘一家之言’,用户用起来没(méi)有感觉(jué)到太大差别。”他认为,当前大模型(xíng)同(tóng)质(zhì)化(huà)严重。

在与MiniMax创(chuàng)始人闫俊(jùn)杰的交流中(zhōng),关于瓶颈与转折(zhé)点他提到,现在所有模型错误(wù)率都是20%的(de)量(liàng)级,“真正的(de)变革是,什么时间点(diǎn)有一个(gè)模型可以把错误率降(jiàng)低到个位数,这会是一个非常本质的变化。”未(wèi)来(lái)大模(mó)型能否成功,傅盛也认为,大模型(xíng)的天(tiān)花板能否再上一个台阶(jiē)很重要。

闫俊杰(jié)在演 讲中提(tí)到(dào)模型的优化方向

“至暗时刻(kè)觉得(dé)技术很重要”

这一轮的生成(chéng)式AI是一场掀起巨大浪潮的社会 生产(chǎn)力(lì)革命,傅(fù)盛(shèng)认为(wèi),这波浪(làng)潮今(jīn)天已经呈(chéng)现(xiàn)出明显的(de)泡沫迹(jì)象。

何为“泡沫”,傅盛(shèng)认为,一方面是模型能力没(méi)有明显提升(shēng)。“在一个(gè)以科(kē)技为核心的(de)技术浪潮中,这是不太正常的。”每次(cì)写不 同的东西,傅盛都会用好几个(gè)大(dà)模(mó)型互相(xiāng)比较,“有时候这个大 模型更好用(yòng),有时那个更好用 ,当前大模型的同质化 很严重。”

其次,说了这么久人工智能,“但真(zhēn)正的(de)Killer APP(杀手级应(yīng)用)并没有出现(xiàn),不(bù)仅在C端没有出现,B端也未能出现。很多行(xíng)业大模(mó)型都说自己有不少应用,但真正(zhèng)提效的并不多。”傅盛说,想要将大模(mó)型(xíng)真正变成一(yī)个明显能提效的应用,还很有难度。

泼了(le)盆冷水的同时,傅盛补充表示,泡沫不见得会使大模型发展(zhǎn)崩塌(tā),因(yīn)为有(yǒu)点(diǎn)泡沫(mò)很正常,互(hù)联(lián)网早期也(yě)曾出现(xiàn)泡沫(mò)。

在(zài)今年6月演讲时,金沙江创投主管合(hé)伙人朱啸虎曾谈及GPT-5一(yī)直“跳(tiào)票”时表示,“硅谷(gǔ)也高度怀疑GPT-5还(hái)有没有,即使出来在核(hé)心推理能力上还有没(méi)有显著的(de)提高(gāo),这 是很不确(què)定的(de)东西,今年年底是一个验金石。”他判断,大模型演化(huà)速度有放缓趋(qū)势,而迭代曲线放(fàng)缓以后,应用层的机会 就会更多。

不过,在波形智能创始人姜昱辰看来,大模型技术迭代其(qí)实并没有放(fàng)缓,而是保持着2018年以来的增速,那一年基于Transformer架构的大规模语言模型预训练开(kāi)始流行。从博士的自然语言处理研(yán)究到大模型创业,姜昱辰更早(zǎo)开始经历这轮大(dà)模型技(jì)术演化的进程。

“大家之所以(yǐ)有这样的感觉(技术迭代放(fàng)缓)是因为(wèi)大众是在2022年底、2023年初第(dì)一次看(kàn)到这个技术,做了很多短时间的learning和(hé)追赶,追赶(gǎn)当然比较(jiào)快。”姜(jiāng)昱(yù)辰对第一财经表示,把(bǎ)OpenAI做出来的技术学一遍,不叫“技术迭代”。

虽然行业(yè)此前有一句“没有应 用的(de)大模型一文不值”广为传播,但在(zài)很多从业者看来,大模型的技术同样(yàng)重要,因(yīn)为(wèi)更好的应用一定(dìng)建立在更好 的技术之上,技术和应用是一个相互转化(huà)的串联(lián)关系(xì)。

在MiniMax刚(gāng)刚过 去(qù)的伙伴日活动(dòng)上,闫俊(jùn)杰在讨(tǎo)论中提到,“至暗时刻(kè)会觉得技术很重要。”

很多时候做(zuò)技术时,并没(méi)有真正意识到技术为什么重要(yào)。闫俊杰(jié)举例表示,用户感受到的东西可能来自于(yú)一些(xiē)产(chǎn)品细(xì)节,或者一些品 牌(pái),技术本身是好多(duō)个环节在一起,尤其在繁荣时期(qī),可能分不清什么是主,什(shén)么是次,“当在某些时间点(diǎn)遇到瓶颈的时候,抛开所有的表象东西,会意(yì)识 到技术才是最终提(tí)升的来源。”

“技术(shù)做不好的时候,发现(xiàn)所有(yǒu)东西都是问题(tí),当技术做好了,似乎所(suǒ)有问题都被掩盖了,”闫(yán)俊(jùn)杰表示,技(jì)术是一家(jiā)科技公司最核心(xīn)的要素(sù)这件(jiàn)事,尽管(guǎn)已深刻意识到,偶尔还是在 继续犯错误,“这个是我在多次至(zhì)暗时刻里最有共(gòng)性的一件事。”

做技术也是一件非常奢侈的事,“如果看一(yī)眼我们每个月的账单还是会非常心疼的。”在采(cǎi)访中,说到这话时,闫俊杰几次看向了MiniMax技术总监(jiān)韩景涛(tāo),也就是“账单的制造者”。

因为(wèi)做技术 可能会失败,研发投入很大,闫俊杰此前很多时候 会想(xiǎng)要不要走点捷(jié)径,但(dàn)实践经验会证明,走(zǒu)捷径就会被“打脸”,“这个事(shì)在我这发生可能超过十次了。”

“一(yī)个东西要实(shí)验(yàn)三次才能成功,第(dì)三次实(shí)验成功的时(shí)候,会(huì)想前面(miàn)两次是不是(shì)可以不用做,就像吃包子吃三个(gè)会吃(chī)饱,就会想是不是前两(liǎng)个不用(yòng)吃是一样的。”闫俊杰(jié)表示,这(zhè)是做技术时一个比较容易犯的错误。

在(zài)各种关于模(mó)型技术细节的排行榜上,或许GPT-4o的跑分不常出现在第一,甚至会在中间(jiān),但(dàn)在MiniMax基于真实 客户的测试集中,OpenAI的GPT-4o是(shì)遥遥领先的。

在(zài)大模型时代,如何(hé)判断技术(shù)的好(hǎo)坏,大众很迷惑,企业同样觉得很难,但这个点很重要(yào),因为技术的评价标准会决定模型的迭代方 向,如果(guǒ)指标本身不对迭代方向可能(néng)就错了。

闫俊杰提到(dào),MiniMax目前的一个办法是,基于MiniMax开发(fā)平台的(de)3万(wàn)多个开发(fā)者和付费客户,在他们的场景上构建(jiàn)一个真(zhēn)实使用的测试集,有些客(kè)户对他们的场(chǎng)景非常看重,要求保证产品的(de)效果,基于这些客户真(zhēn)实使用的评测是较(jiào)为客观的。

“这(zhè)个测试集上所有国(guó)产化模型(xíng)相 比(bǐ)GPT-4o都相差(chà)较多,其他排行榜基本上GPT-4o都要排(pái)到中间去了,但(dàn)是在我(wǒ)们的排行榜(bǎng)上确实GPT-4o排在最(zuì)靠前。”闫俊杰提到,国(guó)内所有模型(xíng)都与GPT-4o有本(běn)质的差距,且(qiě)越难的问题差距 越大。按照这个评估方式,国产模型的提(tí)升空间还很大。

静待下一(yī)转折点

大模型的下(xià)一个转折点在哪(nǎ)里?众多创业者有(yǒu)不同的答案,有人认(rèn)为是错误(wù)率的降(jiàng)低,有(yǒu)人觉得是个性化的模型,有人认为关键(jiàn)在(zài)于小算力训练(liàn)出大模型,背后或许意味着架构的改进。

朱啸虎曾提(tí)到,今年的大模型本身还是有很多错误,且出来的结果不可控,今天落地最困难的是,场景下怎么解决错误问题、可控(kòng)问题。

现在所有(yǒu)的模型错误率都在(zài)20%左(zuǒ)右,即两位数(shù)的(de)错误率,有时惊艳,有时不靠谱,闫俊杰认为,这也是(shì)制(zhì)约(yuē)模型处(chù)理复杂任务的(de)原因,“真正的变革是,什么时间点有一个模型可以将错误(wù)率降低到个位数。”这是能增加用户使用深度的核心手段(duàn)。

复杂任务往往需要多个步骤“相乘”,较高的错误率导致失败率的指数增加。闫俊杰表示,即便是GPT-4这(zhè)样的模型也无法(fǎ)支持非常灵活(huó)的Agent(智能体),这并不是因为Agent框架写得(dé)不够好,产品做得不好,最根本的原因是模型本身不(bù)够好。

但现在可以看到的是,每家公司有了算(suàn)力,无(wú)论是OpenAI、谷歌还是Meta,都在加码算力(lì)。Meta CEO扎克伯格曾在社交媒(méi)体(tǐ)上 表(biǎo)示,要(yào)建立一个大规模的计(jì)算基础设施,到2024年底,这一(yī)设施将包括(kuò)35万张英(yīng)伟达H100显卡,业(yè)界预(yù)估这或许将耗费近百亿美元。

算法也在进步,OpenAI在2023年只能做出来GPT-4,但2024年能做GPT-4o,虽(suī)然性能差不多,速度快了近10倍。

“计算量多了不止10倍,算法也快了10倍时,没有道理说(shuō)训练不出来一(yī)个更好的模(mó)型。”闫俊杰提到(dào),“如果Scaling law(尺度定(dìng)律)是对的,未来(lái)这个模 型一定会出现(xiàn),标志就(jiù)是个位数(shù)的错误率。”

在(zài)傅盛看来,降低错误率同(tóng)样重要。“今天的大模型有(yǒu)20%-30%的知识(shí)幻觉(jué),而且‘它不知道自己不(bù)知道(dào)’,这是在企业应用上非常重要(yào)的一大卡点。”想要真正落地一个应用,得用大量工程化的 手段(duàn)去解(jiě)决以前通用人工智能认为它能干的活,这 中间是有差距的。

问及大模型技术的下一个转折(zhé)点,姜(jiāng)昱辰给了一个不一样的(de)答案,她认为是(shì)“个性化”的技术。

“ToB的创业者会觉得错误率降低很重要,因为企业级、工业级场景中要的是极高(gāo)准确率,而(ér)在消费场(chǎng)景中,要的(de)是‘懂你’的个人助手。因此,对(duì)ToC创业者来说,个性化技术更重(zhòng)要。”对(duì)于不同的答案,姜昱辰解释,ToB和ToC不同的场景下会(huì)有不同的感知。

从难度上来说(shuō),大模(mó)型幻觉是概率模型固有的 ,不容易解决,但个性 化大模型确实是(shì)技术层面可行的。姜昱辰提到,波形智能目前(qián)在做的是这个方向,主(zhǔ)要的难点(diǎn)是算法,中间需(xū)要知道的是,这样的个性化生成式模型需(xū)要什么用户(hù)信息,如何用(yòng)于模型 自进化。

深思考创始人杨志明则认为,下一个转折点是,如(rú)何(hé)利用小算力训练出大模型、做好大(dà)模 型(xíng)的(de)推理,在这背后,当下主流的Transformer架构需要(yào)堆(duī)积算力,“性价比(bǐ)太低”。架构的改(gǎi)进或(huò)许是重(zhòng)要的方向。

值得(dé)期待的是,近日有(yǒu)消息称,OpenAI将在今年秋天推出(chū)代号为“草(cǎo)莓”(Strawberry)的(de)新模(mó)型。作(zuò)为核心技(jì)术突破,草莓(méi)可能集成在ChatGPT内,帮助解决当前AI聊天机器人难以完成的复杂任务,如数学和编程问题。此外,草莓更会“思考”,在解(jiě)决强主观性(xìng)问题上更擅长。

“草莓”是前菜,消息人士透露,OpenAI正(zhèng)在开(kāi)发下一代大型语(yǔ)言模型Orion(猎户座),草莓将为其生成(chéng)高质(zhì)量训练数据(jù),以帮助减少大模型幻觉问题(tí)。能否突破瓶颈(jǐng),带领行业进入下一转折点,最大的可能(néng)性还在OpenAI。

未经允许不得转载:天津电机维修_天津进口电机维修_天津特种电机维修_天津发电机维修 大模型,何时迎来大转折?

评论

5+2=