大模子为何不知道“13.8大还是13.11大”？傅盛分析「大模子是什么意思」

专题：2024中国企业将来之星年会

　　2024中国企业将来之星年会于7月26日-28日在上海举行。猎豹移动董事长兼CEO、猎户星空董事长傅盛出席并演讲。

　　傅盛表现，很多人问将TikTok原型卖给张一鸣后不悔恨，“没有什么悔恨的，由于我们没有这个基因，字节就是做得好”。他以为，“假如（我们）本身做，肯定不如本日 TikTok做得好。每个人、每个团队都有本身的本领圈”。

　　谈起本日火爆的大模子无法精确解答“13.8大还是 13.11大”的缘故起因，傅盛表明说，这是大模子的缺陷之一，由于大模子仅是字符串的学习。“大模子的幻觉和不苟言笑的胡说八道，它不知道本身不知道，人说错话，立刻就知道，但大语言模子不是，它不苟言笑的讲林黛玉打虎的故事，讲得活龙活现，它没有反思本领 ”。

　　以下为演讲实录：

　　傅盛：我想说偶然间归不归零，不是你说了算，而市场说了算。

　　有一次我写了一个PPT给张一鸣看，我说偶然间是被逼的，偶然间是有宏大的抱负，张一鸣看了以后说都是被迫，哪有什么宏大的抱负。科技海潮席卷而来，我们必须要不绝跟进。

　　2010年开始创业，我们创建了猎豹移动。履历了三个时段，第一个时段把金山毒霸工业软件变成了企业软件，如今尚有营收，同一期的软件都没有了，金山毒霸尚有营收。第二个时段，我们发现中国的APP红利没有了，到了环球 6亿阅读活泼用户，此中 4亿来自外洋，TikTok也是我们天使投资，厥后卖了头条。

　　之后我们想找一个大的风口，16年我们看到了AI，当时我们都以为可以快速改变人类，可以快速做AI。但偶然间技能不是不停高歌猛进，有高潮期，也有低谷期，终于等来了ChatGPT，模子就应该以AI为核心，以是我们的slogan：AGI期间成为环球领先的新质生产力工具提供商。

　　很多人问我卖掉TikTok（原型）会不会悔恨，没有什么悔恨，由于我们没有这个基因，字节就是做得好。假如本身做，肯定不如本日 TikTok做得好。每个人、每个团队都有本身的本领圈，最早我开始打造360安全卫士，到背面选择工具，就是由于我们的基因，我们团队就是做工具，能把工具做好不错了。

　　我大抵讲一下AI很热，很多人都知道，我还是做点科普。假如再做几十年转头看这一波AI海潮，大概和前面看牛顿和爱因斯坦一样。前段时间我去拜访罗振宇，很多企业家都是如许，如今的环境下怎样创业，罗振宇说就是两件事：第一，真正寻求快速闭环，一个摆摊的哪怕出现很大的变革，也有本身的小循环；第二，做一些穿越周期的事，爱因斯坦1905年的四篇论文，“相对论”奠定了如今的信息技能底子，2023年我们以为 ChatGPT的出现，会改变人类社会的方方面面。近来阿里巴巴的王坚说AI也会改变科研，从前科研是假设性科研，就是我们看到很多征象做一个公式的假设，但以后科研就是端到端的科研、数据类的科研、直接给出结论的科研。

　　为什么这次的AI和16年看到的AI不一样呢？由于当时候看到AI很冲动，以为盘算机可以识图、认人脸，就以为它可以做统统。本日看起来辨认并不是人类独有的技能，辨认是一种感知，狗也认识你，语言才是人独有的技能，尤其是推理的语言。本日看起来可以或许突破语义明白就是人工智能的庞大突破，在ChatGPT出来之前，行业都以为语义明白不知道什么时间会实现。

　　ChatGPT之以是牛，就是由于它改变了学习蹊径，之前的大部分蹊径是让盘算机学规则，就是学定、状、主。但是OpenAI信托只要给它充足多的语言数据，OpenAI就会像小孩一样忽然有一天开口语言，就会明白语言。在此之前，各人都没有那么信托，以是着实在GPT3.0出现之前，OpenAI在硅谷都不被看好。以是，ChatGPT不是技能的胜利，而是技能信奉的胜利。

　　由于人工智能就像大树下，Transformer都是一样的。像Google、百度如许的大公司，他们以为智能可以通过规则以及语言的明白才华完成，但OpenAI信托只要做好下一次猜测就能产生智能。这条蹊径非常艰巨，艰巨在于并不知道它的核心原理，但必须坚信，要不绝的试。它最难的是每次试都要花几千万美金，再去试，试完之后再调解。本日 “百模大战”不是技能的难度，而是技能信奉的难度，真的敢于信托、敢于投钱，才华真的把ChatGPT做出来。

　　本日有很多文章说它产买卖识，说它更换人类，都不消信托它，ChatGPT就是猜测下一个词的盘算机，不绝猜测下一次就产生了智能。前首席科学家真的很锋利，他以为只要给充足多的数据，盘算机就会猜测下一个词，通过不绝的猜测就可以产生智能，通过不绝的猜测就可以完成团体的涌现。他做了类比，一本侦察小说两三百页，翻到末了一页说杀手是谁的时间，假如脑筋里出现了这个人的名字，恰好就是这个杀手，阐明你读懂了这本小说。由于每一个下一个词的涌现都是对前面全部文章的明白。

　　尚有一点，为什么能出现如许的智能，它的原理还属于黑盒，就是没有数学公式推导能证明会出现如许的智能。我们这个行业有一个鄙谚，每次练习大模子就像炼丹，开始炼的时间不知道结果怎么样，肯定要末了结果出来才连续。

　　为什么OpenAI很锋利呢？16年我们开始做语音辨认、视觉辨认的时间，随着数据量的增长，从前体系的智能程度很快就上来了，但是它只能上到肯定的程度，这次给了大量的数据，它不停不怎么样，忽然有一天（这是一个形象的比喻）某一个时候，程度一下子就起来了，到了原来体系到不了的智能化程度。各大模子都是如许，根本上训前两个月看这个模子的程度很一样平常，到第三个月就起来了，就是如许的标准。以是我说是技能信奉。

　　由于技能信奉，本日我们也以为 OpenAI的蹊径也不是唯一精确的，未必是唯一精确的。由于技能故意思就在于它不绝的分支，不绝产生新的大概性，当OpenAI在大参数模子上一骑绝尘的时间，越来越多的小参数模子开源社区开始出现。各人以为既然这条蹊径上可以产生智能，那用更少的参数可否产生智能，以是看科技的本质就是不绝 think difference的过程，正是不绝的think difference才华有更多的创新。

　　即便是OpenAI云云大的公司，超牛的公司也要造一个爱因斯坦，造出一个爱因斯坦全天下都办理了全部的题目。但是也有一帮人没有那么有钱，技能没有那么强，能不能做一个布衣化的模子，只要办理专门的题目就行了，本日开源阵营就是在做这件事，用更自制的算力本钱、更小的参数量在某一个范畴实现更好的结果，近来微软、苹果发了，客岁我们就有如许的判定，以为肯定会出现如许的分支，以是我们刚强都在开源阵营的蹊径上。

　　客岁我和朱啸虎有一次吵架，做AI到底是应用紧张还是模子紧张？当时由于大模子出来，他震动了，很多人都以为大模子会占据99%的财产链代价，但当时我就说应用是核心。本年天下人工智能大会，险些每个大佬都在谈应用，各人终于意识到给一个谈天窗口，给一个用户，就可以办理他生存中的全部题目，这件事变不大概，只有连合实际的需求，充足多的应用，才华让大模子人工智能为更多用户所用。

　　前两天美国苹果发布的iOS 18，股价涨了10%，涨出了一个茅台和腾讯，这是苹果汗青上第一次没有发布任何的硬件产物，而是发布一个概念，就是由于把Siri的概念重新包装了一遍，不能用“包装”，才失敬了，就是重新升级了一下，它就变成了你的助理，它用GPT技能做了交互。交互革命和生产力革命，毋庸置疑了，汗青上呆板人都在围绕人转，全部的终端都会被重新改造一遍。将来 siri就是我们和手机最紧张的交互窗口，将来 siri通过它对你的猜测就可以完成，苹果的展示里就有，siri说：来日诰日你妈妈要求来机场了，记得去接她。这是助理的方式，从前是很难想象的。

　　生产力革命是第一次把电能转化为通用智能，人工智能引发全天下、全社会特别关注的核心。固然从前我们有很多智能体系，但每个智能体系都要做开辟、做适配，以是它并不能实现边际本钱趋近于零，这次是可以实现的。

　　三星也发了一款手机。

　　保举各人用一下meta搜刮，搜一下就是一份陈诉。这两天ChatGPT推出了本身的社区GPT，搜刮就是一个强应用。由于从前搜刮要搜几十个网页，把内容整理出来。像Meta如许的产物，就可以把网络调出来，整理为一份陈诉，把必要一个晚上时间整理的陈诉变成了2分钟，搜刮肯定是紧张的革命。

　　尚有就是Copilot推出的SHC，它没有效英特尔的芯片，而是高通的芯片，高通的芯片是有45Flops的GPU，它可以独立处理惩罚 AI的各种运算，有大概你对电脑说本日晚上把哪些文章搜一遍，整理出哪些东西，你走了，它就在工作。从前盘算机也是一个生产力工作，但必须人陪伴它，以后就是把盘算机一放，它就把该做的做了。

　　我们讲讲本身的应用。讲了AI这么多强的地方，我要讲讲行业不可的地方。行业有很多故意思的事，看起来AI非常热但好的案例险些没有，除了大模子公司本身讲，真正在客户没有落实好的案例。而且本日很多人都在说我们都在等待一个好的to C应用，好像都没有出现。

　　尤其是我们在做企业应用，在做呆板人，它有三大拦阻：第一，我们的练习数据来自互联网，但互联网实际上是冰山显暴露在就寝的一部分，我有个比喻，跟牛顿学力学，是每天和他喝杯咖啡好，还是看他的天然科学的书，固然没有机遇和他每天喝咖啡，册本是批量教诲的产物，真恰好的知识是深入的扣问。很多知识来自一样平常的探究，来自集会会议，来自各种讨论，但是本日大模子得不到这些数据。以是，造成的题目本日在企业用大模子的时间，它答复得都很对，但没有什么用，都是知识性的答复，很难和私有的知识毗连起来。假如真的要企业应用，私有数据是关键。

　　这次苹果发布siri iOS18那么乐成，就是由于它把手机里的各种数据买通了，邮件等等都让大模子处理惩罚。着实都不是大模子，它在端上处理惩罚的好像就是8000万参数还是 1.2亿参数的模子，但数据买通之后，发作出来的能量惊人。以是我们提供的办理方案是肯定要连合企业的私有知识，像向量数据、RAG等等，但要做好都不轻易。

　　第二，数据的安全性。大数据和云最大的差别，云在云上，是不拆包的，只要租用我的堆栈，面积越大，我的买卖就越好，我不关心你存了什么。大模子不一样，存的数据它都要看一遍，才华写陈诉和整理，这些数据都颠末它了，假如不记录下来还是和人性相违背。即便美国OpenAI如许的公司都常常暴出数据被抓取等题目，以是企业就应该有本身的私有化大模子。个人以后要用好大模子，也应该有本身的大模子。苹果iOS18就是个人端的Copilot。

　　第三，天生式的模子，大模子的幻觉和不苟言笑的胡说八道，它不知道，但它不知道本身不知道。这是真正可以通达AGI的路，人说错话，立刻就知道，但大语言模子不是，它不苟言笑的讲林黛玉打虎的故事，讲得活龙活现，它没有反思本领。本日我们发现和大模子买通以后，客服必要 95%以上的本领，但大模子只能做到70%，这和模子无关，这构造大模子如今的天然的缺陷。

　　前两天有个东西上热搜了，你问大模子是13.8大还是 13.11大，好像只有一个大模子没有陷落，由于它就是字符串的学习。

　　本日业界提出了Agent的方式，通过一套规则大概自我反思、规划等等，和大语言模子在一起，去完成对一个具体场景的落地，还不能大泛。

　　尚有很多大模子公司以为找人用一下就可以把大模子做好，不是！我们应该是基于客户的诉求，做深度评估，才华做摆设。我以为真正把标杆才华把很多东西抽象出来。ChatGPT到本日发布才不到两年，财产链上尚有很多不成熟，它没有很好毗连的供应商，很多苦活只能本身干。就跟特斯拉做第一辆车，除了买本身的条记本电池，整个电路都要本身干一遍，才华做本身的产物，如今可以采购宁德期间 100度的平台加个壳就行了。以是，我以为如今大模子处于很早的期间，真的要做企业案例就要和企业深度打磨。

　　[多媒体演示]

　　这是我们资助企业深度打磨的思绪。但本日我们重要想分享怎样做好呆板人，通过私有化的方案不必要特别强的模子，但是做好Agent应用，再加上私有知识库在很多地方可以做到95%左右正确率，满意客户的需求，这件事是可以的。我们提出一个好的企业大模子有三个段位：第一个是给企业用；黄金是把私有数据做好，然后实行；真正的王者是企业怎样运营，大模子可以给出判定。以后大模子会跟新东方说董宇辉到底能不能走，付出多少本钱不让他走是合算的。通过大模子的精准测算，让本身将来怎么发展好，我以为这件事以后可以不消靠老俞一个同道了。由于美国就有如许的公司，专门通过大模子分析，给企业提供决定策划发起。

　　讲一下呆板人。

　　[多媒体演示]

　　这不是我画的图，而是一个基金画的图，任何技能都有核心技能，把云上的本领变成端上，第三部分就是应用。我以为本日各人讲应用什么时间会崛起？至少要到来岁会在C端看到一些应用开始出现，由于一些底子的东西，我看智谱AI也发布了一个文生视频，这个本领不错，很多人就会围绕它做开辟了，不再是简单的答复一句话。高通的那款芯片一出来，很多大厂都会在CPU上加上一个AI模块。这次苹果发布iOS18，专门说会给手机上开辟图形的API，只有如许才华出现好的AI应用，大概深度的AI。末了是物理的AI，本日最火的是智深智能，就是主动驾驶、智能座舱都是这个范畴。

　　本年我们练习了一个本身的模子，我们练习这个模子的核心就是让团队学习。第二我们就是对准小参数，由于我们以为以后我们的呆板人上要跑本地化的模子和云端的相连合。紧张的是我们和日语模子加了一下，这是开源模子里日语最好的，说着实话日本人没有怎么做过，日本人离我们有断代的差距，如今我们把日语做好，为日本人民提供大模子的服务。

　　这个PPT没有做好，好像是唱歌里相声说得最好、相声里唱歌最好的。我们说呆板人公司里拥有自研大模子，大模子里呆板人做得最好的。由于大模子对呆板人来说就是大脑，做呆板人，本身没有大脑，买大脑，肯定就做不好。以是我们把大模子定位为呆板人的大脑，实现就是实行部分。

　　18年我就说AI软件、硬件和服务，为什么这些年不停不温不火呢？坦诚一下，由于从前 AI的体验做不上去。我女儿常常讽刺我说：老爸，你做了一个智障呆板人？当时候雪不敷厚、坡度不久长，本日大语言模子会把这个体验一下子提拔很多。美国说大概会出现一个新物种，用GPU+大语言模子 +算力，出现一个类人的新物种，我以为呆板人就是如许的新物种。

　　表明一下刚才的谁人题目，为什么我们要做大模子？大模子就是它的大脑，假如我本身不训一个参数模子，有一天要训千亿数据模子，我们就是要端模一体化，根据场景应用找一款好的模子，做本身的大模子呆板人。大模子呆板人已经开始一点一点做了，如今我们在1.0阶段，但至少要做到3.0、4.0才有体验上革命般的进步。各人都看到过餐厅的递送、讲授等等，但怎么参加了大模子就不一样，各人知道Robot这个词在英语里是“劳动力、跟班 ”的意思，在老外眼里人主动的就是Robot，我们翻译为“呆板人”就有了人的概念。在产研上大部分是主动化呆板，没有人的概念，有大模子之后才华真正明白和决定，这是很大的改变。从前大部分都是基于规则，就像中午和罗总聊的，从前都是短刀端到端。

　　总的来说，它会像人一样明白天下，而且会作出决定，这个决定不必要人管中心的过程，这是呆板人的极大地提拔，也是工作量极大地缩小。反正总体来说就是很锋利。

　　[多媒体演示]

　　这是新潮传媒几个展厅都放了呆板人，而且声音是张继学的，如今有了大模子，读一下企业简介，就可以做先容和答复了。我们和投资的一家公司做的呆板人，各人看到直播间语言的声音，像一个小姐姐一样，都是AI天生的，说带我去生蚝区看看，她就去生蚝区，会说“我们的生蚝又大又奇怪，赶快来吧”。

　　请小姐姐直播一个月大概卖几千块优惠券，但用呆板人一天卖几千块钱，由于用小姐姐太累了受不了，但是呆板人一天可以12小时，假如你乐意乃至可以24小时。这是给双汇卖鳕鱼肠。

　　本日很火的是具身智能的人形呆板人，但是我还是要说本身的观点，我对双足在贸易化乐成不是很看好，作为科研是可以，假如落地到产线上工作，没有三五年就不大概。只管马斯克以为可以，但还是很难，双臂这件是用臂做一些从前不好做的工作是大概的。以是我们在具身智能发展的是双臂。

　　本日有两个端，一个是Phone，一个是PC，尚有一个是汽车，下一个肯定是呆板人，让呆板人插上翅膀就会完全不一样。末了盼望全部企业家、创业者都一起尽力用好AI，插上AI的翅膀。

　　谢谢各人！

　　新浪声明：全部集会会议实录均为现场速记整理，未经演讲者审视，新浪网登载此文出于转达更多信息之目标，并不意味着附和其观点或证明其形貌。