“买个菜不消开坦克去”！环球 AI海潮开始聚焦“小而美”「环球海鰶」

财联社7月5日讯（编辑潇湘）在环球范围内，人工智能军备比赛最初的出发点是寻求 “大”：巨型模子在海量的数据上举行练习，试图模仿具有人类智能程度的人工智能。

然而如今，大量科技巨头和初创企业正在开始思量缩小AI软件的规模，使其更自制、更快速、更专业……

（图片来源网络，侵删）

这类AI软件被称为小型语言模子 (SLM)或中型语言模子，利用较少的数据举行练习，通常专为特定任务而计划。

作为对比，那些着名的大型语言模子 (LLM)，如OpenAI的GPT-4，开辟本钱高出 1亿美元，练习的参数到达了逾1万亿。而较小的语言模子则通常在较窄的数据集上举行练习 ——比方，大概仅仅聚焦于法律题目上，其练习本钱每每大概不到1000万美元，参数不到100亿。较小的模子也将斲丧较少的算力，因此相应每个查询的本钱也较低。

（图片来源网络，侵删）

近几个月来，微软就正在大力大举宣传其名为“Phi”轻量级AI模子系列。微软首席实行官Satya Nadella表现，这些模子的巨细只有OpenAI的ChatGPT免费模子的1/100，而实行很多任务的结果却险些一样好。

微软首席商务官Yusuf Mehdi表现，“我以为，我们越来越有来由信托，将来将是一个由差别 (巨细 )模子构成的天下。”

Mehdi称，微软是环球首批在天生式人工智能上押注数十亿美元的大型科技公司之一。而我们也很快意识到，人工智能的运营本钱比公司最初预计的要高。

微软近来还推出了新型的AI条记本电脑，搭载数十个人工智能模子举行搜刮和图像天生。这些模子必要用到的数据非常少，可以在终端装备上运行，而不必要像ChatGPT那样访问巨大的基于云端的数据中心。

谷歌以及人工智能初创公司Mistral、Anthropic和Cohere本年也发布了更小的模子。苹果在六月份公布该公司的AI蹊径图时，也筹划利用小型模子，如许就可以完全在手机上运行软件，使其更为快捷方便、也更为安全。

就连不停处于大型模子模子海潮前沿的OpenAI，也在5月发布了其旗舰模子的新版本GPT-4o，并称该模子运营本钱更低。一位发言人OpenAI表现，该公司对将来发布更小的模子持开放态度。

AI模子海潮开始聚焦“小而美”

对于很多任务来说——比如汇总文档或天生图像，大型语言模子如今显得大概会有些“奢侈”。一些行业人士将此形容为“相称于开着坦克去买菜”。

如今从事区块链技能研究的Illia Polosukhin是2017年谷歌一篇开创性论文的作者之一，该论文为当前的天生式人工智能高潮奠定了底子。Polosukhin迩来就表现，单单盘算 “2+2”不应该必要举行无数次运算。

究竟上，从财务本钱的考量来看，在天生式人工智能技能的回报尚不明白的环境下，企业和斲丧者也不停在探求以更低本钱运行AI的方法。

位于以色列特拉维夫的人工智能公司AI21 Labs的连合首创人Yoav Shoham称，由于只需利用较少的算力，在很多环境下，小型模子答复题目的本钱仅为大型语言模子的六分之一。假如你要举行数十万乃至数百万次答复，利用大模子在经济上着实行不通。

当前的关键在于，怎样更有效地将这些较小的模子会合在一组数据上，如内部通讯、法律文件或贩卖数字，以实行撰写电子邮件等特定任务 ——这一练习过程被称为微调(Fine-tuning)。通过微调，可以让小型模子在实行这些任务时与大型语言模子一样有效，而本钱只是大型模子的一小部分。

初创公司Snorkel AI的连合首创人Alex Ratner表现，“让这些更小、更专业的模子在这些更枯燥但更紧张的范畴工作，是如今人工智能的前沿范畴。”

Snorkel AI如今的业务范围包罗资助企业定制人工智能模子。

企业用户也正转向小模子？

在企业用户端，名誉评级公司益百利迩来已将其用于金融咨询和客户服务的AI谈天呆板人，从大语言模子转向了小语言模子。

益百利首席数据官Ali Khan表现，在公司内部数据上举行练习时，小型模子的表现与大型模子中分秋色，而本钱仅为大型模子的一小部分。他表现，这些小模子可以针对一个明白的题目范畴和一系列任务举行特定练习。

Salesforce人工智能部分主管Clara Shih则表现，这些小模子的相应速率相比大模子也更快。

Shih称，“利用大型模子你会付出过高的本钱而且有耽误题目。偶然间也根本用不着。”

值得一提的是，在开始向小语言模子变化的同时，诸多AI巨头大型语言模子的迭代速率也在放缓。

自OpenAI客岁发布GPT 4(与之前的模子 GPT 3.5相比，功能有了明显提拔 )以来，还没有新的迭代模子 (GPT 5)发布。研究职员以为，造成这种环境的缘故起因包罗用于练习的高质量新数据稀缺。

这一趋势也让人们开始更为关注小模子。领导 Phi模子项目标微软公司高管塞Sébastien Bubeck表现，“如今正是各人都在等待的一个小间歇期，这会让人们的留意力转向，他们会想，‘好吧，我们还能不能让这些东西更高效？’”

如今，还不清楚这种迭代停滞是临时的，还是遭遇了一个更为棘手的技能瓶颈题目。但是，小型语言模子的大量涌现，仍阐明白人工智能正在从科幻小说般的梦幻演示，演变成了不那么令人高兴的贸易实际。

固然，很多公司并没有完全放弃大型语言模子。苹果已公布将在其Siri助手中参加 ChatGPT，以实行撰写电子邮件等更复杂的任务。微软表现，其最新版的Windows也将集成OpenAI的最新模子。不外，两家公司都只是将OpenAI集成作为其团体人工智能方案的一部分，而显然并没有把全部的筹码都押注于此。