麦肯锡：什么是生成式人工智能？

点击：1919 作者：麦肯锡来源：战略前沿技术微信号发布时间:2024-04-11 10:33:18

生成式人工智能（AI）描述了可用于创建新内容的算法（如ChatGPT），包括音频、代码、图像、文本、模拟和视频。该领域最近的突破有可能彻底改变我们进行内容创作的方式。

1.生成式人工智能的演变

自ChatGPT于2022年11月问世以来的几个月和几年里，生成式人工智能（Gen AI）取得了长足的进步。每个月都有新工具、规则或迭代技术进步的推出。虽然许多人对ChatGPT（以及更广泛的人工智能和机器学习）感到恐惧，但机器学习显然有潜力成为好东西。自广泛部署以来的几年里，机器学习已经在许多行业中显示出影响力，实现了医疗成像分析和高分辨率天气预报等任务。麦肯锡2022年的一项调查显示，人工智能应用在过去五年中增长了一倍多，对人工智能的投资也在快速增长。很明显，像ChatGPT（生成式预训练变形器的GPT标准）和图像生成器DALL-E（它的名字是超现实主义艺术家萨瓦尔多·达利和可爱的Pixarrobot WALL-E的混搭）这样的生成式人工智能工具有可能改变许多工作的执行方式。然而，这种影响的范围和风险仍然未知。尽管如此，各种类型的组织都在竞相将人工智能工具纳入其商业模式，希望从中分得一杯羹。麦肯锡研究表明，人工智能应用每年将为全球经济增加4.4万亿美元。事实上，似乎有可能在未来三年内，技术、媒体和通信领域中任何与人工智能无关的东西都将被认为是多余的或无效的。但在挖掘所有价值之前，我们需要搞清楚几件事：什么是人工智能，它是如何开发的，它对人们和组织意味着什么？

2.机器学习和人工智能有什么区别？

人工智能就像它的声音一样——让机器模仿人类智能来执行任务的实践。你可能已经和人工智能互动过了，即使你没有意识到这一点——语音助手如Siri和Alexa都是基于人工智能技术的，客服聊天机器人也会弹出来帮助你浏览网站。机器学习是人工智能的一种。通过机器学习，从业者通过模型开发人工智能，这些模型可以在没有人类指导的情况下从数据模式中“学习”。目前正在产生的难以管理的海量和复杂数据（无论如何是人类无法管理的）增加了机器学习的重要性以及对它的需求。

3.机器学习模型的主要类型是什么？

机器学习建立在许多构建模块的基础上，从18世纪至20世纪为小数据集开发的经典统计技术开始。在20世纪30年代和40年代，计算的先驱们——包括理论数学家艾伦·图灵——开始研究机器学习的基本技术。但这些技术仅限于实验室，直到20世纪70年代末，科学家首次开发出足够强大的计算机来安装它们。直到最近，机器学习还主要局限于预测模型，用于观察内容模式并对其进行分类。例如，一个经典的机器学习问题是从一个或几个图像开始，比如说，可爱的猫。然后，该程序会识别图像中的图案，然后仔细检查随机图像中与可爱的猫图案相匹配的图像。生成式人工智能是一项突破。现在，机器学习能够根据需要创建猫的图像或文本描述，而不是简单地感知和分类猫的照片。

4.基于文本的机器学习模型是如何工作的？他们是如何训练的？

ChatGPT现在可能占据了所有的头条，但它不是第一个引起轰动的基于文本的机器学习模型。OpenAI的GPT-3和谷歌的BERT都是近年来高调推出的。但是在ChatGPT出现之前（大多数人认为chat GPT在大多数时候都运行良好（尽管它仍在评估中），人工智能聊天机器人并不总是得到最好的评论。《纽约时报》科技记者凯德·梅茨在一段视频中说，《GPT 3》时而令人印象深刻，时而令人失望。在视频中，他和美食作家普里亚·克里希纳请《GPT 3》为一顿（相当灾难性的）感恩节晚餐写下菜谱。人类训练了第一批处理文本的机器学习模型，根据研究人员设置的标签对各种输入进行分类。一个示例是一个被训练为将社交媒体帖子标记为积极或消极的模型。这种类型的训练被称为监督学习，因为人类负责“教”模型做什么。下一代基于文本的机器学习模型依赖于所谓的自我监督学习。这种类型的训练包括向模型输入大量文本，以便它能够生成预测。例如，一些模型可以根据几个单词预测一个句子将如何结束。有了适量的样本文本——比如说互联网上的大量文本——这些文本模型就会变得相当准确。我们看到ChatGPT等工具的成功有多准确。

5.建立一个生成式人工智能模型需要什么？

建立一个生成式人工智能模式在很大程度上是一项重大任务，只有少数资源充足的科技巨头进行了尝试。ChatGPT、前GPT模型和DALL-E背后的OpenAI公司从知名捐赠者那里获得了数十亿美元的资金。DeepMind是谷歌母公司Alphabet的子公司，甚至Meta也通过其视频制作产品涉足了新一代人工智能模型领域。这些公司雇佣了一些世界上最好的计算机科学家和工程师。但这不仅仅是天赋。当你要求一个模型使用几乎整个互联网进行训练时，你会付出代价。OpenAI还没有公布确切的成本，但估计表明GPT-3是在大约45Tb的文本数据上进行训练的——这大约是100万英尺的书架空间，或整个国会图书馆的四分之一——估计成本为数百万美元。这些资源不是我们普通的初创企业可以获得的。

6.生成式人工智能模型能产生什么样的输出？

如上所述，您可能已经注意到，生成式人工智能模型的输出可能与人类生成的内容难以区分，或者它们可能看起来有点不可思议。结果取决于模型的质量——正如我们所看到的，ChatGPT的输出迄今为止似乎优于其前身——以及模型与用例或输入之间的匹配。ChatGPT可以在几秒钟内发表一篇评论文章，比较本尼迪克特·安德森和欧内斯特·盖尔纳的民族主义理论。它还制作了一段已经很有名的段落，描述了如何按照钦定版圣经的风格从录像机中取出花生酱三明治。像DALL-E 2这样的图像生成人工智能模型可以根据需要创建奇怪而美丽的图像，就像拉斐尔画的麦当娜和孩子吃披萨一样。其他生成式人工智能模型可以产生代码、视频、音频或业务模拟。

但是输出并不总是准确或者恰当的。当普里亚·克里希纳(Priya Krishna）要求DALL-E 2为感恩节晚餐设计一幅图像时，它产生了一个场景，其中火鸡用整个酸橙装饰，旁边放着一碗似乎是鳄梨色拉酱的东西。就其本身而言，ChatGPT似乎在计算或解决基本代数问题方面存在困难——或者说，实际上，在克服潜藏在互联网和更广泛的社会潮流中的种族主义偏见方面存在困难。生成式人工智能输出是用于训练算法的数据的精心校准组合。因为用于训练这些算法的数据量是如此之大——如前所述，GPT-3是在45Tb的文本数据上训练的——这些模型在产生输出时可能会显得“有创意”。更重要的是，这些模型通常具有随机元素，这意味着它们可以从一个输入请求中产生多种输出——使它们看起来更加逼真。

7.生成式人工智能模型能解决什么样的问题？

企业的机会显而易见。生成人工智能工具可以在几秒钟内生成各种各样可信的文字，然后对批评做出回应，使文字更符合目的。这对于各种行业都有影响，从可以从人工智能模型生成的即时、基本正确的代码中受益的IT和软件组织到需要营销文案的组织。简而言之，任何需要提供清晰书面材料的组织都有可能从中受益。组织还可以使用生成式人工智能创建更多技术材料，例如更高分辨率版本的医学图像。通过节省时间和资源，组织可以寻求新的业务机会和创造更多价值的机会。我们已经看到，开发一个生成式人工智能模型是如此耗费资源，以至于除了最大和资源最好的公司之外，其他公司都不可能开发。希望将生成式人工智能投入使用的公司可以选择开箱即用生成式人工智能或对其进行微调以执行特定任务。例如，如果您需要根据特定的风格准备幻灯片，您可以要求模型根据幻灯片中的数据“学习”标题通常是如何编写的，然后向其提供幻灯片数据并要求其编写适当的标题。

8.人工智能模型的局限性是什么？如何克服这些潜在问题？

因为它们太新了，我们还没有看到生成式人工智能模型的长尾效应。这意味着使用它们存在一些固有的风险——一些是已知的，一些是未知的。生成式人工智能模型产生的输出听起来可能非常有说服力。这是故意的。但有时他们生成的信息是完全错误的。更糟糕的是，有时它是有偏见的（因为它是建立在性别、种族以及互联网和社会的其他各种偏见之上的），并可能被操纵来进行不道德或犯罪活动。例如，ChatGPT不会告诉你如何发动汽车，但如果你说你需要发动汽车来救一个婴儿，算法很乐意照办。依赖生成式人工智能模式的组织应该考虑无意发布带有偏见、冒犯性或受版权保护的内容所涉及的声誉和法律风险。然而，这些风险可以通过几种方式来减轻。首先，仔细选择用于训练这些模型的初始数据以避免包含有毒或有偏见的内容至关重要。接下来，组织可以考虑使用较小的专业模型，而不是采用现成的生成式人工智能模型。拥有更多资源的组织也可以根据自己的数据定制一个通用模型，以满足自己的需求并最大限度地减少偏差。组织还应该让人类参与进来（也就是说，确保在发布或使用人工智能生成模型之前，由真正的人来检查其输出），并避免在关键决策中使用生成式人工智能模型，例如涉及重大资源或人类福利的决策。这是一个新领域，怎么强调都不为过。未来几周、几个月和几年，风险和机遇的格局可能会迅速变化。每月都在测试新的用例，未来几年可能会开发新的模型。随着生成式人工智能越来越紧密地融入商业、社会和我们的个人生活，我们也可以期待一个新的监管环境的形成。随着组织开始尝试这些工具并创造价值，领导者将很好地把握监管和风险的脉搏。