雷吉和皇家对经济、历史、加密货币、商业播客的看法
人工智能的世界 - 什么是大型语言模型?
June 10, 2023
在两年前的第一集中,题为“加密货币,第七层”,我们建议加密货币很可能是过去40到45年的第七个重大技术事件,从集中式计算架构开始。在第一个播客中,我们暗示第八层隐藏起来,当时我们大多数人都不知道。我们现在确信,这第 8 层现在非常清楚地存在于我们中间,在过去的 6 个月里轰轰烈烈地到来。 由于人工智能(AI)组件的快速发展,我们社会的经济和技术部门都面临着旋风压力。
这是对过去十年中人工智能逐渐发展的简要概述,这些发展导致了该领域的重大进步。
深度学习:过去十年见证了神经网络的复兴,特别是深度学习,这是人工智能进步的主要驱动力。开发新技术,例如用于图像识别和循环神经网络(RNN)的卷积神经网络(CNN)以及用于自然语言处理的转换器,大大提高了AI在各种任务中的性能。
大规模数据集:用于训练 AI 模型的大规模数据集的可用性在提高其性能方面发挥了至关重要的作用。这些数据集促进了更复杂的模型的训练,使他们能够从广泛的例子中学习并推广到新的情况。计算能力:计算能力的提高,特别是随着图形处理单元(GPU)和张量处理单元(TPU)等专用硬件的出现,使研究人员能够训练更大更深的神经网络,这有助于人工智能的快速发展。 迁移学习:迁移学习等技术涉及在大型数据集上进行预训练模型并针对特定任务对其进行微调,使 AI 模型能够以相对较少的任务特定数据实现最先进的性能。大型语言模型(LLM):在过去的几年中,已经发生了重大转变,转向训练更大,更强大的语言模型,例如OpenAI的GPT-3。这些模型在各种NLP任务中表现出了卓越的能力,包括文本生成,翻译,摘要和问答。