GPT-5要来了?AI行业会发生哪些剧变?

尽管在今年上半年,各个 AI 专家、学者已经多次联合发表公开信,呼吁人们重视生成式 AI 的潜在风险,而 OpenAI 当时也宣布短期内不会有训练 GPT-5 的计划。

从 chatGPT 问世至今,AI 就在以月为单位飞速进化着,其模型之多,迭代之快,让很多人不不禁惊觉:人类似乎真的站在了 AGI 大门的边缘。

而最近,美国专利商标局 (USPTO) 披露的一份文件显示:OpenAI 于 7 月 18 日提交了「GPT-5」的商标申请。并且已经被接收。

GPT-5要来了?AI行业会发生哪些剧变?
USPTO 文件截图

尽管在今年上半年,各个 AI 专家、学者已经多次联合发表公开信,呼吁人们重视生成式 AI 的潜在风险,而 OpenAI 当时也宣布短期内不会有训练 GPT-5 的计划。

然而,科技的诱惑,终究还是让人类打破了禁忌的边界。

在这次披露的申请书中,OpenAI 提到,尚未发布的GPT-5 将具备众多 GPT-4 所没有的能力,而且几乎每一项都剑指 AGI。

GPT-5要来了?AI行业会发生哪些剧变?
USPTO 文件截图

那么,这样的改变,对 AI 和人类而言,又意味着什么?

今天,本文就将尝试从 OpenAI 的申请文件中披露的有限信息,对 GPT-5 可能的功能、变化,及所造成的影响,进行一番简单的剖析。

通往 AGI 之路

在此次披露的文件中,OpenAI 最先提到的一个变化,就是多模态功能的加强。

具体来说,GPT-5 的功能包括把文本或语音从一种语言翻译成另一种语言、语音识别、生成文本和语音等。

GPT-5要来了?AI行业会发生哪些剧变?

虽然在现在的 GPT-4 中,用户同样可以实现不同语种间的翻译,但既然翻译功能在这里被单独挑出来,想必是重新优化过了。

那 OpenAI 为何会如此突出 GPT-5 的翻译能力?

这或许是因为,GPT 走向通用的前提之一,就是尽可能缩小不同语言使用大模型的成本差距

此前,牛津大学的研究成果显示,由于 OpenAI 等服务所采用的服务器成本衡量,和计费的方式的不同,英语输入和输出的费用要比其他语言低得多。

其中简体中文的费用大约是英语的两倍,西班牙语是英语的 1.5 倍,而缅甸的掸语则是英语的 15 倍。

GPT-5要来了?AI行业会发生哪些剧变?

因为像中文这样的语言有着不同、更复杂的结构,导致它们需要更高的词元化率。

例如,根据 OpenAI 的 GPT3 分词器 ,「你的爱意(your affection)」的词元,在英语中只需要两个词元,但在简体中文中需要八个词元。

这意味着,除了英语之外的其他语言,使用和训练模型要贵得多。

而一旦翻越了「语言障碍」这道槛,无疑会直接地扫清横亘在 GPT 面前的这条通用性障碍。

除此之外,文件中突出的语音识别功能,看似只是一个不起眼的改动,但从某种程度上说,这也是 OpenAI 对 GPT-5 在通往 AGI 的道路上铺下的又一块路砖。

众所周知,在今后的大模型发展方向上,模型变得边缘化、终端化,已经成了一个愈发明显的趋势。

自从今年 7 月,高通发布了能在手机上运行的 10 亿参数大模型后,荣耀、苹果等厂商,也相继宣布要推出自身的「大模型」手机。

GPT-5要来了?AI行业会发生哪些剧变?

以手机为起点,将来的 AI 数据,将会越来越多地在摄像头、传感器、自动驾驶等终端侧进行处理。

而在这样的应用场景中,语音识别无疑更便捷、高效。

例如,AI 语言模型可以让驾驶员可以通过语音控制车辆行驶。将驾驶员的语音指令转化为可执行的指令,例如启动、停止、加速、刹车等操作。

而类似于 SIri 那样存在于手机系统中的智能助手,也会优先考虑通过语音指令来进行控制。

由此可见,语音识别并非只是锦上添花,而是 GPT-5 进入终端侧的「标配」,而通过在这一个个终端设备的下沉,GPT-5 也将由此获得更多边缘化的、非语言的数据结构。

毕竟,大模型发展至今,能汲取的文本数据,已经差不多了,要想在通往 AGI 的路上再上一个台阶,这种「非文本」的数据,就显得至关重要。

挑战专家模型

除了上述特点外,OpenAI 提交的文件中还提到:「GPT-5 可能还具备学习、分析、分类和回应数据的能力」。

从目前人工智能的发展趋势来看,这很可能是指 GPT-5 具备了类似智能体的主动学习能力。

而这样的能力,将会使 GPT-5 与以往只能被动地通过人类投喂数据,来学习新知识的模型相比,产生本质的区别。

GPT-5要来了?AI行业会发生哪些剧变?

具体来说,主动学习的能力,是指模型可以根据自身的目标和需求,自主地选择、获取和处理数据,而不是仅仅依赖于人类提供的数据。

这样可以让模型更有效地利用数据中的信息和知识,更灵活地适应不同的数据环境和任务场景,而不只是被动地接收和输出数据。

而这样的能力,在 GPT-5 面临一些比较陌生、垂直的领域时,就显得尤为重要。

一些特定的领域,比如医学、法律、金融等,通常有着自己特定的术语、规则和知识体系,对于普通的语言模型来说,可能难以理解和处理。

如果 GPT-5 具备了主动学习的能力,它可以自动地从网络上搜集和更新这些领域的相关数据,分析和分类这些领域的基本概念、重要原理和最新动态,以及回应这些领域的常见问题、典型案例和实际应用。

GPT-5要来了?AI行业会发生哪些剧变?

如此,可以让 GPT-5 更快地掌握这些领域的专业知识,更准确、高效地完成这些领域的相应任务。

而这一切,正是其迈向真正的通用大模型的关键。

因为如果 GPT 始终需要接入特定的「专家模型」,才能解决专业任务,那它就谈不上真正的「通用」。

因为这样会导致 GPT 对于不同领域和场景的智能能力存在差异和依赖,而且也会增加 GPT 与「专家模型」的沟通和协调成本,而不能保证在任何情况下都能实现高质量的服务。

此前,外媒 Semianalysis 就对今年 3 月发布的 GPT-4 进行了揭秘,曝光了 OpenAI 采用混合专家模型来构建 GPT-4。

根据爆料,GPT-4 使用了 16 个混合专家模型 (mixture of experts),每个有 1110 亿个参数,每次前向传递路由经过两个专家模型。

然而,更多的专家模型意味着更难泛化,也更难实现收敛。

GPT-5要来了?AI行业会发生哪些剧变?

这是因为每个专家模型都有自己的参数和策略,往往很难协调一致,进而使得 GPT 难以平衡和「顾全大局」。

而在具备了主动学习的能力后,GPT-5 将有可能利用多模态的理解和推理能力,以及知识图谱和数据库,来分析和理解获取到的数据,并通过聚类算法和分类器,对相关数据进行关联和归纳。

如此,GPT-5 就能根据不同的数据环境和任务场景,有效地利用数据中的信息和知识。

取代更多工作

如前所述,在扫清了语言障碍,并以便捷的语音识别功能进入终端侧后,GPT-5 将通过持续的主动学习能力,不断汲取不同场景、领域和模态下的知识,进而向着 AGI 的道路高速前行。

可以预见的是,当具备了这样强大「通用性」的 GPT-5,开始向各领域扩散后,除了少数具有数据壁垒的行业(如医疗)外,大部分垂直领域的大模型,都将会逐渐黯然失色。

因为说到底,相当一部分专家或垂直大模型,本质上是某些企业算力、数据不足,无法高攀「通用大模型」,而不得不退而求其次的产物(这在国内尤为明显)。

GPT-5要来了?AI行业会发生哪些剧变?

倘若一个通用大模型,凭借强大的学习能力,就能够精通大部分行业,那谁又会愿意繁琐地在不同的模型之间切换,并为不同的模型承担多份训练、使用成本呢?

从这点上来说,专家模型逐渐被通用模型取代,是人类在通往 AGI 道路上一个不可避免的历史过程。

而与此相伴的另一个现象,则是更多细分的、琐碎的工作被取代。

GPT-5要来了?AI行业会发生哪些剧变?

因为在有了更强大的通用大模型后,人们将会发现,其实很多岗位的工作内容,是可以被合并、被统合的。

产品经理和数据分析师就是一个可能的例子。

例如,在一个新产品开发的项目中,GPT-5 可以根据给定的产品概念或需求,从网络上搜索相关的市场调研、竞品分析、用户画像等数据,并下载到自己的内存中。

之后,它会通过自己的多模态的理解和逻辑推理能力,以及知识图谱和数据库,来分析和理解获取到的数据。

GPT-5要来了?AI行业会发生哪些剧变?

在得到了相应的数据,并将其进行分类和组织后,GPT-5 就会通过语言理解能力,从对话系统的反馈中学习相关的营销策略、用户反馈等信息,并将其与给定的产品概念或需求进行比较和评估。

如此一来,产品经理和数据分析师这两个岗位,就被高效地「合并」了。

而在通往 AGI 的未尽之路上,这样被合并和取代的岗位,还有无数种。

因此,一个通用性更强的 GPT-5,对人类而言,既是生产力进步的福音,但同时也是行业大地震的前奏。

到了那时,许多尚不具备通用大模型能力,又缺乏行业壁垒的企业,将会如沙子堆起的城堡一样,脆弱地倒下。

矢量AI门户网,优质AI资讯内容平台

(0)
上一篇 2023年8月7日 上午11:49
下一篇 2023年8月8日 上午11:34

相关推荐

  • 大语言模型“百宝书”,一文缕清所有大模型

    大模型可以分为基座模型和在基座模型上进行指令微调、人类反馈对齐等instruction-tuning之后的微调模型。但实际上,正如艾伦研究所的文章‘How Far Can Camels Go?’所指明的:不同的指令微调数据集可以释放或者增强特定的能力,但并没有一个数据集或者组合可以在所有的评估中提供最佳性能,因此,我们需要一个更大强大的基座模型。

    2023年7月31日
    112
  • 6000字解读:当前大语言模型LLM研究的10大挑战

    输出环境是一个已经被大量讨论过的话题,所以这里我会长话短说。当人工智能模型胡编乱造时,就会产生幻觉。对于许多创意用例来说,幻觉属于功能的一种。然而,对于大多数应用场景来说,幻觉属于一种错误。最近,我与 Dropbox、Langchain、Elastics 和 Anthropic 的专家共同参加了一个关于 LLM 的专题讨论会,在他们看来,企业在实际生产中,应用 LLM 需要克服的首要障碍就是幻觉输出。

    2023年8月22日
    99
  • 苹果公司加入大模型战争

    不过,根据 8 月初苹果的财报,营收连续第三个季度下降,也是苹果自 2016 年以来最持久的财报表现下滑,主要是 iPhone 消费设备需求的下降,因为苹果利润的主要驱动力很大一部分来自于 iPhone,那么,大语言模型会给苹果带来新的增长点吗?

    2023年9月8日
    117

发表回复

登录后才能评论