首页 EV新闻

时代3.0通用AGI|盖世大学堂汽车大模型应用系列知识讲解

2025-02-20 16:34 来源: 盖世汽车 作者: 陈琳铃

在当今科技飞速发展的时代,通用人工智能(AGI)成为备受瞩目的焦点。AGI作为人工智能的一种理论形式,具备像人类一样学习和推理的能力,有望解决复杂问题并独立做出决策。然而,目前其定义尚未达成广泛共识,这也从侧面反映出该领域仍处于不断探索与发展的阶段。深入探究通用AGI的内涵、技术演进路径、在实际应用中的表现,以及其对社会经济等多方面的潜在影响,对于把握科技发展趋势、应对未来挑战具有重要意义。

时代3.0通用AGI|盖世大学堂汽车大模型应用系列知识讲解

人工智能是一个广泛的概念,它涵盖了所有研究非生物智能化算法的领域和方法论。在人工智能的发展历程中,机器学习逐渐崭露头角。机器学习旨在从数据中学习规律和模式,进而实现自主预测和决策。而深度学习作为机器学习的重要分支,凭借深度神经网络进行训练,近年来取得了显著进展,成为研究和应用的热门方向。

在深度学习领域,模型主要分为非预训练模型和预训练模型。非预训练模型参数量相对较少,个体可以直接进行训练,在当下的工程实践中,这种基于中等规模模型和算力、专注细分市场的方式较为务实。与之不同,预训练模型则依赖超大算力集群进行训练,训练完成后向外部提供使用。预训练本质上是一种合作方式,通常预训练模型体量巨大,普通个体或公司难以承担训练成本。以语言类大模型为例,美国在该领域处于领先地位,国内相关企业在发展过程中,虽然在工程化和体量方面有一定积累,但在技术基准等方面可能对海外存在一定借鉴。

从模型类型来看,当前预训练模型以生成式为主,鉴别式相对较少,但对于最终的AGI而言,这两种类型都不可或缺。在多模态大模型领域,呈现出百花齐放的态势,其中EQE支架或矩阵大模型,以及以ChatGPT、Sora为代表的AIGC类生成式模型是主要的发展方向,但它们都还处于发展阶段。

通用AGI致力于解决自主学习和自主受控的问题,尽管距离实现这一目标所需的时间存在不同预测,乐观者认为五年内可能取得重大突破,悲观者则认为需要五十年甚至更久,但多数人期望在有生之年能够见证其实现。关于AGI的定义有多种描述,其中一种较为务实的定义是:一个在几乎所有(95%以上)具有经济价值的工作中能够匹敌甚至超过人类的AI系统,且这些工作涉及执行物理的、现实世界中的行动,其本质是具备解决问题(消除差异)的能力。这种定义从经济价值和实际工作能力的角度出发,更具可操作性和现实意义。

NVIDIA创始人黄仁勋提出,若将AGI定义为通过一系列测试,如数学、推理、历史、生物学、医学、律师考试以及SAT、MCAT等,他认为在五年内AI有可能在这些测试上表现出色。然而,如果将AGI定义为拥有人类的智能,由于人类智能难以准确定义,实现起来则困难重重。相比之下,通过测试的定义更加量化,为AGI的开发提供了明确的目标。

在实现AGI的过程中,数据获取和处理方式至关重要。传统的数据标注方式在大模型和自动驾驶等领域面临困境。以特斯拉为例,尽管其车辆基数庞大,但在数据采集过程中,即便按照其较高的搜集标准,也难以获取所有场景数据,数据逐渐趋于自洽,出现类似信息茧房的情况。此时,合成数据成为新的解决方案。模型可以利用自身生成的优质合成数据进行学习,就如同人类通过不断处理实际场景来推演未来世界发展一样,模型通过预测下一步发生的情况并与实际情况对比,有望推动自动驾驶智能乃至通用人工智能的巨大飞跃。

时代3.0通用AGI|盖世大学堂汽车大模型应用系列知识讲解

与此同时,在模型训练中,放弃数据标注并让强化学习对模型进行最终的价值判断成为重要趋势。在这个过程中,人类或现实世界将作为环境,为AI的行为提供奖励模型,判断其行动的好坏。合成数据虽然准确度不如人工标注数据,但成本低廉。未来,人类的直接反馈可能主要用于建立新的奖励模型或进行数据质量检查,而模型将更多地实现自我生成和监督,形成自我反馈循环。在机器学习领域,基于人类反馈的强化学习(RLHF)以及模仿学习等方法受到更多关注,这些方法能够更高效地利用计算资源,推动模型训练的发展。

然而,模型的发展也带来了诸多问题,其中安全和伦理问题尤为突出。以ChatGPT为例,其在使用过程中需要进行大量的对齐工作,以确保模型的输出符合人类的价值观和安全要求。否则,强大的模型技术可能被黑客、诈骗犯利用,对个人隐私和社会安全造成威胁。比如,在当前的技术环境下,视频、声音、语言等都可以被模拟,传统的沟通方式面临挑战,人们甚至需要考虑升级加密通讯方式,如采用非固定式的暗号进行交流,以提高安全性。

此外,模型在逻辑构建方面存在一定局限性。目前的模型大多基于归纳式逻辑,这种思维方式难以产生完全严谨的逻辑,导致“幻觉”问题难以彻底解决。以ChatGPT为例,它在回复时往往是条件反射式的,缺乏从第一性原理出发的演绎性思维,无法像人类一样在完成简单实践的基础上,通过学习理论达成复杂实践。尽管在某些特定领域,如确定性游戏规则和全感知的场景下,模型已经展现出强大的能力,如阿尔法狗在围棋领域战胜人类,但在处理感知不确定、规则不明确的问题时,模型仍然存在缺陷。

从AGI的构成来看,具身智能可能是其底层的重要组成部分。具身智能通过机器人与真实世界进行直接交互,获取大量的知识和经验。这些知识和经验以类似语言的逻辑进行凝练,形成智能体的认知。语言模型虽然在信息处理方面具有优势,但与真实世界交互的知识量相比,仍然有限。在未来,智能机器人可能会形成类似人类的社会结构,它们之间的沟通可能依赖于一种称为“token”的编码形式。token可以理解为信息熵较低的编码,它能够等价表示视频、图像、文档等信息。例如,100万token的信息量大致相当于一部电影、一个长文档或一个完整的代码库。与传统的信息交换方式相比,token编码的效率更高,能够减少信息传递过程中的噪声和冗余信息。这也引发了人们对于未来脑机接口发展的思考,如果脑机接口技术能够实现更高效的信息传输,人们将面临是否使用该技术的抉择,因为使用脑机接口可能带来经济生产上的优势,但也可能面临隐私泄露和被控制的风险。

实现持续性的自我更新是AGI的重要特点之一,但目前尚未有模型能够在这方面表现出色。当前的模型训练通常采用云端训练、车端部署的方式,这种方式存在工作周期不一致的问题,导致模型更新速度较慢,无法及时适应新的情况。黄仁勋提出未来可能会出现循环训练的逻辑,使学习、训练、推理、部署和应用过程融为一体。在这种模式下,模型可以基于真实世界数据和合成数据进行持续的强化学习,不断自我改进。然而,要实现这一目标,还面临计算成本高、算力和功耗大等问题,只有当这些问题得到有效解决,训练和部署一体化的潜在经济价值才能得以实现。

在商业环境中,AGI相关产品的成长逻辑与传统应用程序有所不同。传统应用程序,如Microsoft Excel,虽然在功能上不断更新,但使用效率的提升往往较为有限,难以带来颠覆性的变化。而AGI模型则不同,如果其提高效率的方式具有足够的价值,并且在考虑运算和训练成本后仍能实现盈利,那么就会吸引大公司购买,进而获得更多的资金和投资。这些资金可以用于购买更多的硬件,支持更大规模的训练,推动模型性能的线性增长。随着更多领域采用相同的技术,知识共享将更加频繁,促进更优质研究成果的诞生。这种基于规模的发展思路也可能导致资源集中,形成寡头或垄断的局面。OpenAI提出的数据越多结果越好的理念,虽然在一定程度上推动了技术发展,但也引发了人们对于行业垄断的担忧。例如,OpenAI提出高额的融资要求,其规模之大甚至达到国家级投资级别,这显示出该领域资源竞争的激烈程度。

通用AGI作为人工智能发展的前沿方向,在技术演进、定义探索、实际应用和商业发展等方面都展现出独特的特点和挑战。尽管目前还面临诸多问题,但它的发展潜力巨大,将对人类社会的各个方面产生深远影响。我们需要密切关注其发展动态,在追求技术进步的时,重视安全、伦理和社会公平等问题,确保AGI的发展能够造福人类社会。例如,在医疗领域,AGI可以辅助医生进行疾病诊断和治疗方案制定,提高医疗效率和准确性,但同时也需要确保患者数据的安全和隐私;在教育领域,AGI可以为学生提供个性化的学习方案,但也需要关注其对教育公平性的影响。只有综合考虑这些因素,我们才能更好地迎接通用AGI时代的到来,充分发挥其优势,实现人类社会的可持续发展。

返回首页
相关新闻
返回顶部