在过去的十年里,人工智能(AI)技术已经从理论研究和小规模应用迈向全球性的技术革命,彻底改变了我们生活和工作的方式。无论是智能手机上的语音助手,还是复杂的数据分析和自动化生产线,AI 的影响无处不在,其带来的效率提升和成本降低正推动着一场前所未有的生产力革命。
为了抢占 AI 生产力的先机,不少品牌都快马加鞭拿出了自己的 AI 硬件:有的手机品牌利用 AI 技术消除拍摄照片时的运动拖影,有的用 AI 去除图片中不想要的元素,有的企业更是抢先一步发布所谓的「AI PC」标准。
这么一对比,低调行事、默默耕耘的 NVIDIA 似乎有些不合群。为了改变这一「酒香巷更深」的局面,NVIDIA 近年来也在努力增加自己在 AI 领域的曝光机会,想办法让更多的用户意识到 NVIDIA 在游戏显卡之外的领先技术——2024 年 4 月 24 日,NVIDIA 在深圳举办了名为 RTX For AI 的线下交流会,让大家能亲身体会 NVIDIA 是如何「撑起 AI 半壁江山」的。
图片来源:雷科技
尽管 NVIDIA 不是第一个提出 AI 这一概念的企业,但从产品和技术的角度看,包括 AI 在内的众多计算机历史性节点,背后都或多或少有着 NVIDIA 的支持:2008 年,NVIDIA发布了 GeForce 8800 GTX 显卡。
很显然这张显卡的性能放在现在早已不值一提,但这张显卡上,NVIDIA 提出了「CUDA」(统一计算架构)这一概念。CUDA 的出现让 GPU 不仅可以用来处理图形运算,还可以用来执行、加速基于 CUDA 的通用计算,让电脑成为真正的「通用工具」。
图片来源:雷科技
除了 CUDA 外,NVIDIA 在 2018 年还进一步对 GPU 的算力进行「细化」,引入了RT Core、Tensor Core 的概念,让光线追踪和专门的 ML 计算成为可能——Tensor Core 通过高效执行大规模矩阵运算,显著加快了 AI 模型的训练和执行速度。深受 NVIDIA 用户喜爱、可以显著提高游戏 FPS 的 DLSS,就基于 Tensor Core 来实现,可以说是广大游戏玩家最早接触到的「真 AI」用例了。
算力是一切 AI 的基础
在 AI 时代出现之前, NVIDIA 就开始想办法用 Tensor Core 实现 AI 功能,加速了 AI 时代的到来;那么和 6 年前的自己相比,现在的 NVIDIA 在 AI 领域又实现了怎样的技术飞跃呢?
根据 NVIDIA 的介绍,现阶段 RTX AI 已经对 10 种不同的 AI 场景实现覆盖,分别为:AI 绘画、AI 平面设计、AI 视频编辑、AI 3D 创作、AI 视频体验、AI 会议、AI 文档助手、AI 应用开发、AI 游戏和 AI 游戏开发。
图片来源:雷科技
尽管这十大场景各有不同,但他们对电脑却有着一个共同的需求:算力。而出色的算力,恰恰就是 RTX 硬件的最广为人知的特性。
图片来源:雷科技
毫无疑问,和 6 年前刚刚发布 RTX 显卡、引入 Tensor Core 时相比,性能是 NVIDIA 在 AI 领域最容易看到的提升。以最常见的文生图(T2I)用例为例,有试过在自己电脑上部署 StableDiffusion 等模型的朋友应该知道,当前绝大多数模型或多或少存在「命中率低」的问题,导致用户需要用同一组关键词反复生成图像,用类似手游「抽卡」的方式来生成自己想要的图片。
图片来源:雷科技
针对这种「抽卡」的场景,NVIDIA就在分享会上展示了其旗舰消费级显卡 RTX 4090D 的强大性能:基于 TensorRT 的加速功能,RTX 4090D 最快可以实现 120fps 的 StableDiffusion 图像生成。
精细控制是 AI 生产力的标志
不知道大家有没有发现一个细节,在刚刚提到的十大场景中,NVIDIA 把 AI 绘画和 AI 平面设计区分开了。这并不是 NVIDIA 想用更多的用例撑场面,而是因为 AI 绘画与 AI 平面设计其实标志着 AI 技术的两个不同的阶段:
以文生图为代表的 AI 绘画,由于命中率较低,用户需要不断生成大量图片来「抽卡」,才有可能得到自己想要的成品。而这种「不可控性」意味着这些 AIGC 作品的用途非常有限:要么用于娱乐,要么用来给设计师找灵感,或者充当训练 AI 的物料。
但真正用于「生产力」的 AIGC 却容不得这种「不确定性」,毕竟谁也不想用 AIGC 向客户展示时装上身效果时,AI 在衣服上生成三只手;或者设计师用 AI 向客户讲解室内装潢风格时 AI 把屋顶复式豪宅画成地下室。
换句话说,能否实现对 AIGC 的精细控制,会是区分「娱乐 AI」与「生产力 AI」的最大区别。
我们知道,「娱乐 AI」主要用于提升用户体验和互动性。例如,在视频游戏、社交媒体和在线娱乐等领域,AI 被用来推荐内容、生成音乐、模拟对话等。这类 AI 的核心目标是增强娱乐性和参与度,而不那么侧重于输出的严格性和可预测性。这类 AI 生成的艺术作品或音乐不需要符合严格的商业应用标准,其创造性和新颖性更为重要。
相比之下,「生产力 AI」则应用在更为严格和要求高的商业及工业环境中,如制造业、医疗、金融分析等。在这些领域中,AI 的任务是提高效率、减少成本和错误率,以及提供可靠的决策支持。比如利用 AI 在医疗诊断中用于分析影像和识别疾病模式,这要求极高的准确性和可靠性。在这些应用中,精细控制不仅关乎 AI 系统的效能,更关乎其决策质量对人类生活的直接影响。
图片来源:雷科技
在分享会上,NVIDIA 也演示了一个「生产力 AI」应有的样子——即致 AI。作为一款面向建筑设计领域的 AI 应用,即致 AI 提供了多种适用于不同建筑风格、场景的预训练 AI 模型,同时基于 RTX 硬件的强大性能,即致 AI 能以近乎零时延的速度对设计师的导入草图或绘制的线条进行 AI 生成,用近乎实时的方式为客户讲解建筑外部设计内部装修风格。
AI 遇到的问题,应由 AI 来解决
当然了,刚刚提到的用例只不过是 NVIDIA RTX 在 AI 领域应用的一小部分。从偏向娱乐性质的文生图、DLSS 3.5,到改变游戏交互方式的 NVIDIA ACE、声音克隆,再到改变创作模式的 AI 视频剪辑、改变工作模式的 Chat with RTX,无论是游戏还是工作,AI 技术早已渗透到我们生活的方方面面。
图片来源:雷科技
在分享视频创作过程中 AIGC 的具体应用时,著名视频特效团队「特效小哥 Studio」也提到了一个非常有趣的观点——用 AI 来解决 AI 遇到的问题。据他们分享,在重建 AIGC 图片的景深时,他们没有选择用传统的人工标记深度图,而是直接把图片丢给 AI,让 AI 绘制 AIGC 的深度图,并将结果输出给另一个 AI 模型。
图片来源:雷科技
这种「用魔法打败魔法」的解决方案,在我看来不仅仅是 AIGC 行业化,正规化的标志,同时也是未来 AI 的发展方向之一。
首先,AI 模型的训练需要大量的计算资源,由于高质量数据的获取往往成本高昂且不易实现,使用合成数据生成技术如生成对抗网络(GANs)可以创造大量逼真的训练数据,这对于提升 AI 系统的训练效率和效果非常有帮助。此技术不仅可以用于生成图像数据,也能扩展到文本、音频甚至是虚拟环境的生成,极大地丰富了数据来源,为AI训练提供了更多可能。
其次,AI 模型的解释性也是一个重要的技术挑战,因为许多高效的模型如深度神经网络往往像黑盒一样,难以理解其内部的决策逻辑。通过发展解释性 AI 技术,可以使模型的决策过程更加透明,增加用户的信任,同时也方便开发者找到并改进模型的不足。
图片来源:雷科技
从长远的角度看,解决这些技术性挑战不仅需要更先进的算法和模型设计,还需要在数据处理、模型训练和实际应用之间找到一个平衡点,这将是推动 AI 技术未来发展的关键。我们期待 AI 能带来更多便捷,同时也期待它帮助我们以全新的方式解决老问题。
而当 AI 真正彻底解放人类生产力后,拥有无尽想象力的创作者与 AI,一定能让更多天马行空的创意成为现实。
4月25日-5月4日,北京国际汽车展览会(北京车展)正在火热进行。本届车展以“新时代新汽车”为主题,是“汽车从电动化走向智能化”的风向标。
雷科技旗下“关注电动车,更懂智能化”的账号电车通已派出豪华报道团,正在北京车展现场,进行一线专业报道,欢迎关注“电车通”获取一手专业现场报道。
友情提示
本站部分转载文章,皆来自互联网,仅供参考及分享,并不用于任何商业用途;版权归原作者所有,如涉及作品内容、版权和其他问题,请与本网联系,我们将在第一时间删除内容!
联系邮箱:1042463605@qq.com