断网也能调用AI功能,混合AI会是下一个技术风口吗?

今年10月中旬,联想Tech World在美国西雅图举办。这场活动令人印象最深的,莫过于联想集团董事长兼CEO杨元庆分别与三位重磅嘉宾握手——NVIDIA创始人兼CEO黄仁勋、英特尔CEO帕特·基辛格和AMD董事长兼CEO苏姿丰,这三位,可谓当前全球半导体巨头的掌舵人。

此次聚首,意味着联想集团正在扩大朋友圈,坚定将混合AI作为未来的发展方向。所谓混合AI,就是终端侧AI和云端AI协同工作,在适当的场景和时间下分配AI计算的工作负载,以提供更好的体验,并高效利用资源。
实际上,不只是联想集团,2023年,高通集团发布了骁龙X Elite和骁龙8 Gen 3芯片,分别在 PC和智能手机上实现了百亿参数大模型的本地运行。也就是说,借助芯片的高速发展,无需上云,移动设备终端也能在断网状态下实现AI功能。正如高通集团总裁兼CEO克里斯蒂亚诺·安蒙预言的那样,混合 AI 时代或许已然来临。

为什么需要混合AI?

回答这个问题,还要从生成式AI说起。

2022年11月,ChatGPT问世,短短两个月时间便达到1亿月活用户量,成为一款“杀手级”AI应用,其背后代表的生成式AI技术也在全球掀起一股热潮,被视为能改变未来工作甚至生活的变革化技术。有数据估算,未来十年,生成式AI市场规模将达到1万亿美元。
然而,生成式AI并非完美无缺。以ChatGPT为代表的大型语言模型虽能与人交互、回答问题并进行创作,但存在 “幻觉” 这一通病,主要原因是过分依赖训练的数据,一旦数据中包含不准确或虚假信息,模型便会在回答时“一本正经地胡说八道”。另外,大模型内并没有事实验证机制,它们无法像人类一样查验某些信息的真实性。
因此,人类需要更可靠、更精准和更负责的技术,这也正是混合AI的价值。
以医疗领域为例,混合AI可将基于大量医疗数据训练的传统机器学习模型与生成式AI技术相结合。一方面,机器学习模型能处理分析症状、检测结果和患者病史等复杂任务,生成准确诊断;另一方面,生成式AI则能用通俗易懂的语言向患者解释诊断、回答问题并按需提供更多信息。
从成本角度来看,混合AI在能耗、性能、隐私、安全、个性化等各方面都拥有足够的优势,能为生成式AI在全球范围内大规模扩展普及提供支撑。
有数据估算,每一次基于生成式AI的网络搜索查询,其成本都是传统搜索的10倍 ,而这只是众多生成式AI的应用之一。若在混合AI架构下,可以将一些处理从云端侧转移到终端侧,就能减轻云基础设施的压力和开支。

异构智算,为混合AI筑牢根基

在AI时代浪潮之下,巨大的计算需求、复杂的计算架构、全新的计算模型、丰富的软硬件组合,无一不对算力提出了更高要求,混合AI也不例外。联想集团副总裁、联想中国基础设施业务群总经理陈振宽曾表示,异构智算是释放AI基础设施新动能。

所谓异构智算,指的是利用不同类型的处理器,比如CPU、GPU、FPGA等进行并行计算,来适应不同任务的计算需求,提高计算效率和性能,为混合AI提供必要计算支持。

比如,混合AI需要处理大量数据并进行复杂的计算,而异构智算能够根据任务需求,动态分配计算资源,提高计算效率。简单来说,异构智算是在让算力更好用的同时,为混合AI打好运行基础。

可以说,混合AI的发展与异构智算是相辅相成。以联想集团为例,在明确以混合AI为未来方向后,还推出了“联想万全异构智算平台”,其中,智能算力匹配魔方技术可以全自动规划和调度最佳算法和集群配置,用户只需输入场景和数据,即可自动加载最优算法和调度最佳集群配置。

工业和信息化部新闻宣传中心总编辑王保平指出,在智算潮流下,异构智算不仅加速了人工智能、大数据分析、云计算等技术的落地,助推行业迈出数字化转型的“第一步”,也将催生智慧应用“百花齐放”,赋能行业跨出数字化转型的“新一步”。

未来,云端与终端要协同工作

混合AI,不是简单叠加,它的出现不仅代表着一项技术进步,更代表着我们利用人工智能解决问题方式的范式转变。

据相关机构的预测,到2025年,在智能手机、PC/平板电脑、扩展现实、汽车和物联网等细分领域的AI应用率,将从2018年的不到10%,增加到100%。同时,随着生成式AI技术的快速迭代发展,未来性能强大的生成式AI模型会变得更小,云端与终端相结合的混合AI,将会成为AI落地的重要形式之一。
也就是说,在这大趋势下,人们可能再也无需忍受智能体反馈至云端进行推理,获得延迟几秒的回答,生成式AI会成为主流体验,而云端和终端协同工作的混合AI将成为这种体验的底层保障。
高通技术公司发布的《混合AI是AI的未来》白皮书同样显示,正如传统计算从大型主机和瘦客户端演变为当前云端和边缘终端相结合的模式,AI处理必须分布在云端和终端进行,才能实现AI的规模化扩展并发挥最大潜能。
尽管混合AI代表了未来发展方向,但这一趋势也对网络技术提出了更高要求。高通CEO安蒙在2024中国移动全球合作伙伴大会上表示,迈向混合AI模式,需要更可靠、低时延的端和云之间的连接,因此,5G连接在AI时代的重要性更加凸显,共同推动5G Advanced发展,才能为接下来的技术发展奠定基础。

来源:周到上海       作者:姜欣愉