当地时间 12 月 6 日,谷歌公司宣布推出其“最大、最强、最通用”的新大型语言模型Gemini。人工智能发展突飞猛进,巨大应用潜力背后是新硬件、新算法、新数据的全面涌现。人类社会正处在“跃迁”的关键时点。毕马威联合中关村产业研究院通过行业调研和专家访谈,结合深入研究共同发布的《人工智能全域变革图景展望:跃迁点来临(2023)》报告,立足全球人工智能产业现状,结合市场观察提出人工智能产业未来发展十大趋势,并剖析各个趋势的发展情况与核心驱动力,以期能为AI产业界锚定机遇,化解挑战。
现状:全球新增人工智能企业数2017年后逐年下降,中美英三国领先
各类AI企业层出不穷,AI细分标签日益庞杂,AI与各类前沿技术的融合创新使得智能无处不在,在清晰界定AI产业范围和厘清AI企业的具体特点方面产学研各界仍在探索。报告将人工智能产业链分为基础层、技术层、应用层,并定义人工智能核心层为基础层和技术层。基础层包含数据、算力、算法三驾马车;技术层包含计算机视觉与模式识别、自然语言处理、类脑算法、语音技术、人机交互五类;应用层包含所有AI技术与传统应用结合形成的产业。
从全球看,人工智能企业数量经历了由爆发式增长转入稳步增长的变化。从2017年开始,全球当年新增注册AI企业数量逐年下降,已从2017年的3714家下降到2022年的1106家。截至2023年6月底,全球人工智能企业共3.6万家,中美英企业数量名列前茅。美国人工智能企业约1.3万家,占全球33.6%,中国占16.0%,英国为6.6%,美中英的人工智能企业数量合计占全球56.2%。具体到人工智能独角兽企业,截至2023年6月底全球291家,美国和中国平分秋色(分别为131家和108家)。
中国人工智能领域企业密集诞生在2015年至2018年之间,约三分之二的人工智能领域核心企业成立年限在5-10年,随着有效投资增长逐渐乏力,人工智能领域新增注册企业数量在2017年达到峰值528家后逐年下降,到2022年减少至63家。从区域布局来看,中国人工智能企业主要集聚于北京、广东、上海、浙江等地,形成京津冀、长三角、粤港澳三足鼎立格局,其中北京1600余家,包括人工智能独角兽企业41家,居全国首位。上海市和广东省位列二、三,分别拥有人工智能独角兽企业24家和23家。
毕马威中国客户与业务发展主管合伙人江立勤表示:“自2015年深度学习取得突破,掀起AI初步商业化浪潮,到2022年底ChatGPT问世,再次推高AI大规模商用热度,全球人工智能产业愈发成熟理性的同时,又悄然孕育着一轮新的范式变革机遇。中国作为全球人工智能发展的引领者之一,有望建成具有全球竞争力的人工智能产业集群,唯有深刻理解并合理借力产业发展趋势,方能迎接新时代、获得新发展、创造新事业。”
趋势:异构计算加速崛起,模型即服务将是AGI生态构建的核心
大模型爆发以来人工智能技术发日新月异,创新成果纷纷涌现。报告从技术变革、应用创新、安全治理、生态协同四大维度总结出人工智能产业发展十大趋势,包括多模态预训练大模型是标配、开源创新是AGI生态建设的基石、人工智能安全治理趋严、趋紧、趋难等。
技术变革方面,毕马威中国科技、媒体及电信行业主管合伙人陈俭德指出:“ChatGPT引发的大模型创新热浪仍在涌动,有可能演变成一场比工业革命、信息革命更为深刻的人工智能革命。这一时代背景下,无论是推动大模型从单模态发展到多模态,还是倡导高质量数据和计算新范式,都在强调人工智能技术变革的本质——算法、数据、算力三大基础要素的精巧配合和相互促进。”
趋势一:多模态预训练大模型是人工智能产业的标配 算法方面,预训练大模型发展起源于自然语言处理(NLP)领域,当前已进入“百模大战”阶段,预计随着大模型创新从单模态转向多模态,多模态预训练大模型将逐渐成为人工智能产业标配。目前国内大模型虽市场影响力逊色于GPT系列模型、PaLM-E等,但在中文语料训练、中国文化理解方面具备本土优势。此外,国内制造业等实体产业为大模型提供了丰富的训练数据和应用场景。未来在大模型向产业赋能方面中国大模型极有可能后发先至,也会是国内大模型竞争的关键因素之一。
趋势二:高质量数据愈发稀缺将倒逼数据智能飞跃 数据方面,大模型的训练需要大量的高质量数据,但是目前数据质量还存在一定的问题,包括数据噪声、数据缺失、数据不平衡等。这会影响大模型的训练效果和准确性。根据一项研究,高质量的语言数据存量将在2026年耗尽,低质量的语言数据和图像数据的存量则分别在2030年至2050年、2030年至2060年枯竭。这意味着,如果没有新增数据源或数据利用效率未显著提升,那么2030年以后AI大模型发展将明显放缓。预计大模型领域不断迸发的高质量数据需求,将倒逼数据在大规模、多模态、高质量三大维度上全面提升,数据智能相关技术有望迎来跨越式发展。未来基于云原生容器化环境,支持流、批数据处理的“湖仓一体”架构将成为新一代数据平台的底座,助力数据质量提升。自然语言处理等数据交互技术与向量数据库相结合,能够使计算机系统充分理解人类语言,在人机问答、知识检索等场景中创造自然高效的用户体验。
趋势三:智能算力无处不在的计算新范式加速实现 算力方面,新硬件、新架构竞相涌现,现有芯片、操作系统、应用软件等都可能被推翻重来,预计有望实现“万物皆数据”“无数不计算”“无算不智能”,即智能算力将无处不在,呈现“多元异构、软硬件协同、绿色集约、云边端一体化”四大特征。CPU、GPU、ASIC、FPGA和NPU、DPU为代表的“XPU”芯片使得算力日趋多元化,传统x86架构之外,ARM、RISC-V、MIPS等多种架构也正在被越来越多的芯片公司采纳,异构计算加速崛起。绿色集约强调对数据中心和5G设施,平衡算力提升和能耗降低问题的重要性,包括提高绿色能源使用占比、采用创新型制冷技术降低数据中心能耗、综合管理IT设备提高算力利用效率等。边缘智能、AR/VR、自动驾驶等新一代计算终端渗透率有望大幅提升。
应用创新方面,毕马威中国数字化赋能主管合伙人张庆杰认为:“全球人工智能角逐的制胜点除芯片、数据等核心领域外,场景应用创新也极其重要。一方面,场景应用中出现的短板和不足能为技术突破提供切入点,另一方面,场景应用能否获得商业成功决定了产业化能否顺利推进。大模型技术将重塑生产消费的基本形态,以AIGC、AI4S、AGI为代表的应用场景中有望出现大量范式转换机会。”
趋势四:人工智能生成内容应用向全场景渗透 在AIGC(Artificial Intelligence Generated Content,人工智能生成内容)应用方面,其发展源头在数字内容创作领域,从单模态内容到多模态数字化内容创建已初显雏形,预计未来会进一步提高人类创造内容的效率,丰富数字内容生态,开启人机协同创作时代。各种需要创意和新内容的场景都可能被AIGC重新定义,AIGC向全场景渗透指日可待。AIGC能更低成本、更高效率地生产内容,但在内容准确性、细节把控度、风格个性化等方面仍有较大优化空间,AIGC潜力能否充分释放取决于和业务需求能否有效结合。
趋势五:人工智能驱动科学研究从单点突破加速迈向平台化 AI4S(AI for Science,人工智能驱动的科学研究)应用方面,有望从单点突破加速迈向平台化。产业界对AI4S的工程化需求也逐渐增加,工程师和科研学者将共同主导AI4S下一阶段的发展。目前亟需克服密集型计算数据庞杂无序、学科知识壁垒高、跨学科研究生态整合难度大等痛点。预计随着相关科研机构和科技企业不断沉淀底层数据分析和结构仿真设计能力,将更多“科学问题”转化为“计算和工程问题”,AI4S领域有望出现类似Transformer、GPT-3等的通用模型和框架,涌现一批“高效便捷、开箱即用”的科学研究智能化工具。
趋势六:具身智能、脑机接口等开启通用人工智能应用探索 AGI(General Artificial Intelligence,通用人工智能)应用方面,其技术原理强调两大特性:一是需要基于先进算法实现智能处理和决策,包括深度学习、强化学习、进化计算等;二是需要具备和人类大脑相似的认知架构,包括感知、记忆、分析、思考、决策、创造等模块。参照AGI技术原理来看,ChatGPT在感知尤其是实时感知能力等方面仍需进一步优化,而具身智能、脑机接口等技术的发展能助力,距离商业化应用还有较长一段距离。一些研究机构和企业已经开始探索具身智能、脑机接口如何与ChatGPT相结合,有望催生一批更符合AGI特征的应用。
安全治理方面,毕马威中国科技、媒体及电信行业审计主管合伙人卢鹍鹏提出:“当前在人工智能领域无论是技术创新还是应用创新都堪称‘万类霜天竞自由’,但自由是有限度的,日益复杂的算法规则和黑箱机制正在引发算法歧视、隐私泄露、虚假信息泛滥等科技伦理问题,加强安全治理已经成为各方最大的共识。”
趋势七:人工智能安全治理趋严、趋紧、趋难 中美欧作为人工智能发展的领军国和地区正积极开展相关立法,呈现出政策法规先行、监管趋严等特征。《人工智能法案》提案2023年6月14日在欧洲议会通过,有望成为全世界第一部综合性人工智能治理立法,被各国监管机构参考。我国《国务院2023年度立法工作计划》显示,《人工智能法》已列入立法计划。
趋势八:可解释AI、伦理安全、隐私保护等催生技术创新机遇 人工智能安全、可信的发展之路任重道远,在解决AI风险的过程中催生出可解释AI、联邦学习等技术创新机遇。其中,联邦学习正成为新型的“技术基础设施”,有望成为下一代人工智能协同算法,隐私计算和协作网络的基础,使数据在合法合规、安全高效的基础上实现价值流动。此外,通过“为机器立心”,逐步实现人机价值观对齐。AI对齐是走向通用人机协作的第一步,未来AI对齐的研究方向不仅仅局限于单任务环境,将进一步探索多个任务中的人机价值对齐。
生态协同方面,以开源创新为基石,以MaaS(Model as a Service,模型即服务)这一商业模式为核心,有望带动人工智能产业生态繁荣发展,最终实现人工智能高质量发展。
趋势九:开源创新将是AGI生态建设的基石 开源的自由度越高,越有利于吸引更多开发者参与到生态建设中。AGI强调人工智能的通用性,意味着其生态需满足大量细分场景和长尾需求,这样生态系统越繁荣开放,越能尽可能地覆盖所有专用化、场景化乃至碎片化的需求,保证AGI生态的丰富性和完整性。但是开源也存在一定风险,对产业生态中的主体企业来说,选择开源某种程度上意味着公开商业机密,不利于其构建竞争壁垒。此外,开源模式还可能会引发专利侵权风险,对开源的知识产权管理规则和流程规范建立提出了挑战。开源创新有望成为中国AGI生态的重要基石之一,推动中国在前沿理论创新方面取得重大突破,从“跟跑”走向“领跑”。
趋势十:模型即服务(MaaS)将是AGI生态构建的核心 目前AGI生态的商业模式主要体现为MaaS模式。该模式核心价值可归纳为:降低算法需求侧的开发技术和使用成本门槛,使AI模型和应用成为简单易用、触手可得的工具。由此,用户可以专注自身业务逻辑和使用体验,而不必关注底层技术细节,有利于解决AI“能用”但“不好用”的这一关键落地瓶颈。而供给侧有望形成“通用大模型+领域大模型+行业大模型+企业/个人小模型”这一基础业态,推动AI落地千行百业,最终实现AGI。
在AGI基础业态中,通用大模型和领域专用模型处于基础层,发挥着基础设施的作用,具有通用性强、多模态乃至跨模态的特点,技术难度高且成本投入巨大,拥有高质量数据、强大的多元异构计算能力、自研大模型的科技巨头企业将是主要参与者;行业大模型在中间层,在模型训练方面会接入较稀缺的行业Know-how数据,更多采用API接口、SDK私部署的形式,呈现出工具化、平台化趋势。企业和个人小模型处在应用层,在大模型基础上蒸馏、裁剪后再使用,具有高性价比、部署高效、安全可靠等特点,小模型功能会以插件形式与SaaS应用、智能硬件等相结合,成为AGI时代的流量入口。