解决大模型在行业落地时高成本、不可控等问题,国内首个非Attention机制大模型发布

大模型作为人工智能的重要支撑,近年来被广泛研究和推广。国内人工智能大模型产业在算法优化、技术升级等方向不断创新,已形成较完整的产业链和技术生态,逐渐迈向应用落地的全新阶段。1月24日,岩山科技(002195)旗下科技创新型人工智能企业——上海岩芯数智人工智能科技有限公司(简称“岩芯数智”)在沪召开“新架构,新模力”大模型发布会,正式发布国内首个非Attention机制的通用自然语言大模型——Yan模型,也是业内少有的非Transformer架构大模型,拥有同等参数Transformer的7倍训练效率、5倍推理吞吐、3倍记忆能力,同时支持CPU无损运行、低幻觉表达、100%支持私有化应用。

目前主流的大模型系列有三个:OpenAI的GPT系列、Meta的LLaMa系列、Google的PaLM系列。国内的大模型基本延续了这三个系列或是它们的一个子版本演变而来。这三个系列都是基于Transformer架构衍生而来,成为大模型的支柱。

岩芯数智CEO刘凡平介绍,Transformer作为GPT、LLAMA、PaLM等大模型的基础架构,虽然已经取得了显著成功,但仍存在算力消耗、显存占用、成本高昂以及难以处理长序列数据等缺陷,让不少中小型企业望而却步。随着云计算和边缘计算的普及,行业对于高效能、低能耗AI大模型的需求不断增长。岩芯数智在对Transformer模型不断的调研和改进过程中意识到重新设计大模型的必要性:一方面,在Attention机制下,现有架构的调整几乎已经达到瓶颈;另一方面,公司更期望降低企业对大模型的使用门槛,让大模型在更少的数据、更低的算力下具备更强的性能,以应用于更广泛的业务。

据悉,公司研究团队历经1000多个日夜,超过几百次的设计、修改、优化、对比、重来,自主研发出了不再依赖Transformer的全新架构——Yan架构,基于Yan架构的通用大模型也应运而生。Yan架构的主要创新点在于它去除了Transformer中高成本的注意力机制,代之以计算量更小、难度更低的线性计算,大大提高了建模效率和训练速度,效率翻倍的同时降低成本和显存占用。Yan架构可以被应用于多种不同场景,有望在自然语言处理(NLP)、图像识别、音视频处理等多个领域验证其泛用性。

大模型竞赛已经从“卷参数”时代过渡到“卷应用”阶段,行业对通用大模型的需求亟待解决,许多大模型会通过剪枝、压缩等主流技术手段来实现在设备上的运行,而Yan模型100%支持私有化部署应用,不经裁剪和压缩即可在主流消费级CPU等端侧设备上无损运行,达到其他模型在GPU上的运行效果。发布会上,研究人员现场展示了Yan模型在个人电脑端的运行推理,下阶段有望在手机端等更加便携的设备或终端中无损部署。

“我们期望Yan架构可作为人工智能领域的基础设施,并以此建立AI领域的开发者生态,最终让任何人在任何设备上都能使用通用大模型,获取更加经济、便捷、安全的AI服务,推动构建普惠的人工智能。”刘凡平说,岩芯数智旨在打造全模态实时人机交互系统,全面打通感知、认知、决策与行动,构建通用人工智能的智能循环,为通用机器人等具身智能方向的研究提供大模型基础底座的“更多选择”,希望能在低消耗、显存受限情况下通过提供基于Yan架构的专业生产力工具,实现端侧训练、训推一体,助力千行百业数智化转型升级。

上海市人工智能技术协会秘书长朱伟民表示:“AIGC是人工智能产业发展的重要趋势,将重塑内容与平台的生态和商业模式。推动AIGC技术研发与应用的深度融合,已成为构建开创安全、多模态人工智能新生态的关键路径。”

Yan模型在实际应用中的表现还有待市场检验。岩芯数智董事长陈代千提出:“随着Yan模型的进一步落地和应用,期待以Yan架构为基础的通用大模型,为各种机器人、嵌入式设备、物联网设备提供所需的智能化能力,为人工智能行业注入新的活力、新的思路,新的可能,为企业和用户创造更多价值。也用我们的力量,参与推动人工智能领域新一轮技术变革。”

岩山科技2023年6月成立岩芯数智,打造面向垂直行业的专业AI大模型。其自研的ROCK AI模型大脑在自主可控、客户私有化部署等方面具有领先优势。岩芯数智已与金融业、制造业客户建立了商业合作,Yan并不是岩芯数智内部诞生的第一个模型,公司已经历了三代的发展,希望以更快的训练、更强的性能、更省的成本优势寻求替代Transformer架构的更优解;目前正在积极推进第四代的开发,即Yan 2.0 全模态实时人机交互系统,助力各行各业拥抱数智化时代。

中国信通院上海工创中心总工程师李韩军认为:“人工智能发展至今,大模型的架构升级始终在不断进化,在技术与应用双重驱动下,生态边界也在扩展。可以说,每一次技术上的突破都会带来智能生态的发展。从当前着眼通用性,到未来的个性化发展,我们期待行业生发更多新的生产力工具,引发新一轮技术革命,推动整个AI行业向更加高效和可持续的方向发展。”