闭关苦练4年,华为云盘古大模型3.0是怎么雄起的

2023-07-07 20:15:27

潮新闻客户端 实习生 何乐 关春源 记者 张云山


【资料图】

“盘古为行业而生,就要为行业着想,更好地服务千行百业的客户”,华为开发者大会2023(Cloud)在中国东莞正式揭开帷幕,华为常务董事、华为云CEO张平安重磅发布盘古大模型3.0,他表示,盘古大模型不写诗只做事。

在昨天的2023世界人工智能大会上,华为轮值董事长胡厚崑发表演讲表示,“去年年底Chat GPT的出现,把人工智能推向了新的风口。人工智能将帮助改写身边的一切。”同时,他透露,面向未来,华为在人工智能发展上有两个着力点:第一,打造强有力的算力底座,来支撑中国人工智能产业的发展。第二,真正让人工智能服务好千行百业,服务好科研创新。

胡厚崑表示,华为云发布的盘古大模型,面向ToB千行百业,为生产活动服务、为科研创新服务。让人工智能创造价值。华为人工智能的发展关键是走深向实,着力点放在让人工智能为千行百业的生产活动服务,为科研创新服务。

其实早在2020年华为就已经布局大模型,2021年4月,华为云盘古大模型对外发布,今天的版本是盘古大模型3.0。过去的4年,华为大模型之路是怎么雄起的呢?

破解小作坊困境,盘古大模型功课天堑

ChatGPT引发的百模大战正如火如荼的进行,很多公司都想借助大模型开发细分赛道的AI应用,但一算成本,觉得太贵,只能放弃。

很多AI公司都遇到了同一个问题:一道名为“AI开发”的产业天堑。在AI从实验室走向应用的过程中,需要大量的资金支撑,开发人员专业性要求高、综合成本高、不可控程度高,还要租用服务器开发、训练、部署模型,这样的困难让很多公司望而却步。

在华为内部,2020年3月,华为云人工智能领域首席科学家田奇,和团队发起了一次安静的冲锋。这次冲锋的“行动代号”——盘古大模型。当年11月,盘古大模型在华为云内部立项成功,也完成了与合作伙伴、高校的合作搭建。

在开始打造盘古大模型的时候,团队确立了三项最关键的核心设计原则:一是模型要大,可以吸收海量数据;二是网络结构要强,能够真正发挥出模型的性能;三是要具有优秀的泛化能力,可以真正落地到各行各业的工作场景。

盘古大模型瞄准了两条赛道,同时开启了NLP和机器视觉两个领域的大模型开发。与此同时,盘古大模型也做好了未来规划。首先希望能够把机器视觉、NLP、语音,甚至计算机图形学的技术结合起来,形成多模态的预训练大模型,增强预训练大模型的跨领域协同落地能力。

困难随之而来。首先是数据和算力的问题。即便华为云拥有非常好的资源基础,在千亿参数级别的大模型面前也依旧存有不足。为此,华为云和合作伙伴的多方推动,确保了所需数据和算力资源的保障到位。

其次是与行业知识体系、数据系统的磨合问题。盘古大模型的开发,时间紧张、训练难度高、成本耗费大,自然也需要内部团队的“超人发挥”。田奇回忆,团队内部都叫自己“特战队员”,也就是角色需要经常互换,工作需要相互支撑,哪里缺人就要哪里顶上。一个技术专家,同时也要考虑很多产业落地、商业化方面的问题。

盘古大模型不断攻坚克难的团队,从起初仅有少数几个人,到如今陆续壮大起来,已经吸纳了百余人,包括3名广受关注的“华为天才少年”。2021年4月,华为云盘古大模型正式对外发布。今天,盘古大模型3.0再度升级。

大模型不再只是实验室被观赏的东西,而是可以改变行业

盘古大模型立项、研发和落地的故事,给了我们一个思考AI工业化的鲜活样本。

从历史中看,一种产品的工业化进程必然需要经历研发为重—基座为重—产品为重三个层级。

将这个逻辑回溯到AI领域。自深度学习为代表的AI第三次兴起之后,这项技术得到了快速发展,但其基础业态还处于“研发为重”的第一阶段。行业中缺乏公开、有效、低成本的产业基础,最终导致很多理论上成立的落地方案难以成行。

而盘古大模型的价值,恰恰就在于推动AI的低成本、可复制。

田奇认为,目前我们处在AI工业化开发模式起步后的快速发展阶段,而大模型是最有希望将AI进行落地的一个方向。

从盘古大模型的故事中看,这个过程的实现,需要多重力量的携手与跨界——田奇加入华为就是一例。

田奇有着最新的研究方法、技术创新能力与国际视野;在华为云的产业结构中,田奇团队也找到了学术界所不具备的驱动力——科学家也开始思考功耗、效率、成本、商业场景等等一系列真实问题。

从这个角度看,盘古大模型也是一次产业、科研的虹吸范本。产学研的纵向融合,不同行业领域的横向协同,诞生了AI在工业化阶段必须经历的虹吸效应。

田奇回忆说,如果不能复制推广,那么大模型可能就是“一个只能在实验室中被观赏的东西”。团队期待大模型应用能渗透更多场景,并带来改变。

当更多科学家、行业专家、AI架构师,用这样的角度和动力去思考AI、推动AI、建造AI,横亘在AI面前的产业天堑,最终将会成为成为AI工业化变革的标志。

大模型是新一轮AI发展的核心,其已在推进产业智能化升级中已表现出巨大潜力,并将在未来三年里形成风起云涌之势。

“转载请注明出处”

关闭
精彩放送