云端渲染时长1.58亿核小时,《新神榜:杨戬》震撼视效背后,云计算为国漫保驾护航
智东西 · 2022-09-19 00:00:00 · 热度:加载中...
全片渲染时长3.6亿核小时,云端渲染占44%。

  智东西(公众号:zhidxcom)作者 | ZeR0编辑 | 漠影

  智东西9月19日报道,追光动画新作《新神榜:杨戬》近期正在热映,其制作水准再次升级,大银幕古风奇幻视觉效果十分震撼,无论是蓬莱仙岛满载细节的缥缈仙境,还是神女婉罗表演《洛神赋》时的曼舞轻歌,乃至最后的水墨特效太极图大战与元神大战的超燃战斗场面,都展现出国内动画电影制作的功力已经进步如斯。

  这也是追光动画历史上渲染量最大的影片,其渲染提效背后,离不开云计算技术的支撑。今日,来自阿里云、追光动画的多位技术专家,分享了云计算如何助力《新神榜:杨戬》(以下简称《杨戬》)的特效制作与云上渲染故事。

  一、全片渲染时长3.6亿核小时,云端渲染占44%

  追光动画是国内领先的动画电影制作公司,阿里云是国内最早提供动画渲染服务的云计算服务商。自2015年第一部动画电影《小门神》起,追光动画就一直 与阿里云合作,7年来合作了《新神榜:哪吒重生》、《白蛇2:青蛇劫起》、《猫与桃花源》等多部影片。

  相较于前作,《杨戬》特效画面场面更为宏大,画面细节更多更精细。《杨戬》创新重塑了神话中蓬莱、方壶、瀛洲三大仙岛,构建出前所未见的古风奇景。三大仙岛的美术风格以秦汉为基准,并融合了部分南北朝的特点,经过从建模到渲染等诸多动画制作步骤,最终造出飘渺仙境。

  项目资产和特效量的增加,给动画电影制作过程带来了更多的技术挑战,尤其是更大的渲染压力,包括大量非重力自然解算的飘带裙摆、部分使用GPU解算等等。

  据追光动画TD组长黄胜分享,《杨戬》的单镜头模型总面数高达170亿,单帧渲染时长为48小时,全片平均单帧渲染时长达17小时,全片渲染总时长达到3.6亿核小时,备份存储约为900TB。

  其中,阿里云渲染时长达到1.58亿核小时,约占总时长的44%。

  而且,不同的场次难度不同,渲染时需要用到的云服务器节点数在0到2000之间动态变化。庞大的渲染量对算力和存储的性能需求均远超预期。

  在《杨戬》制作过程中,上云成为提高渲染效率、保证项目进度的有力手段。

  二、云渲染技术助力,解决存储、算力、稳定性难题

  具体来说,依靠阿里云高性能计算E-HPC敏捷、弹性的特性,阿里云渲染支持《杨戬》主要涉及如下几个方面:

  1、节点数量:云渲染最多支撑了约2000台云节点,单文件系统最高可支持100GB/s的吞吐和260万IOPS,节点数量上很好的满足了项目的需求。

  2、节点性能:最高提供了单实例规格192G内存52核的高性能机器来完成一些复杂镜头的渲染,可快速交付海量算力。

  3、存储:云渲染对存储的性能要求很高。在存储的性能不足的时候,会浪费CPU资源,阿里云提供了CPFS(并行存储文件系统)来支持杨戬的云渲染,存储吞吐最高达到90GB/s。

  文件存储CPFS是阿里云完全托管、可扩展的并行文件存储系统,针对GPU和CPU计算场景进行了深度优化,能够提供对数据亚毫秒级的访问和百万级IOPS的数据读写请求。

  除了支持影视渲染外,CPFS还可用于AI深度训练、自动驾驶、基因计算、EDA仿真、石油勘探、气象分析等业务场景。

  三、面向未来的云上影视架构:制作+渲染+审片全流程上云

  阿里云早在2011年就切入渲染行业,并耕耘至今,目前其渲染解决方案已在国内多家头部视觉特效公司及大型渲染农场落地。

  据阿里云智能影视动漫行业解决方案架构师郑雯介绍,阿里云的整体影视动漫行业解决方案不会止步,未来将积极探索影视行业和云在更多场景的进一步紧密结合,推动断点续算、容器化、实时渲染等方面的技术演进。

  阿里云智能高性能计算平台负责人何万青谈道,古早的影视渲染,曾是每年只有一两部“梦工厂”大片的时代,有多少资源能做多少事,如今云计算彻底改变了“量体裁衣”、“量入为出”的影视渲染计划经济模式。

  这解决了本地生产的两类痛点。对于头部视效公司来说,本地生产存在IDC维护成本高,资源固定、升级难,异地协同难度大等问题;大型渲染农场则面临资源池弹性不足、服务器稳定性差、多地部署成本高等难点。

  对此,阿里云E-HPC为影视渲染全流程量身定做了方案,实现敏捷的云上资源创建流程,能够快速交付大规模渲染集群。其高性能、低成本的混合云多级数据缓存框架,可以解决本地资产上云的难题;基于渲染压力的自动伸缩,能实时感知渲染任务量变化,动态扩展/缩容渲染集群规模,解决云上运维难题。

  何万青总结说,未来,制作、渲染、审片全流程可上云。云上制作+审片,支持阿里云所有无影云桌面规格,按需使用,并支持本地远程访问,还能关联渲染集群存储,统一数据空间,中间结果无需下云。

  云上渲染可以提供海量、多样的CPU/GPU实例规格,支持集群自动化部署、资源弹性扩容、按需使用,适配渲染调度软件、兼容客户本地业务模式,并能实时感知业务负载变化,实现集群自动伸缩。

  资产管理方面,有高速物理专线打通线上线下存储空间、内网数据传输、保障资产安全。阿里云还提供E-HPC分布式多级缓存能力,支持线下存储热数据到云上的自动缓存/更新,保障云上大规模渲染效率。

本文来源:智东西