【产品经理】视觉美化行业的技术路径和竞品分析

我在2021年3月份来到了字节跳动的火山引擎部门,担任智能美化特效CVsdk的产品实习生。这段实习中认识了很棒的mentor,很可爱的同事,这是一段很快乐的时光!

实习结束了,我也来到了新的公司。总想为上半年留下点什么,正好碰到朋友约稿写一写AI落地的小行业,就动笔写了这篇博文,经过改编后将会发到朋友的公众号上。

  抖音快手等短视频的爆火在拉动泛娱乐行业快速前进的同时,也催生着美颜特效产业不断壮大。比起高大上的AI名词,在手机App中触手可得的美颜滤镜、酷炫特效、贴纸玩法似乎更能吸引大家的注意力。奶瓶面膜、透明雨衣、金凤凰,哪怕你不是短视频爱好者,也难免会被他们吸引住目光。

 

    这些美颜特效似乎也不止停留在了这些短视频APP中,我们打开小红书拍照后可以进行美化处理,我们打开腾讯会议会自带美颜效果,甚至打开智能电视都能找到系统自带的贴纸小游戏,就连商汤的打卡机在打卡成功后都会出现有趣的贴纸特效。似乎每一个能让你看到人脸的地方都有着美颜特效的影子。

   有需求的地方就有生意。据估算,以美颜特效为主的CVSDK市场约有每年5亿的市场规模,且在以年化10%的速度快速增长。伴随着泛娱乐行业的快速发展,在行业中聚集了字节、商汤、相芯、BAT等众多技术提供商。美颜特效的背后包含着哪些技术能力,各家的产品又有什么差异,我们将通过本文一探究竟。
 

美颜特效产业的背后技术

   近些年来,大众对美的追求从单纯的白幼瘦逐渐演变为了追求自然感和高级质感,人脸特效的功能也从最初的磨皮美白红润演变为了能力覆盖美颜、美型、美体、美妆、贴纸、Avatar的特效全家桶。行业内的技术提供商往往会将上述的能力封装为SDK产品,以直销或者渠道的方式售卖给各个APP厂商。
功能项
功能小项
美颜
磨皮、美白、红润、锐化
美型
大眼、瘦脸、小脸、瘦鼻、隆鼻、白牙、缩人中等
美体
美臀、美胯、丰胸、瘦身、瘦腰、长腿、瘦手臂等
美妆
腮红、口红、修容、美瞳、眼影、眉毛、高光等
滤镜贴纸
人像滤镜、风景滤镜、食物滤镜、3D贴纸、GAN特效贴纸、交互贴纸等
虚拟形象
animoji形象生成、avatar形象驱动

  看似简单的美颜特效背后,却包含着来自算法、工程和产品层面的大量挑战。仅从技术的角度看,美颜特效大量的使用了计算机视觉(CV)和计算机图形学(CG)的相关技术。除了这些单点技术本身,如何从多样的功能和场景中提炼出统一的处理链路,也是极度考验团队技术实力的一大难题。

  我们先看CV和CG这两项核心技术。利用计算机视觉技术,可以实现对场景的检测和理解,无论是人脸关键点识别、还是面部瑕疵检测,无论是手势动作识别,还是自然场景理解,各种智能能力中都包含着以深度学习为核心的CV技术的影子。深度学习的发展大幅度的推动了CV技术的进步,在检测、分割、智能生成等方面都表现出了极佳的精度、准确度和场景适应性。借助上述算法的识别结果打造强互动性的特效玩法已经成为了行业内的一大发展趋势。而伴随着GAN网络的工程化落地,使用生成式模型打造千人千面的效果也成了各家鼓吹的新兴卖点。

  除了CV技术外,将虚拟的素材叠加渲染到真实画面上也是一个重要的环节,这其中离不开CG的各项技术。为了更好的完成工程化落地,各家也会打造自己的特效渲染引擎。渲染引擎往往会适配OpenGL、Neon等多种计算后端并提供统一的调用接口,引擎本身也会针对场景需求进行轻量化改造、跨平台适配、高性能优化等定向开发。经过近几年的不断打磨和发展,各家的渲染引擎也变得越发强大,能够模拟真实的材质、变换的光影,甚至使用GPU粒子系统模拟出近乎真实的烟花效果。

  美颜特效不只是一门技术,更是一项完整工程。只有将CV和CG的原子能力进行完善的工程化、系统化和产品化包装,才能真正的产生客户价值。不同技术提供商所选用的pipeline各不相同,但无不围绕着算法和渲染两大功能簇展开,下图就是执行流程的一个示例。而在工程化的过程中还会遇到模块化组件、多机型适配、稳定性优化等多种实际问题。针对效果、性能、成本的不同优化也形成了行业内不同玩家的各自优势。

 

 美颜特效行业的头部玩家

商汤

  商汤作为行业内的先行者和领跑者,具有多年的技术积累,产品功能丰富、效果较好、形成了极佳的业界口碑。商汤在算法性能和corner case的优化上付出了很多的努力,算法在大角度侧脸场景下的跟随稳定性 和 面部消失重现场景下的响应速度 都有着领先友商的技术优势。而商汤也在Animoji、Avatar、数字人等新兴技术上保持着长期的投入和技术领先优势。
  从商务的角度上观察,商汤具有大量的腾讯和阿里投后客户,主要客户群是腰部以上且对效果要求较高的大中型客户,有着较高的商务壁垒。

字节

  字节在抖音、轻颜、醒图等自有大流量产品的不断加持下,美颜特效相关的基础技术能力不断迭代升级,自有UED团队在海量数据和用研调查中对大众审美趋势有着独到的把控,围绕着抖音积累了来自内外部设计师的十余万款特效贴纸资源,特效创作工具Effect Creator也在设计师的长期使用反馈中不断完善。字节围绕着美颜特效建立了“算法+引擎+资源+工具”的完整产品生态。
  而在C端流量红利见顶和自身技术能力外溢的大背景下,字节跳动也积极布局B端业务,成立子品牌“火山引擎”,将内部的产品生态进行toB的封装,入局美颜特效sdk领域,以抖音等大流量产品为背书,快速抢占市场份额,以生态优势筑起较高的壁垒。

相芯

  相芯是一家位于杭州的技术公司,主打美颜、磨皮和锐化等基础的美颜功能。与友商相比,相芯聚焦于腰部及以下的中长尾客户,以更高的性价比和更贴心周到的配套服务来俘获客户的亲睐。值得注意的是,相芯在以Avatar为代表的技术上打造单点的亮眼能力,获得了一些大客户的肯定。
  在几年的发展后,相芯与声网、网易云、金山云等渠道商都保持着良好的合作关系。目前渠道商构成了相芯的大部分销量,而相芯也以“高性价比满足中长尾客户基本需求”为主策略,抢占了市场生态位。

BAT

  腾讯、百度和阿里都有着美颜特效的技术能力和相关产品,但基本上都不会单独售卖,而多是包裹在短视频或直播解决方案中整体销售。联合着视频云或视频编辑工具,打造场景下的成套解决方案,主要服务的客户也是以集团内部客户和战略投资的客户为主。
  在没有自有大流量产品的高需求下,BAT都普遍缺乏大量投入研发的动力,而是作为整体解决方案的一部分,更强调场景下的链路完整。
  小小的美颜特效却也暗藏玄机,行业内的各家也是八仙过海、各显神通。商汤靠技术、字节靠生态、相芯靠价格、BAT靠方案。在AI落地的过程中,或许也需要考虑算法技术之外的因素,无论是工程能力还是商务资源,占领具有壁垒的生态位并长期提供客户价值才是保持市场竞争力的不二之法。
E-mail:hithongming@163.com
原文地址:https://www.cnblogs.com/hithongming/p/15356181.html