近日,苹果、字节新品来袭,引发了市场强烈的关注,往往硬件的需求变化会带来产业链的波动。近期方正互联网传媒团队拆解了两部VR设备也是引起了市场的热议。从光学升级角度来看,Pancake被视为最具价值量的方向之一。我们今天非常荣幸地邀请到了方正证券互联网传媒首席分析师【杨晓峰】、创维VR总经理【李文权】两位大咖,来和我们一起揭开VR的神秘面纱。
1、拆了两部VR,硬件有什么重要收获?
2、国产VR会迎来非常好的时代
3、Pancake为什么能使得设备轻量化
4、Pancake高成本的原因
5、感知交互和内容制作,是产业未来发展的重点
9月多款明星VR产品将陆续面世,对于VR行业意味着什么?
杨晓峰:厂商纷纷推出新品,反映出他们对VR市场是比较看好的。同时各路厂商都在亮出新的功能、新的卖点,这是一个非常好的引导消费者逐步认识、接触新产品的过程。通过VR新品的频繁推出,也可以教育到更多的用户,使得VR市场迅速崛起。
所以我认为密集的产品发布是一个非常好的教育用户的阶段。
上半年VR也遇到了不小的波折。业内的机构对VR设备全年出货量进行了下调,是否意味着今年VR景气度不及预期?
杨晓峰:以头盔举例,在海外,用户买Quest的核心动力是把它作为一个游戏工具。如果没有出现爆款游戏,将对Quest销量产生影响。
最近2个月市场其实发生了不小的变化,比如字节推出的演唱会直播、才艺直播等等,我们发现许多用户买头盔不只为了玩游戏,也可能是其他的娱乐形式。
国内的 VR 直播会迅速产生新的用户需求,因为在直播中,主播就像站在面前一样逼真。从这个角度看,VR在国内的景气度会比在海外还好。
一方面是因为在国内,除了游戏之外找到了新的娱乐方式。
另一方面,国内产品的性能大幅提升,在追赶海外产品上有非常大的进步。所以我们认为国产VR会迎来非常好的时代。
您的团队近日拆的两台VR设备也是备受市场关注。Pico和Quest两款明星产品拆解下来整体外观和构造都有哪些不同?硬件上有何值得关注的点?
杨晓峰:差异主要体现在外观。Pico的电池是后置的,Quest的电池是在里面的。我们将头盔的前半部分称重,重量大概在440克左右,电池在220克,把重量都集中在前半部分会对鼻子造成一定的压力。如果把电池后置,可以达到前面400克,后面220克的平衡状态,这是Pico相对于Quest的优势之处。
接下来我们再对比一下内部结构的差异。
Pico和Quest 在布局上非常相似。中间是一个风扇散热器,散热器下方是一体机的主板;摄像头分布在4个角落。
相比较而言,Quest多了保护杠,且拥有一块银色金属材料固定件,它的牢固性更强,但是重量也相应提升。从体验的角度来看,Pico更加轻薄,体验感会相对更佳。
对于苹果MR及Pico的新款机型,有哪些硬件变化值得重点关注?
杨晓峰:过去的MR设备是通过虚拟的光打进现实,与现实混合在一起。但是现在的MR是通过摄像头把真实的世界捕捉进头盔,再加入虚拟的要素。
我们在戴上头盔以后,会出现一个虚拟的手,当然咱们可以看到这个手的形象并不是真实的手的样子,主要原因是目前的摄像头拍的是黑白的,所以没办法构造一个真实的手的样子。但是在玩这个游戏的时候,我们的手往前怎么动,棋子就会怎么动。
所以未来的趋势就是大家是通过手势识别来交互。比如说我现在戴的眼镜,未来眼镜是可以把我的手捕捉进去的。那么我的手怎么操作,在画面里就能看到同步的画面。
未来MR来了以后,我们的摄像头会显著提高,这样就可以实现很多手势识别的功能。未来这里的变化还是比较大的,大家可以多多关注。
眼球追踪现在有没有什么新方向吗?
杨晓峰:在虚拟世界交互里,有眼球追踪以后,能够更好地能捕捉我们的表情变化。现在摄像头能捕捉我们的手,如果能装一个向下的摄像头能捕捉我们的脚,那我们整个人的姿态都能在虚拟世界里体现。当然表情的话就需要眼部识别来实现,来感知人的情绪。
所以当眼部追踪越来越普及以后,在虚拟世界跟别人交互的时候,真正能跨越时空,也能感受到对方的情感的变化。
VR 在国内外的购买量或者说市场认可度可能会有一些差异。具体在国内或者是在海外,两者的渗透率大概是什么情况呢?
杨晓峰:渗透率在国内还是相对比较低的,因为头部产品最近一年才开始慢慢的放量。下一代产品可能才会是现象级的存在。
国内相对处于早期,海外大家对这个用 VR 来玩游戏已经有比较多的认知了。国内随着最新发布的产品体验上来后,我相信会迎来一个爆发期,我觉得这个变化会是比较大的。
VR生态的建设目前处于什么阶段?哪些领域会率先爆发。
杨晓峰:我觉得目前的 VR 直播有点像当年的短视频,17、18年的时候,大家发现短视频是当时的一种新业态。短视频上有像海草这些音乐当时是比较出圈的。在那个时间点把整个抖音的用户拉上了一个新台阶。
VR 的才艺直播6 月 8 号才上线,但是经过这两三个月的发展,其实已经有非常多的用户在使用这个功能了,主播的数量也上升非常快。
现在这个阶段有点像当年抖音刚起来的这个阶段。这里还有个差异,就是当年的抖音只需要下个 App 就行了,但是现在要说服一个人去体验VR才艺直播不太好描述。
但实际上我们戴上头盔以后,就会发现这是一种全新的体验。这种体验是颠覆性的,这样的应用在未来有非常大的空间。
有哪些因素可能会成为抑制消费者购买的原因?
杨晓峰:像苹果这样的MR可能会相对比较贵一点。但是我们也都知道,国内的供应链比较完整,国内也会生产出一些价格比较适中的 MR。MR核心就是增强摄像头的功能,但很多功能是需要通过软件算法完成的,这也是一个成本考量。我觉得未来MR 它价格降下来还是有一定的可能性的。
阻碍这个行业发展的最大的因素可能是如何说服用户去体验这个产品,最重要的是有更多的线下场景能让大家去体验,光靠我们的描述可能不太行。
便携性也是一个非常重要的因素,比如像是耳机一样可以随身携带,非常方便。所以现在对头盔设备也在不断优化,做得越来越薄,我觉得这个触达消费者会越来越快。
您看好哪些 VR 硬件和软件的发展机会?
杨晓峰:首先,头盔的销量暴增预期是比较高的。其次就是生态里的红利几乎,可参考抖音起步阶段。所以我觉得说一方面是我们可以看到硬件的销量在放量,
未来将有更多VR用户,那么对很多公司而言,是一个非常好的红利期。
所以说可能早期的时候是硬件的红利,再之后就是流量的红利。
这几年其实还是比较苦的。因为从 2014 年 Facebook 收购了Oculus之后到 2016 年的整个资本其实很看好这个产业,因为就是整个产品本身可能还是有不少的局限性,然后再加上生态的不成熟。所以说到了 2016 年 9 月份之后,整个行业经历了几年沉寂期,到 2020 年之后,产业慢慢的复苏。然后到了 pancake短焦时代,大家也是很看好这个产业未来的发展。
主流VR采用Pancake的趋势非常明显,为什么pancake被看做取代菲涅尔透镜的关键材料?
李文权:从光学路径来看的话,分垂直式的光学路径和折叠式的,垂直式的包括菲尼尔镜和非球面镜,它很简单理解就是说镜片和显示屏幕光源之间就通过一个垂直的方式光路传递到人的眼睛当中。
镜片到屏幕之间距离一般是40mm左右。
所以说整个产品的厚度,包括前边屏幕的厚度以及主板的厚度,还有一些其他的散热或者是支撑的厚度,最少应该就在 60㎜以上了。这样的产品其实就比较重,长期佩戴会不舒服。有这样的痛点,就需要把整个产品做得越来越轻巧。
现在新的一种方式,Pancake模组采用折叠光路,把光路的物理距离压缩之后,通过折叠形式增加了,而延长了整个光路的距离,从而实现了同样的效果。
最直观的办法就是把从光学模组从40㎜做到18㎜左右,模组的厚度减少了50%以上。整个产品减少了 3/4 以上重量,从以前的440g到现180g。未来可能会做得更加轻薄,比如说把镜片到显示光源之间的距离,由现在的18㎜减少到8mm 。
那这种技术的升级是不是也会带动价格的上涨?现在 pancake 的价格要远远比菲涅尔透镜价格要高一些。
李文权:近眼显示部分从显示光源来看,采用一个 5.5 寸的一个 3664 *1920 的这样一个大屏。屏幕上面只用了一个 IC 去驱动它,而未来发展要采用的pancake 的光路的个解决方案。
pancake 的光路是一个模组对应一个屏幕,所以就是说他可以把整个产品,第一做得比较小,第二就是增加屏幕的个数,由以前的一个大屏变为现在的两个双小屏了,所以成本的直接增加就是屏幕的成本的增加。
其次,之前采用非球面镜成本很便宜,精度高一点或者好一点,10到 20 块钱就可以解决。如果我们采用折叠光的 pancake 解决方案,一个简单的透镜,上面需要去贴一个膜,还有一个偏成片,成本就增加的挺多了。
而且不只是以前的一片式,现在普遍采用了两片式或者是三片式,因为膜的成本也比较贵,所以说现在涨到小几百了。
为什么 VR 设备要重点升级光学, pancake 为什么又如此重要呢?膜和偏光片为什么们值得关注?
李文权:菲尼尔透镜或者是说非全面镜生产要求相对比较低,只要把整个产品模具开好了之后,就很容易生产出来。
而pancake 的话,难点主要有几块,第一它是一个折叠式,上边有一个偏光片,然后再加上膜,膜材镀上去的话有的效果不行,可能就涉及一个良率的问题。第二个,膜材和偏光片当前能够真正量产,其实全球的话也就那一家供应商,价格是比较贵的。
第三个,良率问题,现在我们看到市场上包括山东那家做代工的企业,良率现在是很难做上去的,比如说做到 60% 到 70% 可能就差不多了。因为我们现在基本上也是这个水平,所以说再去把良率除掉的话,整个产品的成本就起来了。
Mini LED 和 Micro OLED 在 VR 设备上的应用情况如何?
李文权:VR 产品为了长时间佩戴,就要求它做得比较小,色彩还原度好,亮度好。采用pancake光学解决方案,把整个光镜模组做得小巧。但pancake有光效利用率问题,通过几次反射和折射后,最大的利用率理论上达到 20% 就不错了。
所以LCD普通背光本来亮度就不高,画面会偏暗。为了显示的色域更广,画面更逼真,采用亮度更好的 Mini LED 或者是 Micro OLED 去解决这样的问题。比如采用 Micro OLED 做 3000 PPI 更容易的。
目前传言苹果公司采用了是 Micro OLED 1.49 寸,单眼 4k 双眼 8k 的产品。所以Micro OLED从长远来看,是产业发展的很重要的一个选择。
然后 mini LED 话就跟刚才说的说,因为是 pancake 的出现,这样的话导致整个光效利用率不是特别高,这样需要去改它的背光。
Quest的下代产品明确采用Pancake方案,同时它的 LCD屏幕的背光采用的是mini LED解决方案。
产业还会关注哪些 VR 上面的升级,会带来革命性的变化?
李文权:感知交互需要比较大发展。比如说眼球追踪、面部识别、手势识别,空间需要具有临场感,我们才能够进得去虚拟世界。
所以从产业看,感知交互需要有比较大的突破。内容是另一个限制因素,可能今年11、12月国内在VR 直播,3D180度方面有所突破。
市场可能认为FOV 可能是越大可能我们沉浸感越好,因为我们在真实世界通过余光去看是 210 度左右。但
是真正去看一个事物时,是聚焦在40 度 \50度范围内。FOV 越大,相同分辨率条件下,每一度上面得到的像素的密度就越小。所以说我们其实在追求清晰度的时候也是需要去考虑市场的,去找一个平衡点就 OK 了。
市场上我们也能够看到一些产品,比如说它 8K 200 度,但是视场角大了后,清晰度也没有绝对的提升。我们的 pancake 1采用的一个 2280 X 2280 分辨率,让 FOV 做到90-100度左右,实际上 PPT 做到 25 度左右,基本上就是真实的,我们去看它接近于看手机那种感觉,
从产业链看,当前分辨率或者是清晰度这块,不是限制 VR 产业发展的很重要的点,更多还是在感知交互和内容制作这块。
感知交互有怎样的进展?
李文权:感知交互做得越完备,可能我们这个产业普及起来就越容易。举个简单例子,PC时代,鼠标、键盘对于互联网的发展有很大的促进作用,因为它解决了交互问题。
又比如说智能手机的触控屏对于智能手机或者移动互联网的发展也是有极大的推动作用,在乔布斯之前是没有触控屏的,如果只是通过一些物理按键去实现相关交互的话对效率可能有很大的影响。
当前其实不管是 VR 还是 AR ,交互基本上是通过游戏手柄,包括Quest这样的产品其实很多时候针对的就是游戏场景,或者说它设计手柄的理念就是为了满足游戏的场景。
但在我们实际生活中或实际使用 VR 产品的时候,游戏其实不是占用我们最长时间的项目,反而视频是。有一个大数据的统计显示有 60% 左右的时间其实是用于视频的观看,所以让很多人从 0 到 1 认知手柄、比较熟练去使用手柄还是挺难的一个事情。
因此我们希望有一个新的交互出现,比如以后直接通过手势去做一些交互。现在海外Alexa也能实现一些基本的交互,但若在比较复杂的情况下,或者多一点交互的话它还是不太容易去识别,或者说识别精度还是有问题。所以我们希望下一步可能有手环、戒指,或者是借助于手套这样的物理设备去做一些交互,对一些设备的输入或者交互带来些帮助,这样对产业的发展是有帮助的,能让更多的人更容易玩起来。
另外,眼球追踪有很多个点,比如说我输入密码的时候去看一些键盘或者是通过注视点渲染等,它其实有很多应用场景。其实我们现在的看法是眼球追踪还是比较成熟的,海外的 Tobii、国内七鑫易维,它们的产品其实都还是挺不错的。
面部识别这块的话,今年Quest的下一代 Quest Pro 也会变成一个标品去推,可能会用于办公或者相关的一些功能。这个最大特点就是以后用于社交场景时能更直观地去表达用户的体验,人与人之间在虚拟世界的交互或者说去感知另外一个人的时候可能更真实,这样的话才能称之为在VR里进行社交应用。
但从我们现在看到的一些反馈是说实际体验效果是国内的厂商还没有特别好的解决方案,因为要去增加摄像头,Meta可能今年发产品,苹果可能明年发产品,到时候看看它们的产品处在行业的什么地位,或者说使用的时候方便程度如何。
对于感知交互来说,您刚刚提到的多种设备如戒指、手环等,对于这些而言研发的难度在哪里?
李文权:举个简单例子,比如说现在我们实现空间位置中定位比较好的解决方案就是inside-out的通过SLAM空间位置的一个重建去实现定位功能。
我们现在看到的Quest、Meta下代产品采用的是摄像头的空间定位,然后把位置空间去建图,可能通过手柄上面的一些处理器去实现了些功能,减轻了 CPU的负担。
但在当前阶段,其实大家看到的产品都一样,就是类似于一个圆环,下边有些控制按键,上边有几十个 led 灯,头显上的4/6个摄像头去追踪灯的亮面来判断手柄所处在空间的不同位置。所以要去精准地捕捉到手柄在空间的位置的话,它上面有一个大的圈,圈上有几十个灯。如果要去做成比较小的一个部件的话,一样的同理那灯和灯之间的距离有时就很难去做小,如果只是采用一两个灯的话可能捕捉的精度就不够。
所以要有比较好的效果的话可能就是通过slam这种方式,比如说采用超声波的方式,所以这个产业之前没有特别好的手环或者手套解决方案是与它实现的一些技术原理、方式也是有关的,就是可能大家没有找到一个特别高性价比的,定位精度准的一种方式。
VR 设备手柄及头部的自由度目前来说普遍的技术都是达到了六自由度,有哪些技术要求?
李文权:其实这也是感知交互很重要的一个点,比如我们刚才也说要实现比较好的内容定位就要采用SLAM相关的技术。
去追踪环境的前提是要认识环境;认识环境首先就是要把环境在头显里边,或者说VR里边让它去建模,去重新生成这样一个环境,才能够在这个场景里边感知到在哪个点的变化。
我们现在的手柄采用的是led灯带这种形式,后边可能就像Quest一样,把手柄做得更小巧,定位精度更准确,或者说定位的范围更大。
因为我们这个手柄可能只有处在四个摄像头的视觉范围之内我们才能够去跟踪手柄。但如果玩挑战难度大些的游戏,把手放后边去的时候它就没办法跟踪了,因为摄像头看不到灯的亮面就没办法找到手柄在空间环境当中的位置,就没办法去实现一些高难度的交互应用。
Meta其实走得比较前边了,通过手柄上面增加一些摄像头的方式去感知事件,首先通过主机拿去建 slam,拿去建立一个场景的图后我再通过手柄的摄像头去感知到我这个手柄在主机间的这个场景里边什么个位置,这样的话它就没有任何盲点了,可以去实时地追踪。
还有就是技术难点。有些拍照或者需要感知外部的,需要采样率。如果手柄动得特别快的时候,摄像头可能拍出来效果不好,就容易出现感知不准确的情况。
彩色透视技术是什么?如何看待研发难度和应用进展?
李文权:全彩透视技术属于视频透视技术(Video-seethrough)的一个分支, Quest 2上面有一个安全边界的功能,可通过黑白的摄像头去实时观看外部的环境,如果超过了安全边界,就会显示外面真实的环境。
也就说它通过黑白色去看外部世界来说感知是非常不友好的。如果能有彩色的摄像头,就可以去准确地感知外部真实的环境。在过程当中其实最重要就是延时。感知场景一定小于 20 个毫秒才能比较准确。
举个简单例子,16年的VR 产品就很容易眩晕,主要原因就是头在转动的时候,从传感器采样的数据,传到 CPU,CPU会告诉 GPU 去渲染哪一帧的画面,最后到屏幕显示出来。
如果大于 20 毫秒的话,在头部转过去的时候可能还是看到上一个画面,这样就感觉很晕。
目前高通也在推出新的基线版本,也会采用 Mini Led 或者 Micro OLED 它本身屏幕的延时是比较低的,所以说它可能能做到十多个毫秒。现在我们能够看到采用发散 LCD 能到25 个毫秒左右,基本上完全能够用了。
未来可以部分代替 AR 的功能。 AR是增强现实,在现实场景的基础上叠加我们需要的一些信息。其实就是MR的功能了。为了能够长时间舒适的佩戴设备,还是要把整个产品做得小巧轻便。
未来XR产品的使用丰富程度也会大大增加。今年年底以及明年的产品基本都有会这样的功能了。也请大家关注创维的Pancake 1C和PRO版本。