最近准备搞移动端实时抠像算法,用在会议或者直播中。 调研了几个模型:
- 百度的 PP-HumanSeg ,22 年的模型,感觉效果一般,推理速度也不是很快
- mnnkit 里面的人像分割,效果也一般,速度倒是挺快,而且模型也没有开源,也没法直接用
- RobustVideoMatting ,字节出的一个模型,速度在移动端上还是比较慢
大家有做过类似的抠像吗,在移动端上,有什么好的模型结构可以使用吗,既要兼顾效果,又要兼顾推理速度,太难了。
最近准备搞移动端实时抠像算法,用在会议或者直播中。 调研了几个模型:
大家有做过类似的抠像吗,在移动端上,有什么好的模型结构可以使用吗,既要兼顾效果,又要兼顾推理速度,太难了。
1
gongfuxiongmao OP 看来传统的 CNN 已经没人关注了
|
2
yu6564172 7h 27m ago
挽尊, 移动端你要考虑不同机型的性能, 这是个吃力不讨好的方案, 兼容性太复杂了
|