【新智元导读】谷歌团队推出「通用视觉编码器」VideoPrism,在 3600 万高质量视频字幕对和 5.82 亿个视频剪辑的数据集上完成了训练,性能刷新 30 项 SOTA。 ...

关注我们的公众号

微信公众号