这是视觉大脑我国AI开展史上的高光时刻! 。
2025年4月25日,将主级赛跟着视觉大模型Vi du在全球视频生成威望评测VID-eval中以91.2分的导国的下道绝对优势登顶,我国人工智能总算跨过了“追逐”与“引领”的个超分水岭。
比照三年前还在为数据标示精度忧愁的视觉大脑工作困局,此时Vi du生成的将主级赛视频已能精准捕捉“落叶飘入咖啡杯的漩涡轨道”“玻璃破碎的力学传导途径”等杂乱场景,其技能成熟度让很多科学家不由感叹 :“我国同行的导国的下道打破速度,从头界说了AI开展的个超时刻轴 。”
从追随到引领的视觉大脑国产视觉大模型之路 。
2025年VIDU大模型登顶国际榜单的将主级赛背面,是导国的下道我国团队对技能途径的深度重构 。
生数科技与清华大学联合研制的个超U-ViT架构 ,初次将Diffusion模型与Transformer架构交融 ,视觉大脑完结16秒1080P高清视频的将主级赛端到端生成 ,练习功率较传统模型进步300%。导国的下道
这种架构立异并非孤例:商汤科技的"元国际架构"打破单一使命约束 ,支撑图画