(00175)集团联合宣告,两边协作的阶跃两款Step系列多模态大模型将向全球开发者开源,其间包含开源视频生成模型阶跃Step-Video-T2V,以及语音交互大模型阶跃Step-Audio。
揭露报导显现,阶跃Step-Video-T2V模型的参数量到达300亿,可以直接生成204帧、540P分辨率的高质量视频,这在某种程度上预示着能保证生成的视频内容具有较高的信息密度和一致性。从生成作用来看,阶跃Step-Video-T2V在杂乱运动、美感人物、视觉想象力、根底文字生成、原生中英双语输入和镜头言语等方面具有强壮的生成才能,且语义了解和指令遵从才能杰出,可以高效助力视频创作者完结精准构思出现。
在 LlaMA Question、Web Questions等5大干流揭露测验会集,阶跃Step-Audio模型功能超过了行业界同类型开源模型,位列榜首。阶跃Step-Audio在HSK-6(汉语水平考试六级)评测中的体现尤为杰出,是最懂中国话的开源语音交互大模型。
2024年12月下旬,国产大模型“六小虎”之一的阶跃星斗,宣告完结总额达数亿美元的B轮融资,中心出资方包含上海国有本钱出资有限公司及其旗下基金, 战略和财政出资人包含腾讯出资、五源本钱、启明创投等。
来源:华体会的主要产品和服务 发布时间:2025-02-18 21:24:52