吉利与阶跃星辰开源两款多模态大模型:国产AI技术走向全球

2025-02-23 7:51:27 图像生成 author

近日,吉利汽车集团与阶跃星辰联合宣布,开源两款名为Step系列的多模态大模型:Step-Video-T2V和Step-Audio。此举标志着国产AI技术在全球范围内的进一步拓展,也为全球开发者提供了强大的工具和资源。

Step-Video-T2V,作为参数量高达300亿的视频生成模型,堪称目前全球性能最佳的开源同类产品之一。其能够直接生成分辨率达540P、帧率为204帧的高质量视频,这在开源模型领域无疑是一个巨大的突破。这意味着开发者可以更便捷地创建高质量视频内容,推动视频创作领域的技术革新。

另一款开源模型Step-Audio则是一款产品级的语音交互模型,其功能之强大令人印象深刻。它能够根据不同的场景需求,生成各种风格的语音表达,包括不同的情绪、方言、语种、歌声以及个性化风格。这一特性使其能够与用户进行更自然、更高质量的对话交互,为各种AI应用提供更具人性化的语音体验。

吉利汽车集团CEO淦家阅表示,吉利全栈自研的星睿AI大模型已经与这两款开源模型深度融合。这意味着吉利汽车将借助这些先进的AI技术,进一步提升智能汽车的性能和用户体验,推动AI技术在智能汽车领域的普及和应用。

阶跃星辰创始人兼CEO姜大昕博士则表示,开源这两款模型的初衷是希望与全球开发者共享技术成果,共同推动多模态模型的发展,并以此拓展技术边界。这体现了阶跃星辰开放合作的理念,以及其在AI技术领域的技术实力和自信。

这次开源事件,不仅是对国产AI技术实力的展现,更是对全球AI技术发展的一次重要贡献。相信随着越来越多开发者参与到Step系列模型的应用和改进中,这些模型将进一步完善,并在更多领域发挥重要作用。未来,我们有理由期待看到更多基于这些模型的创新应用,以及国产AI技术在全球舞台上更闪耀的表现。

发表评论:

最近发表