火山引擎豆包大模型家族升级:视觉理解模型领衔,AIoT应用场景广阔

2024-12-23 1:11:47 图像生成 author

近日,火山引擎发布豆包大模型家族全新升级,包括性能大幅提升的豆包通用模型、语音大模型和视觉大模型,以及全新推出的豆包·视觉理解模型。该视觉理解模型价格大幅降低,每千tokens仅需0.003元,比行业平均价格低85%,这意味着1元钱可以处理约284张720P图片,极大降低了使用门槛,标志着视觉理解模型进入“厘时代”。

豆包·视觉理解模型支持同时输入文本和图像,并给出准确的综合性回答,简化了应用开发流程,拓展了大模型的应用场景,在金融、医疗、建筑、地理、体育、物流等领域具有广阔前景。此外,火山引擎还提升了模型的初始流量,RPM达到15000次,TPM达到120万,以帮助企业和开发者更好地利用视觉理解模型。

豆包大模型家族其他成员也取得了显著进步。数据显示,豆包大模型12月日均tokens使用量超过4万亿,较5月增长超过33倍。豆包通用模型pro在多个方面性能提升显著,例如推理提升13%,指令遵循提升9%,代码提升58%,数学提升43%,专业知识领域提升54%。

天风证券研报认为,生成式大模型的兴起催生了新的应用场景,例如AI+IP的互动应用,预计到2026年,全球智能玩具市场规模将增长到近700亿美元。AI终端放量和技术升级将带动AI SOC量价齐升,预计SoC市场规模将从2024年的1384.6亿美元增长到2029年的2059.7亿美元,CAGR达到8.3%。研报建议关注AI眼镜、AI家居、AI视觉、AI玩具SOC相关的企业,以及配套存储、CIS和解决方案提供商。

风险提示:下游需求不及预期、技术升级迭代不及预期、新品推广不及预期、供应商集中风险、客户集中风险等。

发表评论:

最近发表