立即咨询

电话咨询

微信咨询

立即试用
商务合作

豆包1.5大模型正式发布,一文读懂这款全新的多模态基础模型

2025-01-23

前有川普拉OpenAI、软银等公司成立AI公司,后有DeepSeek R1为代表的国产推理模型赶超OpenAI是所有AI公司的课题。2025年开年这场浪潮就已经愈演愈热,昨天字节跳动旗下的豆包大模型1.5 正式亮相,不仅全面升级了模型的核心能力,也融合并进一步提升了多模态能力,在多项公开评测基准中也是全球领先水平。

这次发布的豆包大模型1.5系列产品线包括:

Doubao-1.5-pro:多项基准测试综合得分优于GPT-4o、Claude 3.5 Sonnet等业界一流模型,创历史最佳成绩。

Doubao-1.5-lite:用轻量级成本实现旗舰级性能,综合性能持平或超越GPT-4omini,Cluade 3.5 Haiku。

Doubao-1.5-vision-pro:定位专业视觉理解模型,在保持强大性能的同时,回复更简洁友好,多模态能力超越了GPT-4o-0806。

Doubao-1.5-realtime-voice-pro:真正实现端到端语音对话,具备低时延、对话中可随时打断、自然的情绪表达等特性,即将开放API服务。最重要的是豆包大模型将继续保持原有模型价格不变,加量不加价。

豆包通用模型 Pro

Doubao-1.5-pro 现已逐步在豆包APP中推出,鉴于对话系统首先进行的是意图识别,因此用户可能难以确切知晓自己是否正在使用1.5 Pro版本。不过,开发者可以通过火山引擎直接调用该API来确保使用此版本。

Doubao-1.5-pro 在多项权威评估基准上取得了卓越的成绩,包括知识领域(MMLU_PRO、GPQA)、编程能力(McEval、FullStackBench)、推理技巧(DROP)以及中文处理(CMMLU、C-Eval),其综合表现超越了诸如GPT-4o和Claude 3.5 Sonnet等业界顶尖模型。

火山引擎豆包大模型

火山引擎豆包大模型是字节跳动推出的自研大模型。通过字节跳动内部50+业务场景实践验 证,每日千亿级tokens大使用量持续打磨,提供多模态能力,以优质模 型效果为企业打造丰富的业务体验。

豆包通用模型 Lite

作为轻量级语言模型的一员,Doubao-1.5-lite 同样达到了全球领先的水平。客户可以在多种应用场景中以更低的成本享受到几乎与Pro版本相匹配的性能。

该模型在综合能力(MMLU_pro)、推理能力(BBH)、数学技能(MATH)及专业知识(GPQA)等多个权威测评指标上,均与GPT-4omini和Claude 3.5 Haiku持平甚至更胜一筹。

豆包视觉理解模型

相比上一版本,Doubao-1.5-vision-pro在多模态数据合成、动态分辨率、多模态对齐、混合训练上进行了全面的技术升级,进一步增强了模型在视觉推理、文字文档识别、细粒度信息理解、指令遵循方面的能力,并让模型的回复模式变得更加精简、友好。

支持任意分辨率和极端长宽比图像识别。豆包视觉理解模型采用原生动态分辨率的架构设计,支持任意分辨率的图像输入。

领先的复杂指令遵循能力。豆包视觉理解模型通过系统性的原子能力拆解和多维度指令的逻辑组合,在后训练阶段引入多样化的视觉指令数据,从而激发模型的指令遵循能力,从容应对需要遵循更复杂指令的场景。

豆包实时语音模型

全新的豆包实时语音模型,并已在豆包APP中全面开放使用(在开始体验之前,请确保您的豆包APP已更新至7.2.0版本)。

这款模型集成了语音理解与生成的功能,提供了一体化的端到端语音对话解决方案。相较于传统的级联式处理方法,豆包实时语音模型在语音的自然度、情感传递以及响应速度上展现出色,同时支持低延迟和即时中断对话等功能,为用户提供更加流畅自然的交互体验。

豆包发布的系列模型表现显著,不仅继承了上述各版本的优势,更进一步融合创新,形成了独特的特色和优势。

更强的模型架构。模型结构上,豆包大模型1.5采用大规模稀疏MoE架构,以较小的激活参数进行预训练,等效7倍激活参数的Dense模型性能,远超业内MoE架构约3倍杠杆的常规效率。

更低的成本。字节跳动自研服务器集群方案灵活支持低成本芯片,硬件成本比行业方案大幅降低;自研网卡和网络协议,显著优化小包通讯效率;算子层计算和通信的高效交叠,保证了多机分布式推理的稳定和高效;通过精细量化和 PD 分离等方案,灵活使用算力和多任务混合调度,实现更高效算力利用。

总结而言,豆包大模型1.5系列的发布标志着AI技术的一个重要里程碑。通过在通用语言处理、视觉理解以及实时语音交互等领域的全面升级,豆包不仅为用户提供了更加智能和高效的服务,同时也为开发者们开辟了新的应用可能性。

如果您希望了解更多关于豆包大模型1.5的信息,或是探讨如何将这一强大工具融入您的业务流程中,欢迎随时联系云巴巴。我们的团队将竭诚为您提供专业的咨询和支持,帮助您开启智能新时代的大门。

云巴巴(Yun88.com)是中国领先的企业数字化服务平台,为客户提供数字化咨询、产品选型和采购的一站式服务,平台合作2000+厂商,上线20000+产品和方案,100+的数字化咨询顾问,致力于实现客户数字化转型的降本增效。

热门数字化产品

Zoho Projects项目管理软件Zoho Projects项目管理软件,帮助您轻松地进行项目规划、进度跟踪、内外协作。它利用工时统计、Bug管理、项目知识库管理等功能,帮助您实现业务目标。为您的项目管理工作提供全面综合的解决方案,从而帮助您和您的企业大幅创造价值。
我打ERP进销存管理软件我打ERP是威海领新信息技术有限公司自主研发的一款进销存管理软件。 “威海领新”成立于2010年,致力于为电商卖家、快递网点、企业、个人等提供高效便捷的快递单打印发货服务。 支持20+电商平台,有效商家达40万+,日处理订单量超2000万。
DeepBrain AI数字人平台DeepBrain AI数字人平台具备人工智能语音影像合成底层技术并具备对话机器人底层技术能力。
智引科技智塑云MES系统智引科技智塑云MES系统,工艺巡检,自由定义间隔时间保存生产工艺以备追溯,工艺数字化,工艺参数异常监控,工艺参数变动历史记录。采取“统一备份”的机制,做到及时、安全的数据备份, 同时减轻了数据备份的工作量。
精臣云资产固定资产管理系统精臣云资产固定资产管理系统提供全生命周期的资产管理解决方案。它通过云计算和物联网技术,实现资产的实时追踪与管理,支持资产盘点、折旧计算、维修记录等功能。系统特点包括采购管理、资产入库、日常管理、标签打印、资产盘点、耗材管理、单据审批和资产报表等。精臣云资产旨在提升资产管理的透明度和效率,降低管理成本,适用于多种企业场景。
为你推荐
2025腾讯产业合作伙伴大会|云巴巴荣获双项大奖,载誉而归

1月16日,2025腾讯产业合作伙伴大会在三亚召开。云巴巴,荣膺“2024腾讯云卓越合作伙伴奖—星云奖”和“2024腾讯云AI产品突出贡献奖”双项大奖

2025-01-17
数据分析也能和聊天一样简单?海纳嗨数AI助手如何破解企业决策难题?

它凭借多模态融合的上下文感知系统、因果推理赋能的决策解释性以及动态知识蒸馏的预测引擎,为企业提供了全新的解决方案,助力客户业务实现快速增长。

2025-04-27
传统AI代码工具效率低下?TAPD MCP Server让开发效率与质量双倍飙升

腾讯TAPD作为国内领先的敏捷研发管理平台,可以说是最早拥抱MCP的研发管理工具之一,凭借其全生命周期的研发管理能力,成为AI代码助手的“最强外挂”,其创新功能直击开发痛点。

2025-04-25
如何提升政企客户服务效率?协同管理+规模触达成政企服务质量选型新标准

基于预设规则和对象特征,让消息推送更智能更精准,帮助企业打通内外部系统的数据系统,实现更多灵活、更个性化的营销和服务能力开发。

2025-04-25
如何利用数据分析做好活动营销?海纳嗨数让活动策划执行更加高效便捷

海纳嗨数凭借其专业的数据分析能力,为企业提供从数据采集到深度洞察的一站式解决方案,助力活动策划与执行实现质的飞跃。

2025-04-25
查看更多