立即咨询

电话咨询

微信咨询

立即试用
商务合作

加速大模型应用落地,这份火山方舟大模型使用攻略请查收!

2025-01-17

大模型时代,一个小团队甚至个人,即可完成Agent应用开发。大模型时代,产品、运营、市场人员无需懂代码编写,即可开发AI应用。适应时代的发展,通过合适的AI平台与工具,积极拥抱大模型,将开发者从繁杂的琐事、代码编写中解放出来,更加聚焦在创新创造、释放生产力、提升效率上,或许就是大模型时代,开发者的求生之路。

火山引擎拥有许多优秀的模型和云产品,其中火山方舟一站式大模型服务平台提供模型精调、推理、评测等全方位功能与服务,全方位保障企业级AI应用落地。平台拥有海量资源,能够通过资源潮汐调度保障流量高峰时业务的稳定性。

为了确保用户能够充分利用火山方舟提供的强大功能,云巴巴为大家提供这份详细攻略,快来查收吧!

火山引擎火山方舟大模型服务平台

火山引擎火山方舟大模型服务平台提供模型精调、推理、评测等全方位功能与服务,提供丰富的插件生态和AI原生应用开发服务,并通过安全可信的基础设施,专业的算法技术服务,全方位保障企业级AI应用落地。

API调用

调用方式

1、请求结构

通信协议。支持通过HTTP或HTTPS两种方式进行请求通信,推荐使用安全性更高的HTTPS 方式发送请求。

请求方法。火山方舟API仅支持POST请求方法。

字符编码。请求及返回结果使用 UTF-8 的字符集进行编码。

2、地域和访问域名

地域(Region)指物理数据中心所在地理区域,资源创建后不支持更换地域。不同地域之间内网完全隔离。从地理位置的角度来讲,通常建议就近选择靠近您或者您的目标用户的地域,以减少网络时延,提高访问速度。

3、签名鉴权方式

API Key签名鉴权。API Key是请求火山方舟模型推理API的安全凭证,可以在API Key管理页面创建并获取API Key作为推理接入点的访问密钥。进入管理页面后,在有权限的项目下点击创建API Key,即可生成长效API Key。

AK/SK签名鉴权。访问密钥(Access Key)是请求火山引擎各云服务OpenAPI的安全凭证,可以参考Access Key管理获取账户的Access Key ID和Secret Access Key。

调用模型

API接口支持情况

大语言模型ChatCompletions API支持字段

豆包大语言模型Function Calling能力说明

管理API Key

用户可以通过API Explorer在线发起调用,无需关注签名生成过程,快速获取调用结果。

常见问题

Q:模型推理请求报错或者中断会计费么?

A:请求报错和中断分为下面几种情况。

客户端中断

无论是客户端因为无需后续结果主动中断请求,或超时中断请求,服务端感知到请求被中断,并终止服务端模型生成过程。在客户端中断,到服务端中止生成,中间仍旧有可能有若干个 token被生成出来。这些生成的token以及输入给模型处理的token会被计费。服务端中止生成后,就不会有进一步计费产生。

服务端中断

在流式输出过程中,如果输出一部分内容后,因为命中审核或其它原因,服务端中止了生成过程,已经生成的token仍旧会被计费。RPM/TPM等超限报错的请求不会开始模型生成过程,所以也不会产生任何计费。

Q:ArkAPIConnectionError (域名连接超时),怎么处理?

A:检查本地环境是否可以访问方舟公网域名,如果域名访问不通,可以考虑使用以下方式关闭 HTTP_PROXY。如果ping命令执行成功,但是调用时依旧有如下报错,可以尝试对 /etc/resolv.conf 文件做如下修改后再次请求。

Q:Windows系统安装SDK失败?

A:由于 Windows 系统有最长路径限制,可能会导致安装失败,请按照以下方式设置:

按下 Win+R ,输入 regedit 打开注册表编辑器。

设置 \HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\FileSystem 路径下的变量 LongPathsEnabled 为1。

Q:使用视觉理解模型时,报错InvalidParameter?

A:

下载图片超时:为防止不必要的带宽浪费,默认图片下载超时时间5s。可能是图片访问速度较慢如外国网站,或者图片较大。对以上情况均建议更换到TOS上或压缩图片至100kB以下。

链接禁止访问:状态码403,部分图片服务器可能存在特殊安全/acl策略,禁止了火山源访问,建议检查客户所用图片服务器(阿里云对象存储/腾讯云对象存储/...)的安全策略。

Q:在任务状态为:运行中,终止中,已终止,失败的情况时,是否会有部分成功的结果输出?

A:会,已经运行成功的结果会写到output中,且运行成功的数据会正常计费。但是不保证任务运行顺序。

Q:基于什么的准则,去判断“失败”这种状态,是成功与错误比例,还是发现错误即判断失败?

以下情况判断任务失败:

文件输入格式不符合要求,如某一条数据不是json,会在任务开始前检测该类型错误,有错误会判定失败;预期外的错误,如job崩溃;任务运行超时;如果存在某条request运行失败,比如安全审核失败。这条request结果会写到error文件夹中,不会导致整体任务失败。

Q:在子任务数量巨大,无法预估处理所需的时间的前提下,设置的最大等待时间是否有大小上限?

A:CompletionWindow的最大等待时间最大可设置为28天。如果不指定,默认为28天。

Q:若由于超时使得批量推理任务状态为“已终止”,在终止之前所做的任务处理结果是否还有保留?

A:会保留,结果写在output中。

Q:输出长度是4k还是6k,亦或是其他?

A:限制与在线推理相同,输出超过限制会截断。

Q:批量推理按 tokens 用量计费,是按照输入tokens,或是输出tokens,又或是两者之和?

A:与在线推理相同,计费按照模型处理的内容量,输入输出都需要计费。

Q:对于处理失败的结果,也就是errors.jsonl中的结果,如何计费?

A:处理失败的结果不计费。

大模型时代已经来临,它为开发者们带来了前所未有的机遇与挑战。借助像火山方舟这样的先进平台,即使是没有深厚编程背景的产品经理、运营专员或市场人员也能轻松参与到AI应用的开发中来。

无论您是在寻找解决方案以应对特定的技术难题,还是希望深入了解如何高效地管理API调用,我们都提供了宝贵的指导信息。如果您遇到任何疑问,或者需要进一步的帮助和支持,请随时联系云巴巴的专业团队。我们将竭诚为您服务,确保每一位用户都能充分利用火山方舟的强大能力,加速实现自身业务目标。

云巴巴(Yun88.com)是中国领先的企业数字化服务平台,为客户提供数字化咨询、产品选型和采购的一站式服务,平台合作2000+厂商,上线20000+产品和方案,100+的数字化咨询顾问,致力于实现客户数字化转型的降本增效。

热门数字化产品

闪捷数据库水印系统闪捷数据库水印系统以水印数据为核心,构建数据流转安全路径,实现安全与业务双效平衡。提供丰富的API接口能力,支持用户通过API接口调用执行水印、溯源任务,查看任务执行监控等。最高水印性能可达每小时150G,助力产品满足客户大数据量高性能水印要求。
我打ERP进销存管理软件我打ERP是威海领新信息技术有限公司自主研发的一款进销存管理软件。 “威海领新”成立于2010年,致力于为电商卖家、快递网点、企业、个人等提供高效便捷的快递单打印发货服务。 支持20+电商平台,有效商家达40万+,日处理订单量超2000万。
DuoPlus云手机DuoPlus云手机是云端操控,拓展全球商机,简化多设备跨平台社媒操作,专注打造全球社媒营销、Tiktok、WhatsApp专用云手机!
ONES Tower团队协作工具管理+协作,ONES提供研发全流程解决⽅案,为软件研发过程的各个⻆⾊搭建⾼效协作环境,科学提升研发效能。打通业务全流程,助⼒团队⾼效推进项⽬。从软件研发到市场营销、法律法务等数⼗个业务场景模板,开箱即⽤。
腾讯Tapd研发项目管理平台TAPD是源自于腾讯的敏捷产品研发协作平台,提供贯穿敏捷开发生命周期的一站式服务。覆盖从产品概念形成、产品规划、需求分析、项目规划和跟踪、质量测试到构建发布、用户反馈跟踪的产品研发全过程,提供了灵活的可定制化应用和强大的集成能力,帮助研发团队有效地管理需求、资源、进度和质量,规范和改进产品研发过程,提高研发效率和产品质量。
为你推荐
2025腾讯产业合作伙伴大会|云巴巴荣获双项大奖,载誉而归

1月16日,2025腾讯产业合作伙伴大会在三亚召开。云巴巴,荣膺“2024腾讯云卓越合作伙伴奖—星云奖”和“2024腾讯云AI产品突出贡献奖”双项大奖

2025-01-17
后疫情时代企业供应链升级怎么办?蓝巨人无人叉车重构仓储物流的“免疫力”

如何让仓储物流从“被动承压”转向“主动免疫”?是个难题。

2025-04-03
政策风口下,云巴巴如何助力企业“吃透”红利,实现数字化转型突围?

云巴巴,作为中国领先的企业数字化一站式服务平台,凭借其强大的平台能力和完善的生态体系,为企业提供了一条清晰的数字化转型路径。

2025-04-03
AI算力下沉边缘,网宿SD-WAN如何为“边缘智能”按下加速键?

网宿科技推出的SD-WAN_E-connect解决方案,通过智能流量调度、毫秒级时延优化和统一网络管理三大核心能力。

2025-04-03
微信文件总过期怎么办?敏信即时通讯自动存档让协作更便捷

如何通过技术工具实现安全、高效、一体化的数字化协作,已成为企业亟待破解的战略课题。

2025-04-03
查看更多