大模型时代,一个小团队甚至个人,即可完成Agent应用开发。大模型时代,产品、运营、市场人员无需懂代码编写,即可开发AI应用。适应时代的发展,通过合适的AI平台与工具,积极拥抱大模型,将开发者从繁杂的琐事、代码编写中解放出来,更加聚焦在创新创造、释放生产力、提升效率上,或许就是大模型时代,开发者的求生之路。
火山引擎拥有许多优秀的模型和云产品,其中火山方舟一站式大模型服务平台提供模型精调、推理、评测等全方位功能与服务,全方位保障企业级AI应用落地。平台拥有海量资源,能够通过资源潮汐调度保障流量高峰时业务的稳定性。
为了确保用户能够充分利用火山方舟提供的强大功能,云巴巴为大家提供这份详细攻略,快来查收吧!
API调用
调用方式
1、请求结构
通信协议。支持通过HTTP或HTTPS两种方式进行请求通信,推荐使用安全性更高的HTTPS 方式发送请求。
请求方法。火山方舟API仅支持POST请求方法。
字符编码。请求及返回结果使用 UTF-8 的字符集进行编码。
2、地域和访问域名
地域(Region)指物理数据中心所在地理区域,资源创建后不支持更换地域。不同地域之间内网完全隔离。从地理位置的角度来讲,通常建议就近选择靠近您或者您的目标用户的地域,以减少网络时延,提高访问速度。
3、签名鉴权方式
API Key签名鉴权。API Key是请求火山方舟模型推理API的安全凭证,可以在API Key管理页面创建并获取API Key作为推理接入点的访问密钥。进入管理页面后,在有权限的项目下点击创建API Key,即可生成长效API Key。
AK/SK签名鉴权。访问密钥(Access Key)是请求火山引擎各云服务OpenAPI的安全凭证,可以参考Access Key管理获取账户的Access Key ID和Secret Access Key。
调用模型
API接口支持情况
大语言模型ChatCompletions API支持字段
豆包大语言模型Function Calling能力说明
管理API Key
用户可以通过API Explorer在线发起调用,无需关注签名生成过程,快速获取调用结果。
常见问题
Q:模型推理请求报错或者中断会计费么?
A:请求报错和中断分为下面几种情况。
客户端中断
无论是客户端因为无需后续结果主动中断请求,或超时中断请求,服务端感知到请求被中断,并终止服务端模型生成过程。在客户端中断,到服务端中止生成,中间仍旧有可能有若干个 token被生成出来。这些生成的token以及输入给模型处理的token会被计费。服务端中止生成后,就不会有进一步计费产生。
服务端中断
在流式输出过程中,如果输出一部分内容后,因为命中审核或其它原因,服务端中止了生成过程,已经生成的token仍旧会被计费。RPM/TPM等超限报错的请求不会开始模型生成过程,所以也不会产生任何计费。
Q:ArkAPIConnectionError (域名连接超时),怎么处理?
A:检查本地环境是否可以访问方舟公网域名,如果域名访问不通,可以考虑使用以下方式关闭 HTTP_PROXY。如果ping命令执行成功,但是调用时依旧有如下报错,可以尝试对 /etc/resolv.conf 文件做如下修改后再次请求。
Q:Windows系统安装SDK失败?
A:由于 Windows 系统有最长路径限制,可能会导致安装失败,请按照以下方式设置:
按下 Win+R ,输入 regedit 打开注册表编辑器。
设置 \HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\FileSystem 路径下的变量 LongPathsEnabled 为1。
Q:使用视觉理解模型时,报错InvalidParameter?
A:
下载图片超时:为防止不必要的带宽浪费,默认图片下载超时时间5s。可能是图片访问速度较慢如外国网站,或者图片较大。对以上情况均建议更换到TOS上或压缩图片至100kB以下。
链接禁止访问:状态码403,部分图片服务器可能存在特殊安全/acl策略,禁止了火山源访问,建议检查客户所用图片服务器(阿里云对象存储/腾讯云对象存储/...)的安全策略。
Q:在任务状态为:运行中,终止中,已终止,失败的情况时,是否会有部分成功的结果输出?
A:会,已经运行成功的结果会写到output中,且运行成功的数据会正常计费。但是不保证任务运行顺序。
Q:基于什么的准则,去判断“失败”这种状态,是成功与错误比例,还是发现错误即判断失败?
以下情况判断任务失败:
文件输入格式不符合要求,如某一条数据不是json,会在任务开始前检测该类型错误,有错误会判定失败;预期外的错误,如job崩溃;任务运行超时;如果存在某条request运行失败,比如安全审核失败。这条request结果会写到error文件夹中,不会导致整体任务失败。
Q:在子任务数量巨大,无法预估处理所需的时间的前提下,设置的最大等待时间是否有大小上限?
A:CompletionWindow的最大等待时间最大可设置为28天。如果不指定,默认为28天。
Q:若由于超时使得批量推理任务状态为“已终止”,在终止之前所做的任务处理结果是否还有保留?
A:会保留,结果写在output中。
Q:输出长度是4k还是6k,亦或是其他?
A:限制与在线推理相同,输出超过限制会截断。
Q:批量推理按 tokens 用量计费,是按照输入tokens,或是输出tokens,又或是两者之和?
A:与在线推理相同,计费按照模型处理的内容量,输入输出都需要计费。
Q:对于处理失败的结果,也就是errors.jsonl中的结果,如何计费?
A:处理失败的结果不计费。
大模型时代已经来临,它为开发者们带来了前所未有的机遇与挑战。借助像火山方舟这样的先进平台,即使是没有深厚编程背景的产品经理、运营专员或市场人员也能轻松参与到AI应用的开发中来。
无论您是在寻找解决方案以应对特定的技术难题,还是希望深入了解如何高效地管理API调用,我们都提供了宝贵的指导信息。如果您遇到任何疑问,或者需要进一步的帮助和支持,请随时联系云巴巴的专业团队。我们将竭诚为您服务,确保每一位用户都能充分利用火山方舟的强大能力,加速实现自身业务目标。
云巴巴(Yun88.com)是中国领先的企业数字化服务平台,为客户提供数字化咨询、产品选型和采购的一站式服务,平台合作2000+厂商,上线20000+产品和方案,100+的数字化咨询顾问,致力于实现客户数字化转型的降本增效。
1月16日,2025腾讯产业合作伙伴大会在三亚召开。云巴巴,荣膺“2024腾讯云卓越合作伙伴奖—星云奖”和“2024腾讯云AI产品突出贡献奖”双项大奖
如何让仓储物流从“被动承压”转向“主动免疫”?是个难题。
云巴巴,作为中国领先的企业数字化一站式服务平台,凭借其强大的平台能力和完善的生态体系,为企业提供了一条清晰的数字化转型路径。
网宿科技推出的SD-WAN_E-connect解决方案,通过智能流量调度、毫秒级时延优化和统一网络管理三大核心能力。
如何通过技术工具实现安全、高效、一体化的数字化协作,已成为企业亟待破解的战略课题。