加速大模型应用落地，这份火山方舟大模型使用攻略请查收！-云巴巴

立即咨询

立即试用

商务合作

首页

数字化社区

人工智能

加速大模型应用落地，这份火山方舟大模型使用攻略请查收！

2025-01-17

大模型时代，一个小团队甚至个人，即可完成Agent应用开发。大模型时代，产品、运营、市场人员无需懂代码编写，即可开发AI应用。适应时代的发展，通过合适的AI平台与工具，积极拥抱大模型，将开发者从繁杂的琐事、代码编写中解放出来，更加聚焦在创新创造、释放生产力、提升效率上，或许就是大模型时代，开发者的求生之路。

火山引擎拥有许多优秀的模型和云产品，其中火山方舟一站式大模型服务平台提供模型精调、推理、评测等全方位功能与服务，全方位保障企业级AI应用落地。平台拥有海量资源，能够通过资源潮汐调度保障流量高峰时业务的稳定性。

为了确保用户能够充分利用火山方舟提供的强大功能，云巴巴为大家提供这份详细攻略，快来查收吧！

火山引擎火山方舟大模型服务平台

火山引擎火山方舟大模型服务平台提供模型精调、推理、评测等全方位功能与服务，提供丰富的插件生态和AI原生应用开发服务，并通过安全可信的基础设施，专业的算法技术服务，全方位保障企业级AI应用落地。

免费试用查看详情

API调用

调用方式

1、请求结构

通信协议。支持通过HTTP或HTTPS两种方式进行请求通信，推荐使用安全性更高的HTTPS 方式发送请求。

请求方法。火山方舟API仅支持POST请求方法。

字符编码。请求及返回结果使用 UTF-8 的字符集进行编码。

2、地域和访问域名

地域（Region）指物理数据中心所在地理区域，资源创建后不支持更换地域。不同地域之间内网完全隔离。从地理位置的角度来讲，通常建议就近选择靠近您或者您的目标用户的地域，以减少网络时延，提高访问速度。

3、签名鉴权方式

API Key签名鉴权。API Key是请求火山方舟模型推理API的安全凭证，可以在API Key管理页面创建并获取API Key作为推理接入点的访问密钥。进入管理页面后，在有权限的项目下点击创建API Key，即可生成长效API Key。

AK/SK签名鉴权。访问密钥（Access Key）是请求火山引擎各云服务OpenAPI的安全凭证，可以参考Access Key管理获取账户的Access Key ID和Secret Access Key。

调用模型

API接口支持情况

大语言模型ChatCompletions API支持字段

豆包大语言模型Function Calling能力说明

管理API Key

用户可以通过API Explorer在线发起调用，无需关注签名生成过程，快速获取调用结果。

常见问题

Q：模型推理请求报错或者中断会计费么？

A：请求报错和中断分为下面几种情况。

客户端中断

无论是客户端因为无需后续结果主动中断请求，或超时中断请求，服务端感知到请求被中断，并终止服务端模型生成过程。在客户端中断，到服务端中止生成，中间仍旧有可能有若干个 token被生成出来。这些生成的token以及输入给模型处理的token会被计费。服务端中止生成后，就不会有进一步计费产生。

服务端中断

在流式输出过程中，如果输出一部分内容后，因为命中审核或其它原因，服务端中止了生成过程，已经生成的token仍旧会被计费。RPM/TPM等超限报错的请求不会开始模型生成过程，所以也不会产生任何计费。

Q：ArkAPIConnectionError (域名连接超时)，怎么处理？

A：检查本地环境是否可以访问方舟公网域名，如果域名访问不通，可以考虑使用以下方式关闭 HTTP_PROXY。如果ping命令执行成功，但是调用时依旧有如下报错，可以尝试对 /etc/resolv.conf 文件做如下修改后再次请求。

Q：Windows系统安装SDK失败？

A：由于 Windows 系统有最长路径限制，可能会导致安装失败，请按照以下方式设置：

按下 Win+R ，输入 regedit 打开注册表编辑器。

设置 \HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\FileSystem 路径下的变量 LongPathsEnabled 为1。

Q：使用视觉理解模型时，报错InvalidParameter？

A：

下载图片超时：为防止不必要的带宽浪费，默认图片下载超时时间5s。可能是图片访问速度较慢如外国网站，或者图片较大。对以上情况均建议更换到TOS上或压缩图片至100kB以下。

链接禁止访问：状态码403，部分图片服务器可能存在特殊安全/acl策略，禁止了火山源访问，建议检查客户所用图片服务器（阿里云对象存储/腾讯云对象存储/...）的安全策略。

Q：在任务状态为：运行中，终止中，已终止，失败的情况时，是否会有部分成功的结果输出？

A：会，已经运行成功的结果会写到output中，且运行成功的数据会正常计费。但是不保证任务运行顺序。

Q：基于什么的准则，去判断“失败”这种状态，是成功与错误比例，还是发现错误即判断失败？

以下情况判断任务失败：

文件输入格式不符合要求，如某一条数据不是json，会在任务开始前检测该类型错误，有错误会判定失败；预期外的错误，如job崩溃；任务运行超时；如果存在某条request运行失败，比如安全审核失败。这条request结果会写到error文件夹中，不会导致整体任务失败。

Q：在子任务数量巨大，无法预估处理所需的时间的前提下，设置的最大等待时间是否有大小上限？

A：CompletionWindow的最大等待时间最大可设置为28天。如果不指定，默认为28天。

Q：若由于超时使得批量推理任务状态为“已终止”，在终止之前所做的任务处理结果是否还有保留？

A：会保留，结果写在output中。

Q：输出长度是4k还是6k，亦或是其他？

A：限制与在线推理相同，输出超过限制会截断。

Q：批量推理按 tokens 用量计费，是按照输入tokens，或是输出tokens，又或是两者之和？

A：与在线推理相同，计费按照模型处理的内容量，输入输出都需要计费。

Q：对于处理失败的结果，也就是errors.jsonl中的结果，如何计费？

A：处理失败的结果不计费。

大模型时代已经来临，它为开发者们带来了前所未有的机遇与挑战。借助像火山方舟这样的先进平台，即使是没有深厚编程背景的产品经理、运营专员或市场人员也能轻松参与到AI应用的开发中来。

无论您是在寻找解决方案以应对特定的技术难题，还是希望深入了解如何高效地管理API调用，我们都提供了宝贵的指导信息。如果您遇到任何疑问，或者需要进一步的帮助和支持，请随时联系云巴巴的专业团队。我们将竭诚为您服务，确保每一位用户都能充分利用火山方舟的强大能力，加速实现自身业务目标。

云巴巴（Yun88.com）是中国领先的企业数字化服务平台，为客户提供数字化咨询、产品选型和采购的一站式服务，平台合作2000+厂商，上线20000+产品和方案，100+的数字化咨询顾问，致力于实现客户数字化转型的降本增效。

热门数字化产品

查看详情

闪捷数据库水印系统闪捷数据库水印系统以水印数据为核心，构建数据流转安全路径，实现安全与业务双效平衡。提供丰富的API接口能力，支持用户通过API接口调用执行水印、溯源任务，查看任务执行监控等。最高水印性能可达每小时150G，助力产品满足客户大数据量高性能水印要求。

查看详情

我打ERP进销存管理软件我打ERP是威海领新信息技术有限公司自主研发的一款进销存管理软件。 “威海领新”成立于2010年，致力于为电商卖家、快递网点、企业、个人等提供高效便捷的快递单打印发货服务。支持20+电商平台，有效商家达40万+，日处理订单量超2000万。

查看详情

DuoPlus云手机DuoPlus云手机是云端操控，拓展全球商机，简化多设备跨平台社媒操作，专注打造全球社媒营销、Tiktok、WhatsApp专用云手机！

查看详情

ONES Tower团队协作工具管理+协作，ONES提供研发全流程解决⽅案，为软件研发过程的各个⻆⾊搭建⾼效协作环境，科学提升研发效能。打通业务全流程，助⼒团队⾼效推进项⽬。从软件研发到市场营销、法律法务等数⼗个业务场景模板，开箱即⽤。

查看详情

腾讯Tapd研发项目管理平台TAPD是源自于腾讯的敏捷产品研发协作平台，提供贯穿敏捷开发生命周期的一站式服务。覆盖从产品概念形成、产品规划、需求分析、项目规划和跟踪、质量测试到构建发布、用户反馈跟踪的产品研发全过程，提供了灵活的可定制化应用和强大的集成能力，帮助研发团队有效地管理需求、资源、进度和质量，规范和改进产品研发过程，提高研发效率和产品质量。

为你推荐