Transcriptions（语音转文字）

正式环境

https://api.302.ai

POST

/v1/audio/transcriptions

将音频转录为输入语言。
转录API接受您想要转录的音频文件作为输入，以及您希望的音频转录输出文件格式。我们目前支持多种输入和输出文件格式。

价格：0.002 PTC /分钟

请求参数

Header 参数

string

必需

示例值:

application/json

Authorization

string

可选

示例值:

Bearer {{YOUR_API_KEY}}

Body 参数multipart/form-data

file

必需

要转录的音频文件，采用以下格式之一：mp3、mp4、mpeg、mpga、m4a、wav 或 webm。

model

string

必需

要使用的模型的 ID。whisper-v3 , whisper-v3-turbo

示例值:

whisper-v3-turbo

vad_model

string

可选

示例值:

silero

temperature

string

可选

示例值:

language

string

可选

示例代码

Shell

JavaScript

Java

Swift

PHP

Python

HTTP

Objective-C

Ruby

OCaml

Dart

curl --location --request POST 'https://api.302.ai/v1/audio/transcriptions' \
--header 'Accept: application/json' \
--header 'Authorization: Bearer ' \
--form 'file=@""' \
--form 'model="whisper-v3-turbo"' \
--form 'vad_model="silero"' \
--form 'temperature="0"' \
--form 'language=""'

返回响应

🟢200OK

application/json

Body

text

string

必需

示例

{
    "text": "Imagine the wildest idea that you've ever had, and you're curious about how it might scale to something that's a 100, a 1,000 times bigger. This is a place where you can get to do that."
}

修改于 2025-05-15 10:20:39

Transcript（音视频转字幕）

Alignments（字幕打轴）