Transcriptions(语音转文字)
POST
/v1/audio/transcriptions将音频转录为输入语言。
转录API接受您想要转录的音频文件作为输入,以及您希望的音频转录输出文件格式。我们目前支持多种输入和输出文件格式。
价格:0.002 PTC /分钟
请求参数
Header 参数
Accept
string
必需
示例值:
application/json
Authorization
string
可选
示例值:
Bearer {{YOUR_API_KEY}}
Body 参数multipart/form-data
file
file
必需
要转录的音频文件,采用以下格式之一:mp3、mp4、mpeg、mpga、m4a、wav 或 webm。
model
string
必需
要使用的模型的 ID。whisper-v3 , whisper-v3-turbo
示例值:
whisper-v3-turbo
vad_model
string
可选
示例值:
silero
temperature
string
可选
示例值:
0
language
string
可选
preprocessing
string
可选
none
dynamic
soft_dynamic
bass_dynamic
response_format
string
可选
回复的格式,采用以下格式之一:json、srt、verbose_json、vtt
示例值:
json
timestamp_granularities
string
可选
word
segment
word,segment
alignment_model
string
可选
tdnn_ffn
mms_fa
gentle
示例代码
返回响应
OK(200)
HTTP 状态码: 200
内容格式: JSONapplication/json
数据结构
text
string
必需
示例OK
{
"text": "Imagine the wildest idea that you've ever had, and you're curious about how it might scale to something that's a 100, a 1,000 times bigger. This is a place where you can get to do that."
}
最后修改时间: 2 个月前