import whisper
|
model = whisper.load_model("medium")
|
result = model.transcribe("audio/input.wav")
|
|
print(result["text"])
|
|
# tiny 72.1M 我说问大家这个话里给放在前台了是卡罗前台是吗对好的谢谢
|
# base 1XXM 我帅哥那个发力给他放在前台了是7号了前台是吧对好的谢谢好
|
# small 461M 喂你好哦我順風的一個畫地給放在前台了是7號樓前台是吧對好的謝謝
|
# medium 1.42G 喂你好你好我身后那儿有个法律给放在前台了是7号楼前台是吧对好的谢谢好
|