python/pyTools.git

import whisper
model = whisper.load_model("medium")
result = model.transcribe("audio/input.wav")
 
print(result["text"])
 
# tiny 72.1M 我说问大家这个话里给放在前台了是卡罗前台是吗对好的谢谢
# base 1XXM  我帅哥那个发力给他放在前台了是7号了前台是吧对好的谢谢好
# small 461M  喂你好哦我順風的一個畫地給放在前台了是7號樓前台是吧對好的謝謝
# medium 1.42G  喂你好你好我身后那儿有个法律给放在前台了是7号楼前台是吧对好的谢谢好