第1部分:软件网络资源简介
Whisper v0.2是一款免费开源的本地语音转文字工具,基于先进的语音识别技术,具备多语言语音识别、翻译和语言识别功能。该软件基于大型数据集进行训练,拥有多任务模型,可快速将录音转换为文字。采用Faster Whisper模型,即使在普通CPU上也能实现出色的转录效果。
第2部分:软件工具下载地址
资源搜集不易,请按照提示进行获取,谢谢!
若资源失效或异常
可邮箱【helenwilkerson66@gmail.com】反馈
我们将在第一时间进行处理
可以关注下方公众号,第一时间获取更新资源!
第3部分:软件安装教程
1.下载压缩包,右键鼠标选择【解压到 Whisper v0.2】。
2.解压完成后,右键鼠标选择【以管理员身份运行】软件(也可将此程序发送到桌面快捷方式,便于后期使用)。
3.这里做个简单的软件功能说明:
❶模型选择:在左上角选择你想使用的模型,主要有三个,并且标注了大小,我分享的包里已集成medium模型,small与large需要另外下载。
❷GPU选择:这里要求GPU需要支持CUDA,如果不支持,务必不要选择GPU进行识别,不然程序可能会崩溃。
❸推理方式与精度:在左下角选择推理方式和精度。经过测试,我推荐在CPU上选择’int8’模式,这样速度更快。使用’large’模型时,建议的精度设置是’float32’。
4.点击【选择文件】按钮,这里支持wav与mp3两种格式,模型选择【medium】此模型已集成无需下载,直接点击【开始识别】按钮。
5.识别完成后,文本框内会展示识别结果,点击【保存结果】按钮即可。
茶余饭后
无言
© 版权声明
THE END
暂无评论内容