Constme-Whisper(离线语音识别) v1.12
分类:Windows
时间: 2024-01-15 16:25
Whisper是OpenAI的Whisper自动语音识别ASR模型的衍生项目。
Whisper可以在Windows上使用,支持高性能GPGPU处理,可以利用GPU加速处理。
本体是个启动器,需要结合一个语言识别模型文件(ggml-tiny、ggml-small、ggml-base、ggml-medium、ggml-large)使用,模型越大,效果越好,但相对的速度也更慢。
软件特点
基于DirectCompute的与供应商无关的GPGPU;该技术的另一个名称是“Direct3D 11 中的计算着色器”纯C++实现,除了基本的操作系统组件外,没有运行时依赖关系比OpenAI的实现快得多。混合 F16 / F32 精度:Windows 需要自 D3D 版本 10.0 起支持缓冲区R16_FLOAT内置性能探查器,用于测量单个计算着色器的执行时间内存使用率低用于音频处理的媒体基础,支持大多数音频和视频格式(Ogg Vorbis除外), 以及大多数在Windows上运行的音频捕获设备(除了一些专业设备,它们只实现ASIO API)。用于音频捕获的语音活动检测。易于使用的 COM 样式 API,nuget 上提供的惯用 C# 包装器提供预构建的二进制文件软件截图
更新日志
更新了文档和 GUI 中的模型源 URL
可靠性增强,麦克风捕获不太可能转换到“停滞”状态并丢弃音频
1. 本站所有资源来源于用户上传或网络,仅作为参考研究使用,如有侵权请邮件联系站长!
2. 本站积分货币获取途径以及用途的解读,想在本站混的好,请务必认真阅读!
3. 本站强烈打击盗版/破解等有损他人权益和违法作为,请各位会员支持正版!
4. Windows > Constme-Whisper(离线语音识别) v1.12
2. 本站积分货币获取途径以及用途的解读,想在本站混的好,请务必认真阅读!
3. 本站强烈打击盗版/破解等有损他人权益和违法作为,请各位会员支持正版!
4. Windows > Constme-Whisper(离线语音识别) v1.12