fork: whisper-demo-for-web
基于 WebRCT + whisper 的语音识别 demo
基于flet + modelscope 的实时语言识别与翻译
- 实时识别时,保存历史音频使用Whisper优化识别内容
- Flet客户端可以选择音频设备再监听(Electron/Node是否有选择音频设备的库)
- 语言角色识别
web
- 构建工具:
vite - 框架:
React - 组件库:
antd - 语音采集:
recordrtc,webm-to-wav-converter - 客户端生成:
flet
python
- 服务器框架:
uvicorn,fastapi - 音频处理:
librosa,numpy - 字词转换:
zhconv - 语音采集:
soundfile,sounddevice
cd ./web
pnpm install
pnpm run dev
cd ./python
pip install -r requirements.txt
python main.py
cd ./python
pip install -r requirements.txt
flet run flet_main.py
在浏览器中访问 http://localhost:5173/
-
找不到动态链接库,我使用的是miniforge3,所以需要手动指定lib
export LD_LIBRARY_PATH="/home/user/miniforge3/lib:$LD_LIBRARY_PATH"