
这段时间一直在折腾一个小工具名字叫 旺财翻译。它的定位很简单一个尽量能在普通 Windows 电脑上跑起来的本地离线中英会议 / 上课实时翻译助手。不是云端 API 服务也不是多人会议平台而是更像一个本地字幕员打开软件对着麦克风说话左边显示原文右边显示译文适合会议、课堂、讲座、培训、演示现场使用。为什么做这个工具很多实际场景里并不一定需要很复杂的平台。比如老师上课时中间会夹英文术语单位内部会议里会出现中英混说培训、讲座、演示现场希望能把原文和译文投到屏幕上有些内容不适合上传云端使用者未必懂 Python、模型、命令行只想双击打开直接用。所以旺财翻译的目标不是炫技而是尽量做到Windows 友好本地离线运行不依赖云端 API不强制需要显卡普通电脑可用现场展示清楚当前版本能做什么目前 V4 版本已经具备这些功能中英语音识别中英文混说识别本地翻译模型左右分屏显示原文和译文全屏实时记录显示会话记录保存中英文摘要导出麦克风自动增益和噪声门自动模式ASR 双路交替减少长时间识别中的卡顿和丢句翻译模型双实例常驻互为 fallbackWindows 一键安装和桌面快捷方式界面没有做成聊天气泡而是做成比较适合投影和课堂展示的左右分屏左边原文右边译文。录音时会先有临时占位系统识别完成后再替换成正式文本和翻译结果。这样用户能知道软件已经听到了声音不会误以为卡住。为什么强调本地离线很多翻译工具效果很好但默认依赖云端服务。普通聊天或者轻量使用当然没问题但在会议、课堂、培训等场景里有几个现实问题网络不一定稳定内容不一定方便上传API 费用和账号配置会增加门槛普通老师或单位用户不想折腾复杂配置有些场景就是希望数据留在本机。旺财翻译的思路是把 ASR、翻译、记录、摘要尽量都放在本机完成。它不一定是最“云端智能”的方案但会更像一个可以放在办公室电脑、教室电脑、移动硬盘里的实用工具。V4 做了哪些优化V4 主要解决的是“真实使用时”的问题。包括长语音识别和断句优化之前长句子容易等太久或者断句不自然。V4 对实时识别、断句、显示做了优化让长时间讲话时更顺。中英混说识别优化很多教学和会议场景不是纯中文也不是纯英文而是中文里夹英文术语。V4 对这类中英混说做了专门处理。双路 ASR 交替单路识别长时间运行时容易出现卡顿、丢句。现在采用双路 ASR 交替工作降低长时间识别中的掉链子概率。翻译模型双实例翻译模型也做了双实例常驻和 fallback。这样单个模型偶尔卡住或异常时另一套可以兜底。安装包补齐依赖之前目标机器上出现过缺依赖的问题比如音频相关依赖缺失。V4 安装包补齐了必要依赖。Lite 版为了让配置低一些的电脑也能试用单独做了 Lite 版。正式版和 Lite 版区别正式版适合内存比较充足的电脑。推荐配置Windows 10 / Windows 11 x6416GB 内存起步SSD 更好不需要 GPU指向麦克风或摄像头麦克风效果更好Lite 版面向配置低一点的机器目标是让 8GB 内存电脑也尽量能跑起来。Lite 版保留核心功能本地离线运行中英文识别中英文混说识别本地翻译ASR 双路机制翻译 fallback记录与摘要导出不过 8GB 内存机器建议关闭浏览器、微信、Office、大型杀毒扫描等后台程序并尽量安装到 SSD。我的判断是8GB能跑但适合轻负载使用12GB比较舒服16GB正式版或 Lite 都更稳。使用建议如果你是第一次测试建议优先使用 SSD 安装第一次启动耐心等待模型加载关闭其它大型软件尽量使用收音清楚的麦克风会议或课堂现场最好先提前试一次。很多识别问题其实不是模型问题而是现场收音问题。笔记本自带麦克风能用但如果距离远、环境嘈杂、回声大识别率会下降。正式上课或会议建议用指向麦克风、摄像头麦克风或者带硬件降噪的麦克风。下载地址以后新版本也会尽量在这个文件夹里更新。目前为 V4 版本包含正式版Lite 版通过网盘分享的文件Wangcai链接https://pan.baidu.com/s/1zN0DbLM8gInK1pwFdcC5eg?pwd2gw6提取码2gw6压缩包密码123安装方式下载压缩包后解压进入安装目录运行install.bat安装脚本会尽量自动检查 Python 环境、安装依赖、创建桌面快捷方式。如果你已经有 Python 3.12 环境安装会更快。第一次启动会加载本地模型机械硬盘可能会慢一些建议耐心等待。GitHub 地址项目地址https://github.com/superalp1985/Wangcai作者王大粘https://github.com/superalp1985/授权说明旺财翻译目前采用source-available, non-commercial项目自己的授权协议为PolyForm Noncommercial License 1.0.0简单说可以用于学习、研究、教学、个人非商业用途不允许未经许可用于商业销售、商业 SaaS、商业集成或再打包售卖第三方模型、运行时和依赖库仍然遵守它们各自的许可证。如果你要二次开发尤其是打包分发请先看仓库里的协议说明文件。最后这个项目一路做下来踩了不少坑Windows 编码问题llama.cpp 中文问号问题ASR 断句问题中英混说识别问题麦克风增益和噪声门机械硬盘加载卡顿模型常驻内存fallback 机制安装包路径和依赖快捷方式黑窗问题现在这个版本不敢说完美但已经从实验玩具变成了一个可以真实拿去会议和课堂现场试用的工具。如果你刚好有类似需求可以下载试试。如果你愿意折腾也欢迎看源码、提 issue、一起改。