大家好,我是热爱开源的了不起
在会议记录、采访笔记、课堂录音或者随意聊天中,你是否也为后来再看一遍录音内容而烦恼?总觉得效率低下、查找信息不方便?今天我要推荐一个能帮你轻松解决这些问题的开源利器——Speakr。
项目简介:Speakr 是什么?
Speakr 是一个面向个人、自托管使用的 Web 应用,它能将音频录制自动转录并识别说话者,还能为你生成简明摘要,甚至提供一个 AI 聊天界面,让你能像“聊天”一样和录音内容互动。它非常适合需要整理会议纪要、心理咨询会话笔记、课堂讲座内容的场景。
最新版本 v0.5.1 还新增了“询问模式”(Inquire Mode),支持在所有录音中 AI 智能搜索,例如你可以问:“关于市场预算的决定是什么?”系统就会给你上下文相关的答案。同时也提升了标签系统、文档导出、界面优化等功能,让使用更灵活方便。
项目安装
不管你是在本地机器、家庭服务器,还是自己搭建的私有环境里,Speakr 都能跑起来。它基于 Flask 框架,由 Whisper(OpenAI 的语音识别模型)驱动转写功能。
如果你喜欢轻松部署方式,可以用 Docker 或 Docker Compose,在几分钟内搞定部署。官方 README 通常会提供详细步骤,你只需运行:
1 | git clone https://github.com/murtaza-nasir/speakr.git |
然后浏览器访问对应端口,即可进入本地 Web 界面。
不使用容器也行,只要你配置好 Python 环境、依赖库、Whisper 模型即可运行,适合喜欢手动控制的你。
项目使用
安装完成后,你可以在 Web 界面直接上传 MP3、WAV、M4A 等音频文件,系统就会自动转录并识别不同说话人,所有文字记录可以搜索、标注、整理。
内置 AI 聊天功能让你像在“聊天”一样提问,比如:
1 | 用户:这段讨论的总结是什么? |
如果用询问模式,你还可以问:“会议中谁提到了预算调整?”,“总结一下今天的决策内容。”然后 AI 为你找答案,超级省时。
它还有标签系统,比如你可以给每个录音打“会议”“课堂”“采访”标签,分别指定不同摘要提示和转录设置,让管理变得井然有序。
总结
Speakr 的亮点非常鲜明:它在本地运行,保障隐私不外泄;自动转录、说话人识别、AI 智能摘要、聊天交互、标签管理,这些功能组合在一起,让录音整理像和助理聊天一样自然顺畅。更重要的是,它完全开源且免费使用,这意味着你可以自由定制、随心扩展。
感兴趣的朋友,赶快去试试吧。
1 | 项目地址:https://github.com/murtaza-nasir/speakr |