13K大小的语音转文字神器,无需巨大模型文件,牛逼!


13K大小的语音转文字神器,无需巨大模型文件,牛逼!

大家好,我是了不起,一个热爱开源的程序员!

大家日常会是否会有语音转文字的需求?

今天了不起给大家介绍一款非常小巧但非常好用的语音转文字开源项目 - Transcribe

项目简介

Transcribe 是一个基于 OpenAl训练并开源的神经网络,支持英语、中文等几十种语言,最大的优点就是不需要下载大型的模型文件

使用非常简单,提前要先准备OpenAI API key,然后选择音频语言,选择音频就可以了。

目前支持文本、.srt、.vtt 三种格式。

效果演示

先看看效果,我自己先录制了一段14s的MP3音频,如下:

MP3

识别的可以还不错吧~~

接下来我试了一段3分钟的VOA英文MP3

效果如下:

左边为工具生成的英文,右边为VOA下载的字幕,准确率还是蛮高的。

除了转成文本外,这个工具还支持将MP3转成SRT、VTT格式。

项目安装使用

作者提供了一个Demo的页面,直接就可以在线访问使用:

1
Demo界面:https://transcribe.bloat.app/

因为会涉及到使用Open API Key,可能有些朋友会担心泄露的问题。
那没关系,你可以直接将项目下载到本地

下载源码后解压,只有三个文件:index.html、index.js、style.css,一共不到20K大小。

双击下图的index.html文件就可以正常使用了。

体验下来,感觉还是非常香的,如果你有语音转文字的需求,不妨来试试这个工具吧~~

关于这个项目的更多细节内容,感兴趣的小伙伴可以去项目地址探索~

1
Github地址:https://github.com/felixbade/transcribe

写在最后

欢迎加入开源小分队读者交流群,聊天学习摸鱼为主,不定时会分享一些技术要点和优质学习资源,有一群有趣有料的小伙伴在等你哦!

进群方式:开源小分队 公众号后台回复888,按提示操作即可进群。

问君能有几多愁,开源项目解千愁,我们下期再见!

大家的点赞、收藏和评论非常重要,如文章对你有帮助还请转发支持下,谢谢!


  目录