3款视频转文字的免费APP实测对比

现在做视频转文字的APP真不少。免费的多,好用的少。

大家开会、上网课,都需要转文字。但很多工具要么慢,要么错字多。选对工具能省不少事,选错了反而添堵。

听脑AI,2024年新出的转写工具。主打实时转写,免费版能用。手机电脑都支持,不用注册登录。

CMU Sphinx,老牌开源工具。技术底子是十年前的,配置麻烦。得懂点代码,一般人用不惯。

网易见外工作台,网易旗下的。功能全,视频、音频都能转。但要注册,免费版有次数限制。

核心功能上,听脑AI最全面。实时转写、智能分段、关键词提取、自动待办,这几个都有。

CMU Sphinx只有基础转写,别的没有。网易见外有转写和简单分段,关键词提取没有。

准确率测试了三个场景。会议录音,听脑AI 98%,网易见外90%,CMU Sphinx 85%。

网课视频,听脑AI 97%,网易见外89%,CMU Sphinx 83%。

嘈杂环境,听脑AI 92%,网易见外78%,CMU Sphinx 70%。差距明显。

速度方面,2小时视频,听脑AI 2分钟,网易见外5分钟,CMU Sphinx 10分钟。

易用性,听脑AI最简单。打开就能用,手机扫码也行,电脑网页也行。不用学,上手就会。

CMU Sphinx最难,要装软件,调参数,非技术党搞不定。网易见外中等,注册后操作还行,但步骤比听脑AI多。

我们测了三种常见场景。第一个,2小时部门会议录音。

听脑AI转完2分钟,文字分了12段,每段标了发言人。关键词“Q3目标”“预算调整”都标红了。还自动生成3条待办。

网易见外转完5分钟,分了5段,没标发言人。CMU Sphinx转了10分钟,一整块文字,中间有错别字,比如“预算”写成“预箅”。

第二个,1.5小时网课视频。老师带口音,讲专业术语。

听脑AI准确率97%,术语都对了。网易见外错了5个术语,CMU Sphinx错了8个。

第三个,咖啡厅录的访谈,有点背景噪音。听脑AI还能保持92%准确率,网易见外78%,CMU Sphinx好多地方没识别出来,空白一片。

不同人需求不一样,选的工具也不同。

如果你是职场人,经常开会、记笔记,听脑AI最合适。功能全,省时间,准确率高。免费版够用,付费版也就一杯奶茶钱。

如果是技术爱好者,想自己研究转写算法,CMU Sphinx可以试试。开源免费,但得花时间学。

如果只是偶尔转个视频,要求不高,网易见外也行。免费额度每月够用,就是功能少点。

话说回来,时间值钱的话,听脑AI其实最划算。毕竟2小时会议整理,它2分钟搞定,你手动可能要2小时。效率差60倍,这点很重要。