午夜咖啡午夜咖啡

jolestar 的文章与笔记。

Post

语音笔记需要保留原始音频

2018-06-15 10:00:29Post

语音笔记真正难的往往不是“能不能转写”,而是后续如何低成本回听、校正和整理;如果一开始就只保留文字,很多使用场景其实很难成立。

朋友在评论里提到过几个语音笔记类 App,我顺手试了下,也顺带把我自己的判断想清楚了一点。

像讯飞语记这类方案,更接近“语音转文字”。它的核心是尽快把内容转成文本,但并不保留原始音频。这样做的问题是:一旦识别有误,后面修正的成本就会比较高,因为你已经失去了回到原始输入重新核对的能力。

这也是为什么我一直觉得,语音笔记类产品如果真想进入“可长期整理”的场景,光有转写不够,最好还要保留原始音频。否则它更像一个一次性输入工具,而不是一个真正可靠的记录工具。

另外像锤子当时的闪念胶囊,我那时手头没有设备,没有实际试用。DayOne 那边我倒是反馈过,他们的高级版本计划支持类似能力。

但如果再往前走一步,想让系统级语音助手直接接入这种工作流,难度就会高很多。因为这不只是识别问题,而是平台是否愿意开放足够的应用接口。当时 Siri 基本还没有提供这类能力,所以这条路短期内很难成立。