万能的大熊:有一只会转文字的录音笔,人生会变得有什么不一样?
2020-06-15名家专栏
我买的第一只录音笔是索尼的,买来的主要用途是录下来自己的一些演讲,然后分享给其他人,偶尔也会录一些别的东西,但我自己从来没有听过。总体来看这个产品的专业度还是挺高的,普通人用手机录音基本就能满足需求,并不太会额外的去买一只录音笔。
我买的第一只录音笔是索尼的,买来的主要用途是录下来自己的一些演讲,然后分享给其他人,偶尔也会录一些别的东西,但我自己从来没有听过。总体来看这个产品的专业度还是挺高的,普通人用手机录音基本就能满足需求,并不太会额外的去买一只录音笔。
而到了职场上这个产品又有些重要,一些重要的会谈录一下还是有个不错的备份价值的,以后真要追究起来也有据可循,当然偷偷录音的事情就不说了。但在事实上,除了少数新闻工作者的采访之外,大部分人还是不会复听录下来的内容的。但新闻工作者们最头痛的恐怕也是整理录音文档,把声音变成文字,要消耗大量的时间。
说这些是想跟大家表明,录音笔这个产品功能很重要,使用频次却很低,中间充满了矛盾,不能不用又谈不上好用。这也是为什么我在这要跟大家分享讯飞录音笔的原因,因为在加上了转文字的功能之后,这个产品就完全不一样了。
你完全不能用传统的录音笔去和讯飞录音笔来比较,因为它们完全就是两种东西,而讯飞正是这个转写录音笔的发明者。而这里要跟大家说的好消息则是,之前的讯飞录音笔价格都是比较昂贵的,因为为了使用的方便,增加了屏幕和智能系统,这样实际上你是可以一边录音一边看到文字的。不过这样可能一些学生或者刚步入工作岗位的用户群体就会有些想买而又负担不起。
而新出的讯飞录音笔A1只要329的上新优惠价格,说真的实在是太良心了,这不仅仅是让你能够负担的起一根录音笔,最重要的是,你进入了一个全新的世界,一个学习工作都更高效的世界。而讯飞作为智能录音笔品类的开创者,也完善了自己从高端到入门的产品布局,覆盖了全部价位的市场。
事实上,录音最大的问题所在就在于它是一个线性内容,我们不愿意去二次听,是因为我们很难找到自己想听的那一部分,而每次都要从头开始听,是非常痛苦的一件事情。
这其实有点类似大家看电影的感觉,现在视频网站都会在时间轨上标注精彩的部分,你着急就可以直接拖过去看,但录音就没有办法了。和视频不同,不管你怎么拖,都要听一会儿才知道是不是这里,而视频基本一眼就可以看出来。而这个时候,如果有一个录音的字幕,上面标注着时间,这个问题就全部解决了。
我之前参加了一个两小时的街道会议,我只要找到其中30秒的讲话,在以往,几乎是不可能的,但当你直接拿到录音文字对照的时候,你就会发现这一下子变得非常容易,关键词搜索到位置,找到时间点,把音轨拖过去,问题就立刻解决了。这可能和很多人想的不一样,很多人觉得自己没有录音转文字的需求,就觉得这个产品对自己没用,这是完全错误的。这个产品在寻找录音关键点的效率提升,简直是一个维度的跨越。
讯飞是行业里做语音转化最好的公司,没有之一,我之前也用过不少公司的产品,比如搜狗,差距都非常明显。一般说来,如果你是对着话筒说话,翻译的困难没有那么大,但是很多时候,我们是在教室里录老师的话,会议室里录领导的话,甚至对着教学视频录老师在线教育的话,那么识别能力的差距就一览无余了。
讯飞端+云的听感和降噪算法,听得更清晰,转写更准确,同时拥有方言及中英混合识别功能,可以适应更为广泛的使用场景,毕竟我们没法要求录音对象都是标准的普通话,也没法要求大家都在安静的房间中录音,所以真正的实用性是体现降噪识别上的。
而讯飞最为强大的地方不仅仅是识别,还有智能算法,即便他获得的信息不够完整,但依旧可以帮你整理出一段通顺的话,也许不是完全准确,但基本调整下就可用。而其他类似产品的问题就是,转录出来的结果完全毫无逻辑可言,根本看不懂说的什么。这种翻车事故不管是公开还是个人用,都屡见不鲜,详情可以见《搜狗智能录音笔“方向错了”》文章。
讯飞录音笔A1可以说是一款返璞归真的产品,去掉了屏幕、操作系统等方面的设计,一方面降低了成本,一方面也增强了待机能力。但录音和转文字的能力没有打折,因为这些全部是在云端的智能服务,32G超大存储空间加550mAh超大电池,可以录1200小时待机25天,从这个参数上讲我还是非常满意的,对于一般人来说,一个是够用,一个是方便,云端直接上传,直接在手机上查看转化结果的文档就可以了。
而同类的搜狗产品不仅更贵200元,功能上也有所阉割,即便不比较转文字的效果,性价比也差很多。这里还需要大家注意的是,转写准确率98%这个数据,虽然大家都一样,但98和98还是不一样的。
主要的差别就在于,字都是那些字,你能不能连成一句通顺的意思表达。很多时候,字都对,但你不知道他在说什么,才是最大的问题所在。这种情况,很多人在听一些人说话的时候,肯定有过类似的感觉,你能听清楚每个字,但是并不知道他在说什么。
在这里我就不讲官方说的一些场景了,比如上课开会录老师或者家长的录音之类,这些场景事实上比较重,而很多轻量化的场景其实使用频次更高,也更刚需。比如电话安排任务的时候,你录下来转成文字,基本可以直接贴到备忘录里,不会遗漏领导或者朋友交代的细节。比如买咖啡谁加糖,谁加奶之类的事情,我们往往容易记不清,录下来还要反复听,如果能转成文字,你就会发现再也不会遗漏任何事情。
这种需要在一大段话中厘清1234点的场景,用这个录音笔简直就是神器,领导安排工作,老师划重点,朋友委托事情,虽然都不是录音的核心场景,但却是声音转文字的核心场景,完美的解决了好记性不如烂笔头的问题。
第二我还是要强调一下特殊场景的识别和转化问题,比如我遇到的采访现在都是电话采访,遇到的会议都是在线会议,很多学生都是在线听课,这种对喇叭发出的声音的录音和转录,和真人声音的录音和转录是完全不同的两个级别。
大家一定要对比和试验一下,不是你说话转换的准确,录电话也会转换准确的,因为手机或者电脑传出的声音会损失很多细节,能够准确识别出这种声音的产品我觉得才是靠谱值得推荐的产品,单纯的录音转换,其实场景不多,差距也不大。
总体来说对讯飞的产品我还是非常满意的,比如这篇文章就是用讯飞的语音鼠标写的,我只要一边说就可以一边出现文字,对于我这种出口成章的人来说省下很多打字的辛苦。语音识别的魅力还是需要大家不断的去发现,而这款上新价329的讯飞录音笔A1显然是一个很好的入门产品。