讯飞智能录音笔SR702-以智能之名,录音笔能有什么新花样
前言
首先由衷地感谢张大妈的信任,让我时隔三个多月再次获得众测机会。而且这次众测的产品——讯飞智能录音笔SR702,也刷新了我众测产品价值的上限,可以说是十足的意外之喜了。
随着智能手机的性能和功能越来越强大,它已经逐渐成为了我们工作、学习、生活中不可或缺的电子产品。然而面对一些专业领域或者是特殊应用场景,强调全面发展的智能手机未必能够很好地满足我们的需求。专业的事情还是要交给专业的工具来做,录音笔就是一个很好的例子。
专业的智能录音笔会有现场录音、实时转写等功能。借助于智能手机,我们当然也可以完成这些功能。但是专业的智能录音笔所提供的录音硬件配置和录音软件生态,是智能手机无法匹敌的。对比之后,才能深刻体会到智能录音笔在录音这个领域所能带来的效率的极大的提升。
科大讯飞作为中国最大的智能语音技术提供商,在智能语音技术领域有着长期的研究积累。这次测评的讯飞智能录音笔SR702也是科大讯飞最新的旗舰级智能录音笔。那么这款讯飞智能录音笔SR702能否成为你的效率提升神器呢。
硬件
首先来近距离观察以下这款讯飞智能录音笔SR702。看外观的话,讯飞智能录音笔SR702可以说是满满的商务范,黑色喷砂的主机外壳,3D陶瓷面板的后盖,看起来稳重、大气、有档次。造型上,感觉和HIFI播放器颇有几分相似。
顶部的两颗金色纯铜定向麦克风十分注目,机身周围的六个圆孔则是六颗矩阵麦克风。借助于讯飞深度定制的Voice Cube技术,最远拾音距离可达15m。在后面的测试中也能确认到,讯飞智能录音笔SR702的拾音录音功能和同等级的专业录音笔相比是好不逊色的,那我们就来看看这个“智能”的名头,到底是不是名副其实吧。
讯飞智能录音笔SR702使用了一块3.5英寸的屏幕,分辨率为1280 x 720,支持触摸输入。虽然分辨率不高,但是由于屏幕尺寸较小,PPI也达到了445,实际看起来屏幕显示效果还是十分清晰、细腻的。
机身左侧分布着录音键、音量调节键,右侧则是开关机键和SIM卡槽。是的,这款讯飞智能录音笔SR702是支持SIM卡的,可以使用4G数据流量上网。机身底部则是USB-C充电口,两则是扬声器。
再看背面,这款录音笔竟然还有一颗摄像头,旁边是闪光灯。这颗摄像头是800W像素的,正确的使用方式是OCR功能。另外,讯飞智能录音笔SR702的蓝牙WIFI功能也一应俱全,内置32GB存储空间,电池容量为2600mAh,只看硬件配置的话,确实跟手机挺相似的。只可惜我目前并没有查到这款智能录音笔用的是哪款Soc,以及运行内存是多大。另外,上一代SR701是有指纹识别模块的,而SR702取消了这个设计。我感觉指纹识别功能还是挺实用的,可惜了。
再简单看下包装里的其他配件。讯飞智能录音笔SR702配备了一个5V-2A的充电器,一根USB-C充电线。由于机器并没有配置3.5mm耳机插孔,因此附带了一根USB-C转3.5mm耳机插孔线。最后,还有一个SIM卡槽针。下面,就开机体验一下这款设备吧。
软件
讯飞智能录音笔SR702的系统是基于Android深度定制的。而且定制的还相当彻底。整个系统的UI交互也很符合我们平时智能手机App的使用习惯,所以上手起来几乎没什么难度。讯飞智能录音笔SR702的操作系统在原生Android系统的基础上进行了大幅剪裁,围绕着录音笔所提供的几个核心功能,保留了有限个定制应用,而且还关闭了安装第三方应用程序的通道。这样做的目的,一方面是为了保证系统的流畅性,提高设备的续航能力,另一方面可以维持这款高端智能录音笔的专业性。虽然目前并不清楚讯飞智能录音笔SR702采用的是哪款Soc,具备多大的内存,但是经过简单的把玩,整个系统的流畅程度和相应速度都很不错。试想如果开放了第三方应用程序的安装,必然会加重系统负载,影响到用户体验。
开机解锁进入主界面,可以看到整个系统UI主要由四个Tab页面构成。首页里面展示的是最核心最常用的功能。作为一款录音笔,最核心的功能自然是录音了。讯飞智能录音笔SR702一共支持六种 适用于不同场合的录音模式:会议模式、演讲模式、采访模式、通用模式、备忘模式、音乐模式。下面对这六种模式进行简单的介绍。
会议模式适用于多人会议、论坛、研讨会等多人发言的场景。演讲模式适用于会场较大的大型课堂、发布会或大型讲座等人数较多的场景。采访模式适用于一对一或者三人以内的采访场景。通用模式适用于无法准确判断使用场景的大多数场景。备忘模式适用于个人的记录待办事项、语音日记的记事场景音乐模式适用于演奏会、演唱会以及个人演奏录音等场景。不同模式下,麦克风的工作方式会有所不同,目的是为了获得特定场景下最适合的录音效果。这六种模式,基本上可以涵盖所有录音笔的使用场景了。
讯飞智能录音笔SR702的录音功能可不止是将音频保存下来,还可以在线实时地将语音转换为文字。 这样录音结束后做一些后期处理工作的时候,就可以节省大量的时间了。讯飞智能录音笔SR702有一个独到的功能就是支持离线转写,即使没有网络也依然可以进行语音实时转写。离线转写功能的加入,既可以保障信息安全,又能提升工作效率,可谓一举两得。讯飞的离线转写是行业首发,彰显了讯飞在这个领域的强大研发能力。离线转写这个功能,在没有WIFI环境,或者4G信号较弱,或是流量不足的情况下,又或是对信息安全要求比较高的情况下,就显得很有用了。
为了进一步丰富这款智能录音笔的功能,使之成为效率神器,讯飞智能录音笔SR702还配备了一颗800W像素的摄像头。这颗摄像头的拍照效果并不是重点,能用来拍出足够清晰的照片准确地进行OCR识别才是关键。800W像素的单摄用于OCR识别肯定是绰绰有余了。首页的最后两个功能就是和摄像头相关的相机和拍照识别了。相机应用可以正常拍摄照片和录制视频。比较特别的是讯飞智能录音笔SR702的视频功能可以利用语音识别直接生成字幕,而且还支持多地方言、多种外语、民族语。拍照识别就是OCR的功能了,平时工作生活中还是会经常遇到需要OCR的场景,录音笔具备这个功能用起来就方便多了。
系统的第二个Tab页是”我的文件”,在这里你可以浏览和管理使用这款录音笔产生的各种录音文件、文档、照片等。为了节约本地空间并保证数据安全,这些文件都可以上传到云空间中保存。而云空间中保存的文件,可以随时通过手机端的App讯飞语记进行查阅和取回。当然尝试了用数据线将录音笔连接到电脑上,只要点选确认可读取数据即可,内部文件是按照时间分开文件夹的,找到对应日期后即可找到对应音频。
在”我的文件”这一页,可以通过点击右上方的按钮唤起语音助手,一些简单的操作诸如”开始录音”、”播放录音文件”、”打开系统设置”等都可以通过语音快捷操作。同时,长按机身左侧的录音键也可以唤起语音助手。不过目前这个语音助手支持的命令还不是很丰富,智能程度也不算很高,实用性并不是很强。希望随着之后的更新,能够有更多的实用功能。
第三个Tab页的边录边译也是这款智能录音笔的一大特色功能,它可以直接将听到的中文转译成英文,或者将英文转译为中文。结合讯飞的Voice Cube拾音技术,可以完成10米远距离实时中英文互译。对于一些需要采集录音并进行中英文互译工作的人来说,无疑可以大大提高工作效率。
最后一个Tab也是个人中心,在这里可以进行转写设置、系统更新等,也可以直接跳转到系统设置,对蓝牙、WIFI等进行设置。同样的,权益中心也在这个页面,很多实用功能的开关可以在此处设置。讯飞智能录音笔SR702对Android原生设置应用进行了大幅裁减,看起来十分清爽和简洁。通过这个界面可以对所有的相关设置进行点选确认,建议根据自身的需求调试相关功能的开闭。
前面也提到过了,智能录音笔可以实现的大部分功能,借助智能手机的第三方App也可以完成。但是这些第三方App的相应功能基本都是要收费的,而且App的用户体验也不一定有专业的智能录音笔好。讯飞作为语音识别业内的翘楚,能够让你获得更好的录音硬件设备的同时,也可以免费获得多种语言转写、边录边译、专业领域转写、讲话人区分、智能语义分段、智能摘要等多种增值的软件服务。
而且讯飞智能录音笔SR702运行在经过定制优化的Android系统下,软件的用户体验更加出色,对工作效率的提升更加明显,这是普通智能手机所无法企及的。那么,下面就来感受下讯飞智能录音笔SR702在录音、转写、识别、翻译等功能上的实际效果吧。
体验
对于录音转写,这里首先选择了通用模式进行了录音转写,可以看到讯飞的语音识别针对古文/诗词一类内容有相应的识别优化。当然最近感冒说话带一些鼻音,其中个别词汇的识别的准确率还是有待提高。而且讯飞的断句识别应该是基于语气和停顿综合判断的,这个设置对完全于口语化的录音绝对是神来之笔。几种模式之间的不同应该是体现在对发声人数,环境噪音等因素进行了专门的优化,如果是个人使用记录而非专业性使用,基本体现不出这些专门优化产生的差异。
实时生成字幕的素材来自笔者阅读《滕王阁序》,与录音转写相似,这里的字幕也是实时生成。不过最让我惊艳的一点是,字幕的时间轴对应一点不差,如果是后期配字幕直接用这个拍摄生成字幕就好了。当然智能处理还是有些问题,“王将军之武库”直接识别成了“王将军之武库舰”,看来大唐真是天朝上国啊。不过随着采集样本数量增加的加成,实时字幕的后期表现肯定会更好。如果是日常视频拍摄使用的话,可以通过这个工具生成对应字幕,然后再将对应的文件取出导入即可。是的,对应的文件是拆分好的,每个视频/录音的对应文件是放到同一个文件夹中的,所以具体使用方法还是看你自己怎么开发。
图片来源是iPad备忘录的打开《春江花月夜》,讯飞SR702使用相机直接拍摄后进行OCR识别。可以看到对于打印/显示版的印刷体材料,这只录音笔能做到100%的准确率,甚至标点符号的识别都对于日常中遇到的打印版宣发材料自然是毫无压力了。当然日常的OCR文字识别也都是应用在没有电子版的印刷品上,不过由于录音笔的屏幕尺寸问题,还是建议把精细核对的工作放在电脑上面进行。
边录边译可以说是十足的实用功能了,基于讯飞本身语音识别与翻译的支持,基本上对应的英文内容是与本身的汉语转写基本同步的,翻译的质量还是很不错,直接作为粗版文稿也是没问题的。这里选择的是朱自清的《荷塘月色》,除了个别词汇识别不准导致存在部分翻译问题之外,没有什么其他问题。不过语音转译不能直接修改对应词汇,也暂时还 不能在对应位置标记,后期还是需要去单独核对内容。
一个更贴近的场景就是日常的课程记录了,当然由于笔者很早之前就毕业了,所以这里选择了北京师范大学的《普通心理学》这门公开课来进行测试。开场部分是陈宝国教授的开场白,基本不带口音的普通话识别速度很快,对于日常的需要记叙大量内容的课程很合适。当然SR702也是可以识别方言的,不过实际口音比较重的课程录像不是很好找,尝试了西南官话中的重庆话发现识别率还可以,希望之后能加入更智能更广泛的识别吧。
当然大家可能更关心续航,不过在我有限的使用过程中,基本感觉不到录音笔的掉电。所以即便是全天都在录音,2600mAh的电池容量也能轻松应对。日常使用还可以将自动转写关闭,只保留相应的录音功能即可。
总结
SR702依托安卓系统,把多人识别等各种需要计算与AI处理的功能发挥了出来,当然实际使用中是本地处理和远程联网共同作用的,所以即便是没有网络的情况下这些功能也是可以正常使用的。这种设计也体现了终端产品功能化的发展方向,相比以前的录音笔只管拾音,所有内容都需要迁移到PC端进行后续处理,现如今的实时“出货”真的是更省时省力了。下一步还是希望讯飞官方对于文件信息同步添加更多的关节,比如引入WebDav支持,可以更方便的同步到个人或企业的私有云上,方便使用者能够再多“偷懒”。
fengye77521
校验提示文案
fengye77521
校验提示文案