- Ubuntu虚拟机ALSA调试 该博客记录了虚拟机下使用ALSA录音调试的过程。
- 多状态回调响应处理方案 该博客记录了如何用c++处理多状态消息的实现方法。
- 朴素贝叶斯 该博客介绍贝叶斯原理,同时介绍算法在实际应用中的使用过程。
- 语音播放 该博文只针对语音播放,对文字转语音不做深入探讨。语音就是一段拥有一定音频格式的音频,对语音进行播放就需要对该音频进行解码,然而对具有不同音频格式的文件进行解码是一件很繁琐的事。因此,如何选取适当的库来协助开发尤为重要,库选好选对了,这将大大提高我们的开发效率。接下来将会介绍一些相关音频库并使用这些音频库来创建语音播放节点。
- MFCC 特征提取 该博客记录了MFCC特征提取的一般算法过程,并将其设计成ROS节点,供应后续特征分析使用。
- 接入语音云平台 现在能够实时对语音端点进行检测并自动将语音信号写入文件,也可以通过音频块的方式接收包含语音信号的音频帧,那么接下来便是如何处理这些音频数据以达到识别的效果。最简单直接的方式就是接入第三方平台,不过这种方式对网络过于依赖。虽然讯飞有提供离线的语音识别,可以需要付费…想要更好的用户体验,那必须掏腰包,毕竟专业支持到位。
- ROS中的语音交互代理 在ROS下对于语音端点检测节点来说,只发布了是否有语音的信号,那么在多节点运作的过程中,系统对于每个节点的调度可以说相对随机,也就是说节点被系统调度运行与节点被启动的时间先后顺序无关,那么如何确保当语音端点检测后发出端点信号时该语音帧不丢失呢?再者又如何接入第三方平台实现语音识别?本文主要来解决这两个问题。
- ROS+VAD方案与算法设计 该博客简单介绍语音信号处理中常见端点检测算法,同时一步步介绍推进编程实现并测试。
- 语音端点检测原理 该博客简单介绍语音端点检测(也称活性检测)的工作原理,包括端点检测的一些常见特征判定算法,同时一步步介绍推进编程实现并测试。
- ROS+Kinect2 音频采集 该博客详细介绍在ROS系统下使如何用ALSA音频库结合 Kinect2.0 的麦克风阵列进行音频信号采集