TTS语音模块:XFS5152CE语音合成模块详解
csdh11 2025-01-20 11:54 28 浏览
TTS是Text To Speech的缩写,即"从文本到语音",是人机对话的一部分,让机器能够说话。
语音播报功能的实现方式
- TTS语音模块,比如XFS5152、SYN6288等
- ISD4000系列语音录放芯片分段输出
- 可以按键、UART控制的mp3解码芯片模块
- OTP(One Time Programable)语音芯片[可定制]
其中TTS语音模块使用起来最方便灵活,OTP语音芯片最简单。
本文将介绍一下科大讯飞的XFS5152CE语音合成模块。
XFS5152CE语音合成模块
XFS5152CE是一款高集成度的语音合成芯片,可实现中文、英文语音合成;并集成了语音编码、解码功能,可支持用户进行录音和播放;除此之外,还创新性地集成了轻量级的语音识别功能,支持30个命令词的识别。
内置的30个语音识别命令词
手册说如果需要定制命令词需要跟厂家联系,我体验了一下,识别的准确率不是很高。
如果需要语音识别功能,可以使用LD3320模块,参考网文:
如果需要录音模块,建议使用ISD系列录音芯片,参考网文:
为了使用方便,我们可以直接购买现成的XFS5152CE语音合成模块。
通讯接口
XFS5152CE 芯片支持 UART 接口、I2C 接口、SPI 接口三种通讯方式,可通过 UART 接口、 I2C 或 SPI 接口接收上位机发送的命令和数据,允许发送数据的最大长度为 4K字节。
用户在使用语音编解码功能时(通讯接口必须选择 UART 接口,并且波特率设置为 115200bps),上位机发送启动编解码的命令给语音芯片,芯片内部的语音编解码模块把采集到的音频数据进行编码并通过UART接口实时传送给上位机,或者对上位机传送来的音频数据进行解码并实时播放出来。
接线方式
· PC上使用官方演示程序《科大讯飞语音合成芯片PC端演示程序》,使用串口通信进行测试的接线方式如下:
· 如果使用单片机与XFS5152CE语音合成模块联用,模块的8脚和10脚与STM32的串口交叉连接(我使用的是串口2),7脚用于判断语音模块当前的状态,原理图如下所示:
注意:
- 关于功放引脚4脚和6脚:可以根据喇叭的功率来选择相应功率的功放,比如5W以内喇叭可以选择单声道功放XPT8871、LTK5128,15W的喇叭可以选择TDA7297等双声道功放;
- 关于语音识别:只有使用语音识别功能的时候才需要接咪头(如:9767型咪头),且只能识别芯片指定的30条命令词;
- 通过模块板子上的拨码开关选择波特率,如拨到"√XX√"表示9600,模块的通讯比特率要跟上位机或者与之相连的单片机的比特率一致;
- 3.3V供电。
语音播报功能的代码实现
1. 串口初始化
参考网文:
uart2_init(115200);
通过拨码开关设置波特率为:115200
2. 工作状态指示输出引脚初始化
/BSY引脚用于指示当前的工作状态,低电平代表Ready状态,高电平代表Busy状态。用单片机的一个GPIO与之相连,可以读取该IO的输入状态,即可获取当前模块处于的工作状态。
#define U5152_BSY GPIO_ReadInputDataBit(GPIOA,GPIO_Pin_0)
void U5152_Init(void)
{
GPIO_InitTypeDef GPIO_InitStructure;
RCC_APB2PeriphClockCmd(RCC_APB2Periph_GPIOA,ENABLE);
//U5152_BSY
GPIO_InitStructure.GPIO_Pin = GPIO_Pin_0; //PA0
GPIO_InitStructure.GPIO_Mode = GPIO_Mode_IPU; //设置成上拉输入
GPIO_Init(GPIOA, &GPIO_InitStructure); //初始化GPIOA0
}
3. 封装播报语音函数
控制标识需要按照语音合成命令的格式发送,控制标记作为文本进行合成,即合成命令是"帧头 + 数据区长度 + 合成命令字 + 文本编码格式 + 控制标记文本"的格式。
语音合成命令帧示例:
/***********************************************************
* 名 称: YS-XFS5051 文本合成函数
* 功 能: 发送合成文本到XFS5051芯片进行合成播放
* 入口参数: *HZdata:文本指针变量
* 出口参数:
* 说 明: 本函数只用于文本合成,具备背景音乐选择。默认波特率9600bps。
* 调用方法:例: SYN_FrameInfo("欢迎关注微信公众号:程序员小哈");
**********************************************************/
void XFS_FrameInfo(char *HZdata)
{
/****************需要发送的文本**********************************/
unsigned char Frame_Info[50]; //定义的文本长度 xdata
unsigned int HZ_Length;
HZ_Length =strlen(HZdata); //需要发送文本的长度
/*****************帧固定配置信息**************************************/
Frame_Info[0] = 0xFD ; //构造帧头FD
Frame_Info[1] = 0x00 ; //构造数据区长度的高字节
Frame_Info[2] = HZ_Length+2; //构造数据区长度的低字节
Frame_Info[3] = 0x01 ; //构造命令字:合成播放命令
Frame_Info[4] = 0x01; //文本编码格式:GBK
/*******************发送帧信息***************************************/
memcpy(&Frame_Info[5], HZdata, HZ_Length);
USART2_OUT(Frame_Info,5+HZ_Length); //发送帧配置
}
4. 播报当前时间语音
while(U5152_BSY){}
sprintf((char*)dtbuf,"[v5][s5][m55]当前时间为%02d时%02d分%02d秒",NowHour,NowMinute,NowSecond);
XFS_FrameInfo((char*)dtbuf) ;
delay_ms(10);
while(U5152_BSY){}
5. 文本控制标记
XFS5152CE 芯片的语音合成功能支持多种文本控制标记,可以满足用户对语音合成发音人、音量、语速、语调等的设置。 文本控制标记的格式一般是半角中括号(即"[]")内一个小写字母、一个阿拉伯数字,如: [m3]为使用女声的发音人小燕。
文本控制标记举例sprintf((char*)dtbuf,"[v5][s5][m3]当前时间为%02d时%02d分%02d秒 \r\n",NowHour,NowMinute,NowSecond);
[v5]:代表音量值,有效范围为:0~10;
[s5]:为语速值,取值范围为:0~10;
[m3]:选择发音人为小燕(女声)
总结
- 模块优点,文字转语音很方便,很灵活
- 价格较贵,所以我们很多情况不需要功能这么强大的TTS语音模块,有些场景,我们甚至没有必要购买TTS语音模块,比如语音开发中常见的费用催缴,拨通后播放:"尊敬的客户,您本月的费用是:212元",前面部分对所有客户都一样,录一个语音文件就是了,而数字的合成是很简单的,你只要录制好10个数字语音,再加上十,百,千,万,再加上金钱的单位"元"即可。
资料获取
微信公众号后台回复"XFS5152CE语音合成模块",可以下载模块相关资料。
推荐阅读:
喜欢请关注微信公众号:程序员小哈
公众号内容面向在校大学生、电子爱好者、嵌入式工程师;
涉及电子制作、模块使用、单片机技术、物联网相关知识分享;
玩模块,学硬件,带你从0走到1
若觉得本次分享的文章对您有帮助,随手收藏并转发分享,也是对我的支持。
相关推荐
- 知名软件变“木马”:2小时感染10万电脑
-
近日,腾讯电脑管家监测发现,一款通过“驱动人生”升级通道,并同时利用“永恒之蓝”高危漏洞传播的木马突然爆发,仅2个小时受攻击用户就高达10万。腾讯电脑管家可精准拦截该病毒攻击,管家团队也将持续跟踪该款...
- 腾讯电脑管家发布病毒预警:“驱动人生木马”爆发,2小时感染10万台电脑
-
新华网天津12月15日电(记者周润健)腾讯电脑管家15日紧急发布病毒预警,14日下午,腾讯电脑管家监测发现,一款通过“驱动人生”升级通道,并同时利用“永恒之蓝”高危漏洞传播的木马突然爆发,仅2个小时受...
- 全新“撒旦”勒索病毒来袭 瑞星推出独家解密工具
-
新华社北京7月26日电瑞星威胁情报平台近日发现多起国内用户感染“撒旦”勒索病毒事件。据瑞星安全研究人员介绍,该病毒运行后会加密受害者计算机文件,加密完成后会用中英韩三国语言索取1个比特币作为赎金,并...
- 新勒索病毒“WannaCry”疯狂来袭 乌克兰副总理电脑中招
-
据外媒报道,从6月27日开始,一种新勒索病毒再次疯狂来袭,已席卷欧洲多个国家,连乌克兰副总理的电脑都已中招。报道称,这轮病毒足以与五月席卷全球的勒索病毒“WannaCry”的攻击性相提并论。该病毒代号...
- 蠕虫病毒利用“永恒之蓝”漏洞传播 单位局域网受威胁最大
-
日前,火绒安全团队通过“火绒威胁情报系统”发现蠕虫病毒“Worm/Sharp”正在全网传播,其中在政府、企业、学校、医院等单位的局域网具有非常强的传播能力。该病毒通过“永恒之蓝”漏洞、多个电脑常用端口...
- 新病毒爆发:利用“永恒之蓝”传播,2小时感染10万台电脑挖矿
-
驱动人生发布的声明。据腾讯安全专家介绍,通过追溯病毒传播链发现,该病毒自12月14日约14点,利用“驱动人生”、“人生日历”等软件最早开始传播,另有约30%的传播通过“永恒之蓝”漏洞在局域网内进行主动...
- 逍遥安卓模拟器定制手游电脑版 手机电脑账号完全互通
-
从今年起大量回合制端游转向手游方向,无论是《梦幻西游》、《大话西游》、《神武》还是刚刚发行的《问道》手游,都是非常重度需要大量时间来做任务挂机升级的游戏。很多人习惯了端游的时候一个电脑可以多开的玩法,...
- 安卓模拟器绿色U盘移动版 公司玩游戏无痕迹
-
安卓模拟器已经不稀奇了!随着安卓手游的盛行,特别是《梦幻西游手游》之类的重度手游发布,玩手游花的时间也越来越多。用手机玩这些游戏存在着屏幕小、点量少、费流量还有容易被电话打断,在电脑上用安卓模拟器玩游...
- 苹果推出 iCloud 照片和视频转移服务:可转移至谷歌相册
-
IT之家3月4日消息据MacRumors今日报道,苹果公司本周推出了一项新服务,帮助iCloud用户方便快捷的将其存储的照片和视频转移到谷歌照片上。苹果在其支持文档中表示,用户可以登...
- NAS PK台,4核带m.2的威联通TS-264C vs 双核TS-462C
-
因为618年中大促看到威联通TS-264C和TS-462C这两机型售价差不多,就做个比较以供参考。毕竟作为自2007年以来就一直卖威联通的NAS老油来说,对威联通各NAS机型的识别还是相当全面的,对不...
- 前端学AI(七):构造 RAG 系统评估测试数据集
-
引言在基于DeepSeek+Chroma+LangChain开发一个简单RAG系统...
- 惨重教训!调查显示挪威“英斯塔”号宙斯盾舰撞油轮后本不必“丧命”
-
最新公布的调查报告显示,挪威皇家海军“英斯塔”号护卫舰2018年11月与油轮相撞后,如果其舰员接受了更好的损管训练,并且对舰艇的稳定特性更加熟悉的话,这艘宙斯盾型战舰本来是可以挽救的。↑挪威“英斯塔”...
- 「必买」盘点2021年男人们的败家清单,越“败”越香
-
心里总想买点啥?看看《必买》,全网最有料的场景种草指南。草原割不尽,春风吹又生。在过去的2021年,不断被各种数码产品种草,一直在买买买,剁手不停。大部分产品都经过详细的对比做足了功课,也有部分是一时...
- 实现浏览器播放rtsp视频流的解决方案
-
有同学问道:需要实时播放摄像头rtsp视频流,而浏览器不能直接播放,怎样解决?实现这个需求可以通过插件或者转码来实现。要实现这个目的,可以采用的方案非常得多,有商业的也有开源的,这里主要列举一些开源的...
- ISO9000你知道多少?
-
1ISO9000族标准是什么?ISO9000族标准是指由国际标准化质量管理和质量保证技术委员会(ISO/TC176)制订的所有国际标准。ISO9000族标准可帮助各种类型和规模的组织实施并有效运行质...
- 一周热门
- 最近发表
- 标签列表
-
- mydisktest_v298 (34)
- document.appendchild (35)
- 头像打包下载 (61)
- acmecadconverter_8.52绿色版 (39)
- word文档批量处理大师破解版 (36)
- server2016安装密钥 (33)
- mysql 昨天的日期 (37)
- parsevideo (33)
- 个人网站源码 (37)
- centos7.4下载 (33)
- mysql 查询今天的数据 (34)
- intouch2014r2sp1永久授权 (36)
- 先锋影音源资2019 (35)
- jdk1.8.0_191下载 (33)
- axure9注册码 (33)
- pts/1 (33)
- spire.pdf 破解版 (35)
- shiro jwt (35)
- sklearn中文手册pdf (35)
- itextsharp使用手册 (33)
- 凯立德2012夏季版懒人包 (34)
- 冒险岛代码查询器 (34)
- 128*128png图片 (34)
- jdk1.8.0_131下载 (34)
- dos 删除目录下所有子目录及文件 (36)