微软携手ProjectGutenberg,利用AI语音技术制作5000本
,微软近日与“免费数字图书馆计划”Project Gutenberg 合作,利用 AI 为电子书库制作了超过 5000 本免费有声书。
据悉,在这一项目中,研究人员结合了机器学习、自动文本选择和自然语音合成等多项 AI 技术,实现了电子书自动转化为语音的全流程。
IT之家经过查询得知,项目团队首先开发出一种算法,可以自动分析电子书的结构,区分正文和非关键部分的页码、表格等,然后使用 WaveNet、Tacotron 和 FastSpeech 等文本转语音技术,生成类似真人的自然朗读语音。此外,该团队还使系统能够辨别书中叙述者、对话和不同角色,并相应调整语音,实现故事情节的语音表达。
微软表示,此次计划已收集整理了超过 35000 小时的有声书语音数据,涵盖了各类经典文学、戏剧、传记等作品,这些语音数据都将以开源方式免费提供。用户也可以用自己录制的少量语音,生成“用自己的声音朗读整本书”的效果,这一项目相对丰富了网站有声书的内容,同时也为视障人士提供了便利。
参考
-
Thousands of free and open audiobooks powered by Microsoft AI
-
论文 Large Scale Intelligent Microservices
广告声明:文内含有的对外跳转链接,用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。
今日报道
- 8月金融统计数据发布中小企业发展指数连续上升...
- 三星GalaxyWatch4手表国行版现已推送OneUI5Watch...
- 第三方配件厂Spigen下场爆料,苹果iPhone15系列改用Act...
- 消息称索尼PS+二档9月会免包括《尼尔人工生命》《十三机兵防卫圈》等...
- 人民币资产大反攻!后市怎么看?9月策略观点看这里...
- “开学第一课”启航新学期,北京市举办“老兵永远跟党走”进校园报告会...
- 柳州车市火药味十足,哪吒AYA成为五菱缤果最强劲敌...
- 瑜乐文化携每日瑜伽亮相服贸会 探索科技健康新生态...
- 长安启源A079月12日开启预订,提供增程/纯电两种动力版本...
- 高山流水 雅致天下丨携手黄圣依,茅台不老酒·雅黑隆重首发...
精彩热图
24小时新闻排行
最新文章
- 长征六号改火箭首次“一箭三星”发射任务圆满成功,送遥感四十号卫星入轨
- 谁是A股“改名王”
- 华硕灵耀142023轻薄本新配置:i7-1360P+2.8K90Hz屏,
- 一加11手机推送ColorOS13.1系统更新:修复多个系统bug,优化
- H100推理性能最高提升8倍,英伟达发布TensorRT-LLM模型
- ProGrade推出全球首款CFexpress4.0CFE-B卡,速度可
- 影目推出AR眼镜INMOGO:Micro-LED屏幕、7小时续航,179
- 戴尔灵越Plus16笔记本新配置:i7-13620H+RTX4060,9
- iPad热门绘画App推动画版,Procreatedreams将于11月
- OPPOFindN3Flip手机官方保障服务上线:屏碎保一年699元,O