一个开源工具包,可实现语音、声音和歌唱功能
Amphion是一个开源工具包,可实现语音、声音和歌唱功能。除了文字转语音功能,它还能将一首歌的声音换成另一个歌手的声音,并支持声音转换、歌声合成、文本到音频、文本到音乐等功能。
腾讯开源的AI模型GFPGAN,能帮助恢复老照片
讯飞听见依托科大讯飞的语音识别技术,打造智慧办公服务平台,提供语音转文字、录音转文字、视频会议、视频转文字、视频加字幕、同声翻译、语音翻译等服务,可满足多样化的语音转文字需求,致力于提高办公效率。
一个强大的 npm 包,它提供了一个在线浏览器中使用的抠图脚本
输入文本、视频、音频,生成带动作的虚拟角色。
一个非常实用的PDF转HTML工具,可以帮助用户轻松地将PDF文件转换为可在网页浏览器中查看的格式。
个在安卓平台上运行的UiAutomator,它可以用于自动化测试和操作安卓设备