识别视频中的人物的面部和身体动作,为后续的SD绘图提供支持
DWPose:用于检测视频中人物的动作
该系统基于MMPose和ControlNet,能够识别视频中的人物的面部和身体动作,为后续的SD绘图提供支持。
快捷微调LLM
能生成与原图风格融为一体的文字,或者对原图中的文字进行修改,并且还能支持中文!
声音克隆和对话交互。它允许用户与喜欢的角色进行沉浸式对话,通过使用ChatGLM2模型和SadTalker模型来生成对话内容,并结合声音克隆技术实现角色的真实声音
WPS AI是由金山办公发布的具备大语言模型能力的人工智能应用,为用户提供智能文档写作、阅读理解和问答、智能人机交互的能力。作为WPS办公套件的重要组成部分,WPS AI将与WPS其他产品无缝衔接,让用户在办公、写作、文档处理等方面实现更高效、更智能的体验。
一个使用OpenAI的Whisper Large v2进行语音识别的脚本,能够在短短10分钟内转录300分钟的音频。
一个具有高度定制化和隐私控制的聊天型人工智能,适用于各种规模的企业