多模态大模型 + 数字人实现半自动演示文稿 PPT讲解搭建赛博老师傅助力程序员赛博飞升！！！

企业开发 2024-11-06 23:47:23 阅读次数: 0

文档处理 – LLM 的选择

自从大语言模型实际投入生产，所有的底层交互都转变为了，自然语言处理的交互。

https://zhiwen.xfyun.cn/?ch=xhguanwang

https://github.com/slidevjs/slidev

开源实现 – 语音引擎

连贯的语音生成引擎

https://modelscope.cn/studios/AI-ModelScope/ChatTTS-demo

如何复刻自己的声线

之前还有不开源的：
MegaTTS 2: Zero-Shot Text-to-Speech with Arbitrary Length Speech Prompts

https://mega-tts.github.io/mega2_demo/

那么我们来看看最新开源的到了什么阶段。

https://funaudiollm.github.io/

CosyVoice

https://github.com/FunAudioLLM/CosyVoice

开源实现 – 数字人

百度

对口型
百度

猜你喜欢

转载自blog.csdn.net/wangyaninglm/article/details/141615048

今日推荐

周排行

一维数组的常见查找法

新建文件夹接口

问题 1161: 【回文数(二)】

关于一些初级ACM竞赛题目的分析和题解（九）

转载：什么是分布式系统中的幂等性

【Selenium】

实用的滚动

使用google object_detection API检测重力波

1031 - Easy Game 简单区间DP

UNIX-LINUX编程实践教程笔记：5 学习stty

每日归档

更多

2025-03-15(0)

2025-03-14(0)

2025-03-13(0)

2025-03-12(0)

2025-03-11(0)

2025-03-10(0)

2025-03-09(0)

2025-03-08(0)

2025-03-07(0)

2025-03-06(0)