筛选结果 3篇

【Meta】Spirit LM在语音和文本扩模态生成项目评估
【Meta】Spirit LM在语音和文本扩模态生成项目评估

大型语言模型经常被用于构建文本到语音 pipeline,其中语音通过自动语音识别 (ASR) 进行转录,然后由 LLM 生成文本,最终使用文本到语音 (TT...

edwin99
edwin99
34 0 7个月前
【Kyutai】Moshi模型实战+性能分析
【Kyutai】Moshi模型实战+性能分析

待定。

edwin99
edwin99
22 0 11个月前