筛选结果 2篇

【Meta】SAM 2.1

SAM 2 已经被应用于跨学科(包括医学图像、气象学等)研究,并且产生了良好的影响。现在,Meta 宣布推出性能更强的 SAM 2.1。 Meta 引...

edwin99
edwin99
29 0 7个月前
【Meta】Spirit LM在语音和文本扩模态生成项目评估
【Meta】Spirit LM在语音和文本扩模态生成项目评估

大型语言模型经常被用于构建文本到语音 pipeline,其中语音通过自动语音识别 (ASR) 进行转录,然后由 LLM 生成文本,最终使用文本到语音 (TT...

edwin99
edwin99
34 0 7个月前