筛选器
筛选结果 46篇

【阿里】开源Qwen2.5-VL在视觉推理中的表现(32B)
模型:Qwen2.5-VL-32B-Instruct 模型体验地址:https://chat.qwen.ai/ 相比此前的 Qwen2.5-VL 系...

【潞辰】Open-Sora 2.0开源权重、推理代码及训练过程
Open-Sora 2.0—— 全新开源的 SOTA(State-of-the-Art)视频生成模型正式发布,仅用 20 万美元(224...

【阿里】万相WAN2.1-1.4B大模型MacBook实测
当很多 AI 公司还就是否该走开源路线而感到左右为难时,阿里的技术团队又开源了一个新的模型 —— 万相(Wan)视频生成大模型(包括全部...

BiGR方法图像生成器开源分析
齐宪标等人发现,其实在应用于图像领域时,传统的自回归方法也有改进空间。他们把改进后的方法称为「BiGR 」,该方法建立在何恺明等人 MAR(masked aut...


【FaceChain】拓扑对齐人脸表征模型ToFR
本篇论文已被NeurIPS 2024接收,论文第一作者但俊来自浙江大学&FaceChain社区,共一作者刘洋来自伦敦国王学院&FaceChain...

Gradio开源项目自动构建Web应用程序
快速入门:https://www.gradio.app/guides/quickstart 项目地址:https://github.com/huggi...

【360AI】FancyVideo模型性能分析
论文作者之一 Ao Ma,硕士毕业于中科院计算所,曾在 MSRA 视觉计算组和阿里通义实验室进行学术研究和算法落地工作。目前是奇虎 360-AIGC 团队-视频...

OpenDiT开源模型VideoSys性能分析
自今年起,OpenAI 的 Sora 和其他基于 DiT 的视频生成模型在 AI 领域掀起了又一波浪潮。但由于起步较晚,视频生成领域的很多基础设施都还有待完善。...


