筛选器
全部文章 251篇

【Monica】Manus智能体初体验
4月8日我拿到了Manus的邀请码,我是从Manus开放注册以来的五个小时内申请的,已苦等了一个多月。 目前Manus貌似只开放了国际版,国内版的话应...

对最近新提出氛围编程概念的理解和分析
项目地址:https://huggingface.co/spaces/enzostvs/deepsite 氛围编程的定义:vibe coding,这个概念...

【阿里】Qwen2.5-Omni-7B在听说读写上的表现
项目地址:https://chat.qwen.ai/ 这是 Qwen 系列中全新的旗舰级多模态大模型,专为全面的多模式感知设计,可以无缝处理包括文本、...

【阿里】开源Qwen2.5-VL在视觉推理中的表现(32B)
模型:Qwen2.5-VL-32B-Instruct 模型体验地址:https://chat.qwen.ai/ 相比此前的 Qwen2.5-VL 系...

【CHM】AlexNet源代码
谷歌首席科学家 Jeff Dean 宣布,他们与计算机历史博物馆(CHM)合作,共同发布了 AlexNet 的源代码,并将长期保存这些代...

实战:Lluminate算法提升LLM创新能力
如果你让当今的 LLM 给你生成一个创意时钟设计,使用提示词「a creative time display」,它可能会给出这样的结果: ...

【清华】赤兔推理引擎开源代码
清华系科创企业清程极智与清华大学翟季冬教授团队联合宣布开源大模型推理引擎「赤兔」(Chitu),率先实现了非 H 卡设备(英伟达 Hopper 架构之前的 GP...

【潞辰】Open-Sora 2.0开源权重、推理代码及训练过程
Open-Sora 2.0—— 全新开源的 SOTA(State-of-the-Art)视频生成模型正式发布,仅用 20 万美元(224...

【阶跃星辰】开源LLM最优超参工具
阶跃星辰研究团队通过大规模实证探索,耗费了近 100 万 NVIDIA H800 GPU 小时(约百万美元),从头训练了 3,700 个不同规模,共计训了 ...

【阿里】推理模型QwQ-32B
阿里开源发布了新推理模型 QwQ-32B,其参数量为 320 亿,但性能足以比肩 6710 亿参数的 DeepSeek-R1 满血版。千问的推文表示:「这次,我...

DeepSeek开源周第五弹:3FS, Thruster for All Dee...
DeepSeek团队开源了一个名为 3FS(Fire-Flyer File System)的系统。这是一种并行文件系统,它利用现代固态硬盘(SSD)和远程直接内...