筛选结果 27篇

DeepSeek-V3论文

待定。

edwin99
edwin99
23 0 3个月前
多模态大模型通用评测器LLaVa-Critic
多模态大模型通用评测器LLaVa-Critic

随着对现有互联网数据的预训练逐渐成熟,研究的探索空间正由预训练转向后期训练(Post-training),OpenAI o1 的发布正彰显了这一点。而 ...

edwin99
edwin99
37 0 7个月前
【Ai2】Molmo模型Scaling Law
【Ai2】Molmo模型Scaling Law

 Molmo 就像钢铁侠的「贾维斯」一样万能。想卖自行车,咨询一下 Molmo 的建议,仅靠一张照片,Molmo 就能把自行车的颜色、品牌和二手售价搞...

edwin99
edwin99
29 0 8个月前
【腾讯】MLLM-VITA开源模型性能分析
【腾讯】MLLM-VITA开源模型性能分析

待定。

edwin99
edwin99
24 0 9个月前
基于Mamba的MLLMCobra实战+性能分析
基于Mamba的MLLMCobra实战+性能分析

待定。

edwin99
edwin99
22 0 1年前
【Meta】Llama-3-8B 实战+性能分析
【Meta】Llama-3-8B 实战+性能分析

待定。

edwin99
edwin99
25 0 1年前
DeepSeek-Math论文分析
DeepSeek-Math论文分析

待定。

edwin99
edwin99
25 0 1年前
awesome-deepseek-coder论文分析

待定。

edwin99
edwin99
21 0 1年前