首页

DeepSeek-V3论文

待定。

edwin99

201 0 1年前

多模态大模型通用评测器LLaVa-Critic

随着对现有互联网数据的预训练逐渐成熟，研究的探索空间正由预训练转向后期训练（Post-training），OpenAI o1 的发布正彰显了这一点。而 Post-training 的核心在于评测（Evaluation）。可靠的 AI 评测不仅能在复杂任务的评测中提供可扩展的解决方案，减少人工...

人工智能自然语言处理多模态 AI工具

edwin99

217 0 1年前

【Ai2】Molmo模型Scaling Law

 Molmo 就像钢铁侠的「贾维斯」一样万能。想卖自行车，咨询一下 Molmo 的建议，仅靠一张照片，Molmo 就能把自行车的颜色、品牌和二手售价搞清楚，并且帮你写出一句顺口的广告语。它也可以从虚拟世界帮你解决现实世界的问题，说一句：「Molmo，帮我买杯星巴克的南瓜拿铁。」剩下的就不用...

人工智能自然语言处理多模态 LMM

edwin99

197 0 1年前

【腾讯】MLLM-VITA开源模型性能分析

待定。

人工智能计算机视觉多模态 MLLM

edwin99

197 0 1年前

【清华】TinyLLaVA Factory技术报告分析

待定。

人工智能自然语言处理多模态

edwin99

199 0 1年前

基于Mamba的MLLMCobra实战+性能分析

待定。

人工智能自然语言处理多模态 MLLM

edwin99

196 0 1年前

【Meta】Llama-3-8B 实战+性能分析

待定。

人工智能自然语言处理多模态 LLM

edwin99

211 0 1年前

【Meta】无限长文本大模型MEGALODON-7B实战+性能分析

待定。

人工智能自然语言处理多模态 LLM

edwin99

187 0 1年前

【贾佳亚团队】Mini-Gemini-2B和4B模型实战+性能分析

待定。

人工智能计算机视觉自然语言处理多模态

edwin99

210 0 1年前

DeepSeek-Math论文分析

待定。

人工智能自然语言处理多模态 LLM

edwin99

198 0 1年前

【Mistral AI】Misttral 8X22B大模型开源测试+性能分析

待定。

人工智能自然语言处理多模态 LLM

edwin99

195 0 1年前

【北大】aiXcoder-7B大模型开源测试+性能分析

待定。

人工智能自然语言处理多模态 LLM

edwin99

186 0 1年前

【DeepMind】大语言模型的长篇事实性论文分析

待定。

人工智能多模态 LLM AI工具

edwin99

189 0 1年前

【Databricks】开源通用大模型DBRX测试+性能分析

待定。

人工智能自然语言处理多模态 LLM

edwin99

190 0 1年前

awesome-deepseek-coder论文分析

待定。

人工智能自然语言处理多模态 LLM

edwin99

184 0 1年前

筛选器

排序方式

文章分类

热门标签

筛选结果 27篇

DeepSeek-V3论文

多模态大模型通用评测器LLaVa-Critic

【Ai2】Molmo模型Scaling Law

【腾讯】MLLM-VITA开源模型性能分析

【清华】TinyLLaVA Factory技术报告分析

基于Mamba的MLLMCobra实战+性能分析

【Meta】Llama-3-8B 实战+性能分析

【Meta】无限长文本大模型MEGALODON-7B实战+性能分析

【贾佳亚团队】Mini-Gemini-2B和4B模型实战+性能分析

DeepSeek-Math论文分析

【Mistral AI】Misttral 8X22B大模型开源测试+性能分析

【北大】aiXcoder-7B大模型开源测试+性能分析

【DeepMind】大语言模型的长篇事实性论文分析

【Databricks】开源通用大模型DBRX测试+性能分析

awesome-deepseek-coder论文分析

DeepSeek-V3论文

多模态大模型通用评测器LLaVa-Critic

【Ai2】Molmo模型Scaling Law

【腾讯】MLLM-VITA开源模型性能分析

【清华】TinyLLaVA Factory技术报告分析

基于Mamba的MLLMCobra实战+性能分析

【Meta】Llama-3-8B 实战+性能分析

【Meta】无限长文本大模型MEGALODON-7B实战+性能分析

【贾佳亚团队】Mini-Gemini-2B和4B模型实战+性能分析

DeepSeek-Math论文分析

【Mistral AI】Misttral 8X22B大模型开源测试+性能分析

【北大】aiXcoder-7B大模型开源测试+性能分析

【DeepMind】大语言模型的长篇事实性论文分析

【Databricks】开源通用大模型DBRX测试+性能分析

awesome-deepseek-coder论文分析