苹果开源4款“小模型”,性能却不如微软Phi-3,性能卷效率不卷?

科技动态 2024-04-26 20:02 阅读:

苹果近日在Hugging Face上发布了4款开源“小模型”OpenELM,参数量分别为270M、450M、1.1B和3B。这些模型在文本相关任务上表现出较高的执行效率,吸引了开发人员的关注。

然而,尽管苹果开源了这些模型,但实际性能却并不尽如人意。与微软Phi-3等主流SLM相比,OpenELM的表现差距明显。在5-shot的MMLU上,Phi-3的性能可达70左右,而OpenELM却只有不到30。

针对这一问题,网友们纷纷猜测可能是由于数据集较小,且只使用了公开数据集。他们认为,苹果可能只是在针对未来训练更大模型进行研究。

开源社区的用户们也对OpenELM进行了测试,整体反馈是模型似乎过于“对齐”,废话可能有点多。从目前的反馈来看,OpenELM似乎并不是一个经过精心设计和训练的模型,性能和表现与同体量最领先的模型相差甚远。

苹果在AI领域的动作频频,收购了多家AI初创公司,发布了多款大模型。然而,这些举措并未完全展现出苹果在AI方面的实力。或许,苹果通过发布OpenELM等模型,表达了其“Open”的决心,希望在未来的开放研究工作中取得更大突破。

https://www.jincai100.com虽然苹果的开源举措令人意外,但其模型的性能和效率仍有待提升。希望在未来的研究中,苹果能够进一步优化模型,提高性能表现,走在AI领域的前沿。