苹果开源4款“小模型”，性能却不如微软Phi-3，性能卷效率不卷？-金财在线

苹果近日在Hugging Face上发布了4款开源“小模型”OpenELM，参数量分别为270M、450M、1.1B和3B。这些模型在文本相关任务上表现出较高的执行效率，吸引了开发人员的关注。

然而，尽管苹果开源了这些模型，但实际性能却并不尽如人意。与微软Phi-3等主流SLM相比，OpenELM的表现差距明显。在5-shot的MMLU上，Phi-3的性能可达70左右，而OpenELM却只有不到30。

针对这一问题，网友们纷纷猜测可能是由于数据集较小，且只使用了公开数据集。他们认为，苹果可能只是在针对未来训练更大模型进行研究。

开源社区的用户们也对OpenELM进行了测试，整体反馈是模型似乎过于“对齐”，废话可能有点多。从目前的反馈来看，OpenELM似乎并不是一个经过精心设计和训练的模型，性能和表现与同体量最领先的模型相差甚远。

苹果在AI领域的动作频频，收购了多家AI初创公司，发布了多款大模型。然而，这些举措并未完全展现出苹果在AI方面的实力。或许，苹果通过发布OpenELM等模型，表达了其“Open”的决心，希望在未来的开放研究工作中取得更大突破。

https://www.jincai100.com虽然苹果的开源举措令人意外，但其模型的性能和效率仍有待提升。希望在未来的研究中，苹果能够进一步优化模型，提高性能表现，走在AI领域的前沿。

苹果开源4款“小模型”，性能却不如微软Phi-3，性能卷效率不卷？