HELM HELM(Holistic Evaluation of Language Models)是斯坦福大学推出的开源评估框架,旨在全面、透明地评估基础模型,包括大型语言模型和多模态模型。 880,10030.8K AI模型评测# AI模型评测# AI评测# HELM