FlagEval FlagEval(天秤)是由智源研究院联合多所高校团队打造的开放评测平台,采用“能力-任务-指标”三维评测框架,提供全面、细致的大模型评测结果。 880,05530.8K AI模型评测# AI模型评测# AI评测平台# FlagEval
OpenCompass OpenCompass是由上海人工智能实验室推出的开源大模型评测体系,提供全面、高效的评测框架,支持大语言模型和多模态模型的一站式评测,并定期公布评测结果榜单。 880,13030.8K AI模型评测# AI模型评测# AI评测# OpenCompass