大模型评测

Total 2 articles 网址

Sorting

FlagEval

FlagEval（天秤）是由智源研究院联合多所高校团队打造的开放评测平台，采用“能力-任务-指标”三维评测框架，提供全面、细致的大模型评测结果。

889,13530.8K

Model Evaluation # AI模型评测 # AI评测平台 # FlagEval

OpenCompass

OpenCompass是由上海人工智能实验室推出的开源大模型评测体系，提供全面、高效的评测框架，支持大语言模型和多模态模型的一站式评测，并定期公布评测结果榜单。

896,76030.8K

Model Evaluation # AI模型评测 # AI评测 # OpenCompass