H2O EvalGPT H2O EvalGPT是H2O.ai推出的开放工具,专为评估和比较大型语言模型(LLM)设计,提供全面的性能排行榜,助力用户选择最适合其项目需求的模型。 880,08530.8K AI模型评测# A/B测试# AI工具# AI模型评估
OpenCompass OpenCompass是由上海人工智能实验室推出的开源大模型评测体系,提供全面、高效的评测框架,支持大语言模型和多模态模型的一站式评测,并定期公布评测结果榜单。 880,13030.8K AI模型评测# AI模型评测# AI评测# OpenCompass