FlagEval

AI 分类：: AI模型评测

AI 标签：

AI 网址：: https://flageval.baai.ac.cn/

智源研究院推出的FlagEval（天秤）大模型评测平台

访问网站

FlagEval 介绍

FlagEval（天秤）是北京智源人工智能研究院（BAAI）推出的科学、公正、开放的大模型评测体系及开放平台，为研究人员提供全面评估基础模型及训练算法性能的工具和方法。FlagEval采用“能力-任务-指标”三维评测框架，从多个维度对大模型的认知能力进行评估，涵盖对话、问答、情感分析等多种应用场景，提供超过22个数据集和8万道评测题目。平台支持多模态模型评测，覆盖文本、图像、视频等多种数据类型，兼容多种AI框架和硬件架构。FlagEval提供自动化评测机制，支持主观与客观评测的全自动流水线，帮助研究人员高效、准确地了解模型性能，推动大模型技术的发展。

特别声明

13导航网提醒您：在使用13dh.com（以下简称13dh）前，请您务必仔细阅读并透彻理使用13dh.com前必读。您可以选择不使用13dh，但如果您使用13dh，您的使用行为将被视为对本声明全部内容的认可。

本站13dh.com提供的FlagEval来源于网络，本站不保证第三方网页的链接的安全性、正确性、及时性、合法性、准确性和完整性，您可能从该第三方网页上获得资讯及享用服务，13dh.com及其所有者对其合法性概不负责，亦不承担任何法律责任。同时，对于该外部链接的指向，不由13dh.com实际控制，13dh.com收录时，该网页上的内容，都属于合规合法，后期网页的内容如出现违规，请你点此留言或发邮件到551717082@qq.com联系网站管理员进行删除，本站及本站所有者对其概不负责，亦不承担任何法律责任。

AI模型评测

FlagEval

AI模型评测相关推荐

热门工具

FlagEval

FlagEval

特别声明

13导航网提醒您：在使用13dh.com（以下简称13dh）前，请您务必仔细阅读并透彻理使用13dh.com前必读。您可以选择不使用13dh，但如果您使用13dh，您的使用行为将被视为对本声明全部内容的认可。

FlagEval

AI模型评测 相关推荐

FlagEval

FlagEval

AI模型评测相关推荐