当前位置: 首页 > news >正文

[论文笔记] 大模型评测:lm-evaluation-harnessPublic(eval-big-refactor)

https://github.com/EleutherAI/lm-evaluation-harness/tree/big-refactor

1、添加SeaExam中的m3exam和mmlu测试集。

https://huggingface.co/datasets/SeaLLMs/SeaExam

英语+东南亚语:SeaLLMs/SeaExam

 requirements.txt

-e .
-e .[multilingual]
openai
accelerate-0.26.1-py3-none-any.whl
torch==2.2.2
transformers
huggingface_hub==0.26.1


http://www.mrgr.cn/news/60378.html

相关文章:

  • git push关联的远程仓库
  • RHCE笔记-NFS服务
  • 快速入门HTML
  • 【笔试面试题】硬件部分
  • 【Python爬虫实战】使用BeautifulSoup和Scrapy抓取网页数据!
  • 考研要求掌握的C语言程度(堆排序)1
  • 在 Gitee 或 GitCode 上克隆 Dify 项目源码并启动 Docker 环境
  • C++二级 求每个单词的长度的3种解决办法(包括find、substr)
  • 盛元广通食检中心实验室信息化LIMS系统
  • 大语言模型推理源码解读(基于llama3模型:来源github)
  • 做梦都想拥有的陪伴对象,AI居然免费帮我实现了...文中附送体验地址!
  • autMan奥特曼机器人-内置容器安装依赖报错:externally-managed-environment
  • 深度学习中的损失函数
  • # centos6.5 使用 yum list 报错Error Cannot find a valid baseurl for repo bas 解决方法
  • 3500多万家专利数据存入Mysql数据库
  • 本地服务器上搭建PPTist轻松实现跨地域的在线PPT制作与演示
  • Spring Cloud Alibaba实战入门之Nacos注册中心(四)
  • 我国金融科技人才培养情况
  • 电动机轴承发热的原因以及补充和更换油脂的经验
  • 基于Spring Boot的在线摄影工作室开发指南
  • 《链表篇》---环形链表
  • Python 中的 @ 符号是如何工作的!
  • Android 应用申请 Google MBA权限
  • 智诊小助手-AP/Station模式切换
  • 渗透测试的主要目的是什么?渗透测试入门到精通教程,收藏这一篇就够了
  • 大模型 “蓝图” 进阶学习路线:构建大模型岗位就业之路