AI模型评测

Chatbot Arena LLM 排行榜翻译站点

Chatbot Arena LLM 排行榜,是一个由加州大学伯克利分校 SkyLab 和 LMSYS 的研究人员开发的开源平台,用于通过人类偏好评估人工智能

标签:
阿里绘蛙

Chatbot Arena (lmarena.ai) 是一个由加州大学伯克利分校 SkyLab 和 LMSYS 的研究人员开发的开源平台,用于通过人类偏好评估 AI。在 GitHub 上开源了 FastChat 项目,并发布了开放数据集。我们始终欢迎社区的贡献。

该网站主要有四大模块。

1: 竞技场(战斗)

  • 盲测:向两个匿名 AI 聊天机器人(ChatGPT、Gemini、Claude、Llama 等)提出任何问题。
  • 投票选出最佳:选择最佳回应。你可以继续聊天,直到找到获胜者。

2:  竞技场(并排)

  • 问任何问题给两个选定的模型(例如,ChatGPT,Gemini,Claude,Llama),并投票选出更好的一个!
  • 你可以进行多轮聊天,直到识别出胜者。

3:直接选择ai模型进行聊天

4:查看Chatbot Arena LLM 排行榜

Chatbot Arena LLM 排行榜Chatbot Arena LLM 排行榜

 

相关导航

暂无评论

暂无评论...