精品内容

ACL 2025 | 高效样本利用的大模型人类评估方法
专知会员服务
13+阅读 · 5月22日
迈向LLM时代的可泛化评估:超越基准的综述
专知会员服务
21+阅读 · 4月29日
【斯坦福博士论文】大语言模型的AI辅助评估
专知会员服务
27+阅读 · 3月30日
【KDD2024教程】大型语言模型的基础与评估,231页ppt
专知会员服务
47+阅读 · 2024年8月30日
《多模态大语言模型评估综述》
专知会员服务
36+阅读 · 2024年8月29日
大语言模型评估技术研究进展
专知会员服务
47+阅读 · 2024年7月9日
《军事大模型评估体系白皮书》
专知会员服务
193+阅读 · 2024年5月31日
天大最新《大型语言模型评估》全面综述,111页pdf
专知会员服务
88+阅读 · 2023年10月31日
参考链接
微信扫码咨询专知VIP会员