大模型评估 - 专知主题

会员服务 ·

大模型评估

大模型评估

精品内容

ACL 2025 | 高效样本利用的大模型人类评估方法

ACL 2025 | 高效样本利用的大模型人类评估方法

专知会员服务

14+阅读 · 5月22日

迈向LLM时代的可泛化评估：超越基准的综述

迈向LLM时代的可泛化评估：超越基准的综述

专知会员服务

22+阅读 · 4月29日

【斯坦福博士论文】大语言模型的AI辅助评估

【斯坦福博士论文】大语言模型的AI辅助评估

专知会员服务

29+阅读 · 3月30日

【AAAI2025教程】评估大型语言模型：挑战与方法，199页ppt

【AAAI2025教程】评估大型语言模型：挑战与方法，199页ppt

专知会员服务

46+阅读 · 2月27日

【NeurIPS2024】IDGen：基于项目区分度的提示生成用于大型语言模型评估

【NeurIPS2024】IDGen：基于项目区分度的提示生成用于大型语言模型评估

专知会员服务

14+阅读 · 2024年9月30日

【KDD2024教程】大型语言模型的基础与评估，231页ppt

【KDD2024教程】大型语言模型的基础与评估，231页ppt

专知会员服务

48+阅读 · 2024年8月30日

《多模态大语言模型评估综述》

《多模态大语言模型评估综述》

专知会员服务

38+阅读 · 2024年8月29日

大语言模型评估技术研究进展

大语言模型评估技术研究进展

专知会员服务

48+阅读 · 2024年7月9日

【COLING教程】导航现代评估领域：大语言模型 (LLMs) 基准和框架的考量，181页ppt

【COLING教程】导航现代评估领域：大语言模型 (LLMs) 基准和框架的考量，181页ppt

专知会员服务

28+阅读 · 2024年5月31日

《军事大模型评估体系白皮书》

《军事大模型评估体系白皮书》

专知会员服务

203+阅读 · 2024年5月31日

天大最新《大型语言模型评估》全面综述，111页pdf

天大最新《大型语言模型评估》全面综述，111页pdf

专知会员服务

88+阅读 · 2023年10月31日

如何评估大模型？吉大微软亚研等最新《大型语言模型评估》综述，全面阐述大模型评估方法体系

如何评估大模型？吉大微软亚研等最新《大型语言模型评估》综述，全面阐述大模型评估方法体系

专知会员服务

87+阅读 · 2023年7月13日

参考链接

微信扫码咨询专知VIP会员