The rapid growth of open-access (OA) publications has intensified the challenge of identifying relevant scientific papers. Due to privacy constraints and limited access to user interaction data, recent efforts have shifted toward content-based recommendation, which relies solely on textual information. However, existing models typically treat papers as unstructured text, neglecting their discourse organization and thereby limiting semantic completeness and interpretability. To address these limitations, we propose OMRC-MR, a hierarchical framework that integrates QA-style OMRC (Objective, Method, Result, Conclusion) summarization, multi-level contrastive learning, and structure-aware re-ranking for scholarly recommendation. The QA-style summarization module converts raw papers into structured and discourse-consistent representations, while multi-level contrastive objectives align semantic representations across metadata, section, and document levels. The final re-ranking stage further refines retrieval precision through contextual similarity calibration. Experiments on DBLP, S2ORC, and the newly constructed Sci-OMRC dataset demonstrate that OMRC-MR consistently surpasses state-of-the-art baselines, achieving up to 7.2% and 3.8% improvements in Precision@10 and Recall@10, respectively. Additional evaluations confirm that QA-style summarization produces more coherent and factually complete representations. Overall, OMRC-MR provides a unified and interpretable content-based paradigm for scientific paper recommendation, advancing trustworthy and privacy-aware scholarly information retrieval.


翻译:开放获取(OA)出版物的快速增长加剧了识别相关科学论文的挑战。由于隐私限制和用户交互数据访问有限,近期研究转向基于内容的推荐,仅依赖文本信息。然而,现有模型通常将论文视为非结构化文本,忽略了其语篇组织结构,从而限制了语义完整性和可解释性。为应对这些局限,我们提出OMRC-MR,一种集成问答式OMRC(目标、方法、结果、结论)摘要、多层级对比学习和结构感知重排序的分层框架,用于学术推荐。问答式摘要模块将原始论文转换为结构化且语篇一致的表示,而多层级对比目标则在元数据、章节和文档层级对齐语义表示。最终的重排序阶段通过上下文相似性校准进一步优化检索精度。在DBLP、S2ORC及新构建的Sci-OMRC数据集上的实验表明,OMRC-MR持续超越现有先进基线,在Precision@10和Recall@10上分别实现最高7.2%和3.8%的提升。附加评估证实问答式摘要能生成更连贯且事实完整的表示。总体而言,OMRC-MR为科学论文推荐提供了一个统一且可解释的基于内容范式,推动了可信赖且注重隐私的学术信息检索。

0
下载
关闭预览

相关内容

论文(Paper)是专知网站核心资料文档,包括全球顶级期刊、顶级会议论文,及全球顶尖高校博士硕士学位论文。重点关注中国计算机学会推荐的国际学术会议和期刊,CCF-A、B、C三类。通过人机协作方式,汇编、挖掘后呈现于专知网站。
【CIKM2020】多模态知识图谱推荐系统,Multi-modal KG for RS
专知会员服务
98+阅读 · 2020年8月24日
时空数据挖掘:综述
专知
34+阅读 · 2022年6月30日
LibRec 每周算法:LDA主题模型
LibRec智能推荐
29+阅读 · 2017年12月4日
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
VIP会员
相关资讯
时空数据挖掘:综述
专知
34+阅读 · 2022年6月30日
LibRec 每周算法:LDA主题模型
LibRec智能推荐
29+阅读 · 2017年12月4日
相关基金
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员