We present the Radar de Parit\'e, an automated Natural Language Processing (NLP) system that measures the proportion of women and men quoted daily in six Canadian French-language media outlets. We outline the system's architecture and detail the challenges we overcame to address French-specific issues, in particular regarding coreference resolution, a new contribution to the NLP literature on French. We also showcase statistics covering over one year's worth of data (282,512 news articles). Our results highlight the underrepresentation of women in news stories, while also illustrating the application of modern NLP methods to measure gender representation and address societal issues.


翻译:我们提出了Radar de Parité,这是一个自动化的自然语言处理系统,可测量六个加拿大法语媒体机构每日引用的女性和男性比例。我们概述了该系统的架构,并详细说明了我们克服的挑战,特别是有关指代消解的法语特定问题,这是一项针对法语的自然语言处理文献的新贡献。我们还展示了超过一年数据(282,512篇新闻文章)的统计数据。我们的结果突显了新闻报道中女性的低代表性,同时也说明了应用现代自然语言处理方法来测量性别代表性并解决社会问题的能力。

0
下载
关闭预览

相关内容

专知会员服务
124+阅读 · 2020年9月8日
临床自然语言处理中的嵌入综述,SECNLP: A survey of embeddings
强化学习最新教程,17页pdf
专知会员服务
182+阅读 · 2019年10月11日
VCIP 2022 Call for Demos
CCF多媒体专委会
1+阅读 · 2022年6月6日
征稿 | International Joint Conference on Knowledge Graphs (IJCKG)
开放知识图谱
2+阅读 · 2022年5月20日
【推荐】自然语言处理(NLP)指南
机器学习研究会
35+阅读 · 2017年11月17日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
VIP会员
相关VIP内容
专知会员服务
124+阅读 · 2020年9月8日
临床自然语言处理中的嵌入综述,SECNLP: A survey of embeddings
强化学习最新教程,17页pdf
专知会员服务
182+阅读 · 2019年10月11日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员