Designing coresets--small-space sketches of the data preserving cost of the solutions within $(1\pm \epsilon)$-approximate factor--is an important research direction in the study of center-based $k$-clustering problems, such as $k$-means or $k$-median. Feldman and Langberg [STOC'11] have shown that for $k$-clustering of $n$ points in general metrics, it is possible to obtain coresets whose size depends logarithmically in $n$. Moreover, such a dependency in $n$ is inevitable in general metrics. A significant amount of recent work in the area is devoted to obtaining coresests whose sizes are independent of $n$ (i.e., ``small'' coresets) for special metrics, like $d$-dimensional Euclidean spaces, doubling metrics, metrics of graphs of bounded treewidth, or those excluding a fixed minor. In this paper, we provide the first constructions of small coresets for $k$-clustering in the metrics induced by geometric intersection graphs, such as Euclidean-weighted Unit Disk/Square Graphs. These constructions follow from a general theorem that identifies two canonical properties of a graph metric sufficient for obtaining small coresets. The proof of our theorem builds on the recent work of Cohen-Addad, Saulpic, and Schwiegelshohn [STOC '21], which ensures small-sized coresets conditioned on the existence of an interesting set of centers, called ``centroid set''. The main technical contribution of our work is the proof of the existence of such a small-sized centroid set for graphs that satisfy the two canonical geometric properties. The new coreset construction helps to design the first $(1+\epsilon)$-approximation for center-based clustering problems in UDGs and USGs, that is fixed-parameter tractable in $k$ and $\epsilon$ (FPT-AS).


翻译:设计核心- 小空间数据草图, 保存在$( 1\ pm\ \ epsilon) 范围内的解决方案的成本。 此外, 美元( $) 的依赖性必然会在一般的货币指标中有所改变。 该地区最近大量的工作致力于获取其大小独立于美元( e., Talm's creates) 的核心资源。 Feldman 和 Langberg [STOC' 11] 已经表明, 对于以美元为基数( 美元) 组合点的一般计量, 有可能获得其大小取决于对数的美元。 此外, 美元( $) 的这一基数( 美元) 是普通的美元( 美元) 基数( 美元) 的基数( 美元) 。 基数( 美元) 的基数( 美元) 基数( 美元) 的基数( 美元) 、 基数( 或排除固定的基数( 美元) 。 在本文中, 我们提供首次的基数( ) 基数( 美元) 基( 美元) 基) 基( 基) 基( 基) 基数( 基) 基数( ) ) 基( ) 基( ) ) 基) 基) 的基数( 基数( 基) ( ) 基) 基数( ) ) 基) 的基) 的基( 基) 的基( 的基) 的基) 的基( 的基) 的计算( 的基) 的基) 的基) 的基数( 、 、 、 、 、 、 、 基数( 基) (美元( ) (美元/ ) ) ( ) (美元( ) ) 、 、 、 基) 基) (美元/ 基) 、 、 基) 、 、 、 、 、 基) 基) 基) 、 、 、 、 基) 基) 基) 、 、 、 、 、 、 基) (美元( 基) 基) ( </s>

0
下载
关闭预览

相关内容

强化学习最新教程,17页pdf
专知会员服务
182+阅读 · 2019年10月11日
征稿 | International Joint Conference on Knowledge Graphs (IJCKG)
开放知识图谱
2+阅读 · 2022年5月20日
Transferring Knowledge across Learning Processes
CreateAMind
29+阅读 · 2019年5月18日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
18+阅读 · 2018年12月24日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Arxiv
20+阅读 · 2021年9月22日
Arxiv
24+阅读 · 2021年3月4日
VIP会员
相关资讯
征稿 | International Joint Conference on Knowledge Graphs (IJCKG)
开放知识图谱
2+阅读 · 2022年5月20日
Transferring Knowledge across Learning Processes
CreateAMind
29+阅读 · 2019年5月18日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
18+阅读 · 2018年12月24日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
相关论文
Arxiv
20+阅读 · 2021年9月22日
Arxiv
24+阅读 · 2021年3月4日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Top
微信扫码咨询专知VIP会员