CUDA论文 - 专知

会员服务 ·

CUDA

CUDA-L1: Improving CUDA Optimization via Contrastive Reinforcement Learning

Arxiv

0+阅读 · 10月28日

From Large to Small: Transferring CUDA Optimization Expertise via Reasoning Graph

Arxiv

0+阅读 · 10月22日

QiMeng-MuPa: Mutual-Supervised Learning for Sequential-to-Parallel Code Translation

Arxiv

0+阅读 · 10月22日

Tutoring LLM into a Better CUDA Optimizer

Arxiv

0+阅读 · 10月19日

Enabling Population-Level Parallelism in Tree-Based Genetic Programming for GPU Acceleration

Arxiv

0+阅读 · 10月10日

ConCuR: Conciseness Makes State-of-the-Art Kernel Generation

Arxiv

0+阅读 · 10月8日

Graphite: A GPU-Accelerated Mixed-Precision Graph Optimization Framework

Graphite: A GPU-Accelerated Mixed-Precision Graph Optimization Framework

Arxiv

0+阅读 · 9月30日

Solving Pasur Using GPU-Accelerated Counterfactual Regret Minimization

Arxiv

0+阅读 · 8月6日

High Performance Matrix Multiplication

Arxiv

0+阅读 · 9月4日

Dynamic Memory Management on GPUs with SYCL

Arxiv

0+阅读 · 4月25日

Dynamic Memory Management on GPUs with SYCL

Arxiv

0+阅读 · 9月9日

GigaAPI for GPU Parallelization

GigaAPI for GPU Parallelization

Arxiv

0+阅读 · 4月2日

PyGraph: Robust Compiler Support for CUDA Graphs in PyTorch

Arxiv

0+阅读 · 3月25日

Evaluating Multi-Instance DNN Inferencing on Multiple Accelerators of an Edge Device

Arxiv

0+阅读 · 3月12日

Debunking the CUDA Myth Towards GPU-based AI Systems

Arxiv

0+阅读 · 3月22日

参考链接

父主题

英伟达（NVIDIA）

微信扫码咨询专知VIP会员