成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
0
WAIC 开发者日Workshop预告:旷视天元 MegEngine 推动低比特量化技术的落地
2022 年 8 月 24 日
机器之心
人工智能创新技术持续涌现,推动新一代技术浪潮向前发展,解决一个个技术难题,其中如何在资源有限的终端场景实现 AI 模型的有效部署,是加速 AI 落地的重要问题。
AI 工程师们研发了各种试图缩小模型大小并保持性能的办法,例如量化和蒸馏。
目前相对成熟的模型量化方案是 INT8 量化。而为了推动低比特量化技术的发展,旷视天元 MegEngine 团队对 int4 进行了深入研究。在本届 2022 世界人工智能大会(WAIC)上,旷视天元 MegEngine 异构计算组负责人王彪,将出席 9 月 2 日的技术 Workshop,为大家分享开源深度学习框架实现支持 CUDA int4 的设计思路和踩坑经验。
(旷视科技 MegEngine 异构计算组负责人,王彪)
分享主题:
深度学习框架 MegEngine CUDA int4 推理详解
分享嘉宾:
王彪,旷视科技 MegEngine 异构计算组负责人。
毕业于中科院计算所,研究方向为高性能计算,对 X86、Arm、OpenCL、CUDA 等多种平台具备丰富的优化经验。2018 年加入旷视,任职期间完成了 MegEngine 基于 MLIR 的即时编译技术等多项技术突破,并落地 MegEngine CUDA 推理解决方案以及多个端上优化项目。
分享时间:
北京时间 9 月 2 日 18:00-19:00
【关于旷视天元 MegEngine】
旷视天元开源深度学习框架 MegEngine 是旷视自主研发的国产工业级深度学习框架,是旷视新一代 AI 生产力平台 Brain++ 的最核心组件,在 2020 年 3 月正式向全球开发者开源,能够帮助企业与开发者大幅节省产品从实验室原型到工业部署的流程,真正实现小时级的转化能力。MegEngine 是一个快速、可拓展、易于使用的深度学习框架,拥有以下三大关键特点:
训练推理一体:训练推理同一内核,模型结构、量化、前后处理、动态 shape 甚至求导均可 放入模型 进行推理,训练推理轻松对齐精度
超低硬件门槛:依靠算法优化各类关键资源占用,DTR 让训练显存占用量一键下降 3 倍,pushdown 内存分配算法让推理内存占用下降至极低水平
全平台高效推理:在 x86/Arm/CUDA/RoCM 各平台上均可体验到高性能且精度对齐的推理体验,更有 丰富的高阶用法可以优化性能、节省内存
MegEngine 官网:https://www.megengine.org.cn/
项目源码:https://github.com/MegEngine
如何预约观看本场 Workshop?
第一步:扫描下方二维码,进入 WAIC 2022 云平台 3.0,填写报名信息,注册成为云观众
第二步:扫描下方「AI 开发者日 - AI 开发与工程实践 Workshop」专属活动二维码,点击右上角“预约线上参会”
9 月 2 日 18:00,通过 WAIC 2022 云平台 3.0 个人主页 “我的预约” 或扫描专属活动二维码进入直播间,收看精彩分享!
登录查看更多
点赞并收藏
0
暂时没有读者
0
权益说明
本文档仅做收录索引使用,若发现您的权益受到侵害,请立即联系客服(微信: zhuanzhi02,邮箱:bd@zhuanzhi.ai),我们会尽快为您处理
相关内容
比特
关注
1
《用于边缘智能的高能效卷积神经网络加速器》博士论文,苏黎世大学和苏黎世联邦理工学院
专知会员服务
24+阅读 · 2022年5月5日
【MIT Sam Hopkins】如何读论文?How to Read a Paper
专知会员服务
108+阅读 · 2022年3月20日
【CVPR2021】用于目标检测的通用实例蒸馏
专知会员服务
24+阅读 · 2021年3月22日
【CVPR 2020-商汤】8比特数值也能训练卷积神经网络模型
专知会员服务
26+阅读 · 2020年5月7日
【课程推荐】理科学校的深度学习(Deep Learning for Science School)
专知会员服务
16+阅读 · 2019年11月10日
超轻量!AI模型编译器MegCC开源,让推理引擎体积变小小小小小……
PaperWeekly
1+阅读 · 2022年11月10日
提速还能不掉点!深度解析 MegEngine 4 bits 量化开源实现
PaperWeekly
0+阅读 · 2022年9月26日
直播预告 | 低比特量化、海量智能体、大模型创新实践,你感兴趣的开发工具与工程实践都在这
机器之心
0+阅读 · 2022年9月1日
WAIC开发者日Workshop预告:华为昇思MindSpore基础模型创新实践
机器之心
1+阅读 · 2022年9月1日
WAIC开发者日Workshop预告:超参数科技如何探索海量AI决策课题
机器之心
0+阅读 · 2022年8月30日
基于稳定性约束的高效多相流连续-离散耦合模拟
国家自然科学基金
0+阅读 · 2013年12月31日
虚拟化环境中高效节能的内存资源动态管理技术研究
国家自然科学基金
0+阅读 · 2013年12月31日
云计算环境下面向多租户应用的个性化数据隐私保护机制研究
国家自然科学基金
0+阅读 · 2012年12月31日
高温稠密等离子体中电流输运过程的理论及数值模拟研究
国家自然科学基金
0+阅读 · 2011年12月31日
基于多层网络的内生型产业集群核心企业动态竞争优势形成机理与演进路径研究
国家自然科学基金
1+阅读 · 2008年12月31日
Workload Similarity Analysis using Machine Learning Techniques
Arxiv
0+阅读 · 2022年11月23日
Explaining YOLO: Leveraging Grad-CAM to Explain Object Detections
Arxiv
0+阅读 · 2022年11月22日
AI in Finance: Challenges, Techniques and Opportunities
Arxiv
46+阅读 · 2021年7月20日
Beyond Lexical: A Semantic Retrieval Framework for Textual SearchEngine
Arxiv
16+阅读 · 2020年8月10日
Single-Shot Object Detection with Enriched Semantics
Arxiv
11+阅读 · 2018年4月8日
VIP会员
自助开通(推荐)
客服开通
详情
相关主题
比特
异构计算
异构
CUDA
深度学习框架
北京旷视科技有限公司
相关VIP内容
《用于边缘智能的高能效卷积神经网络加速器》博士论文,苏黎世大学和苏黎世联邦理工学院
专知会员服务
24+阅读 · 2022年5月5日
【MIT Sam Hopkins】如何读论文?How to Read a Paper
专知会员服务
108+阅读 · 2022年3月20日
【CVPR2021】用于目标检测的通用实例蒸馏
专知会员服务
24+阅读 · 2021年3月22日
【CVPR 2020-商汤】8比特数值也能训练卷积神经网络模型
专知会员服务
26+阅读 · 2020年5月7日
【课程推荐】理科学校的深度学习(Deep Learning for Science School)
专知会员服务
16+阅读 · 2019年11月10日
热门VIP内容
开通专知VIP会员 享更多权益服务
【MIT博士论文】弱监督学习:理论、方法与应用
Andrej Karpathy:2025 年 LLM 年度回顾(2025 LLM Year in Review)
锚定情报:合成欺骗时代的地面真相
NeurIPS 2025 | NMKE:基于神经元归因与动态稀疏掩码的终身知识编辑
相关资讯
超轻量!AI模型编译器MegCC开源,让推理引擎体积变小小小小小……
PaperWeekly
1+阅读 · 2022年11月10日
提速还能不掉点!深度解析 MegEngine 4 bits 量化开源实现
PaperWeekly
0+阅读 · 2022年9月26日
直播预告 | 低比特量化、海量智能体、大模型创新实践,你感兴趣的开发工具与工程实践都在这
机器之心
0+阅读 · 2022年9月1日
WAIC开发者日Workshop预告:华为昇思MindSpore基础模型创新实践
机器之心
1+阅读 · 2022年9月1日
WAIC开发者日Workshop预告:超参数科技如何探索海量AI决策课题
机器之心
0+阅读 · 2022年8月30日
相关基金
基于稳定性约束的高效多相流连续-离散耦合模拟
国家自然科学基金
0+阅读 · 2013年12月31日
虚拟化环境中高效节能的内存资源动态管理技术研究
国家自然科学基金
0+阅读 · 2013年12月31日
云计算环境下面向多租户应用的个性化数据隐私保护机制研究
国家自然科学基金
0+阅读 · 2012年12月31日
高温稠密等离子体中电流输运过程的理论及数值模拟研究
国家自然科学基金
0+阅读 · 2011年12月31日
基于多层网络的内生型产业集群核心企业动态竞争优势形成机理与演进路径研究
国家自然科学基金
1+阅读 · 2008年12月31日
相关论文
Workload Similarity Analysis using Machine Learning Techniques
Arxiv
0+阅读 · 2022年11月23日
Explaining YOLO: Leveraging Grad-CAM to Explain Object Detections
Arxiv
0+阅读 · 2022年11月22日
AI in Finance: Challenges, Techniques and Opportunities
Arxiv
46+阅读 · 2021年7月20日
Beyond Lexical: A Semantic Retrieval Framework for Textual SearchEngine
Arxiv
16+阅读 · 2020年8月10日
Single-Shot Object Detection with Enriched Semantics
Arxiv
11+阅读 · 2018年4月8日
大家都在搜
Palantir
突防
大型语言模型
多域作战
未来战争
机场
蓝牙安全攻防
朱克爱德华兹家族
反恐
模型压缩 | 知识蒸馏经典解读
Top
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top