资讯
展览资讯 大型展会 灯光节 大型盛典 赛事 中标捷报 产品快讯 热门话题 艺术节 活动 演出 新闻 数艺报道 俱乐部签约
观点
大咖专访 观点洞察 书籍推荐 吐槽 设计观点 企业访谈 问答 趋势创新 论文 职场方法 薪资报价 数艺专访
幕后
幕后故事 团队访谈 经验分享 解密 评测 数艺访谈
干货
设计方案 策划方案 素材资源 教程 文案资源 PPT下载 入门宝典 作品合集 产品手册 电子书 项目对接
  • 0
  • 0
  • 0

分享

祝贺!AIR获2022 IEEE Micro年度最佳论文(Top Picks)提名奖

原创 2023-04-29

清华大学智能产业研究院(AIR)刘云新教授与上海交通大学、上海期智研究院、微软研究院以及美国罗彻斯特大学合作发表在第55届ACM/IEEE International Symposium on Microarchitecture (MICRO 2022)大会上的论文“ANT: 利用自适应数值类型进行低比特深度神经网络量化”(英文名称ANT: Exploiting Adaptive Numerical Data Type for Low-bit Deep Neural Network Quantization)获得了2022年体系结构领域IEEE Micro年度最佳论文(Top Picks)提名奖。该奖项每年从计算机体系结构领域四大顶会(ISCA,MICRO,HPCA,ASPLOS)几百篇文章中基于创新性和长期影响潜力选择前24篇文章,本论文是24篇文章之一,受到了国际学术界的高度认可

论文简介


量化是一种降低日益增长的DNN模型计算和存储成本的技术,一般采用定点整数或浮点类型,但能带来的优化效果都非常有限:一方面它们都需要更多的比特来保持原始模型的精度;另一方面,可变长度的量化方法虽然能带来算法层面的好处,但因为编码和解码复杂而产生了显著的硬件开销。


论文提出了一种称为ANT的固定长度自适应数据类型,可以通过很小的硬件开销实现超低精度量化,也是首个混合多数值类型的量化方法。ANT有两项关键创新点,首先,ANT提出了一种特殊的数据类型 Flint,它结合了float和int的优点,以适应张量内部的自适应性,即不同大小值的重要性。其次,ANT提出了张量之间的自适应框架,根据每个张量的分布特征为其选择最佳类型。



ANT最大的优点是与现有AI加速器兼容,可以直接嵌入到商用GPU中,展示了其硬件友好性和兼容性。正因为这个特点,ANT受到包括包括华为昇腾在内的多个硬件厂商的关注,并获得了2022年华为火花奖。论文中为ANT设计了一个统一的处理体系结构,并展示了它与现有DNN加速器的易集成性,与最先进的量化加速器相比,ANT能实现2.8×的加速和2.5×的能效改进Github链接:clevercool/ANT_Micro22 (github.com)


智慧物联


智慧物联是AIR的三大重点研究方向之一。利用5G、物联网、大数据、人工智能、云计算、边缘计算等前沿技术,围绕智慧城市、智慧园区、智慧楼宇、智慧交通、智能制造、工业互联网等应用场景,在智慧物联(AIoT)领域开展创新性理论探索研究和基础系统研究,攻克关键技术瓶颈,引领AIoT领域的研究工作和技术创新,开发具有自主知识产权的系统软件基础设施,打造新一代AIoT智能产业生态系统和决策大脑,赋能产业数字化转型升级,孵化新兴智能产业,利用数据驱动的智能决策赋能产业的绿色化和助力我国 “碳中和” 目标的实现,服务于国家和产业需求,推动我国在AIoT领域的战略布局和科研成果的产业落地。“利用自适应数值类型进行低比特深度神经网络量化”是该方向在提升智能计算系统能效方面的一个阶段性成果,AIR未来也将继续在智慧物联方向开展深入探索。


撰文:孙一


关注AIR公众号并回复“ANT”

下载完整版论文


AIR长期招聘人工智能领域优秀科研人员

点这里关注我们



关于AIR



清华大学智能产业研究院(Institute for AI Industry Research, Tsinghua University,英文简称AIR,THU)是面向第四次工业革命的国际化、智能化、产业化的研究机构。AIR的使命是利用人工智能技术赋能产业升级、推动社会进步。通过大学与企业创新双引擎,突破人工智能核心技术,培养智能产业领军人才,推动智能产业跨越式发展。

AIR于2020年由多媒体及人工智能领域的世界级科学家、企业家张亚勤院士创建。

智慧交通(AI+Transportation)、智慧物联(AI+IoT)、智慧医疗(AI+Life Science)是清华大学智能产业研究院的三个重点研发方向。


阅读原文

* 文章为作者独立观点,不代表数艺网立场转载须知

本文内容由数艺网收录采集自微信公众号清华大学智能产业研究院 ,并经数艺网进行了排版优化。转载此文章请在文章开头和结尾标注“作者”、“来源:数艺网” 并附上本页链接: 如您不希望被数艺网所收录,感觉到侵犯到了您的权益,请及时告知数艺网,我们表示诚挚的歉意,并及时处理或删除。

数字媒体艺术 新媒体艺术 科技艺术 DNN模型 计算机体系

12220 举报
  0
登录| 注册 后参与评论