腾讯 AI Lab 开源世界首款自动化模型压缩框架PocketFlow.doc

腾讯 AI Lab 开源世界首款自动化模型压缩框架PocketFlow.doc

ID:28131685

大小:176.00 KB

页数:9页

时间:2018-12-08

腾讯 AI Lab 开源世界首款自动化模型压缩框架PocketFlow.doc_第1页
腾讯 AI Lab 开源世界首款自动化模型压缩框架PocketFlow.doc_第2页
腾讯 AI Lab 开源世界首款自动化模型压缩框架PocketFlow.doc_第3页
腾讯 AI Lab 开源世界首款自动化模型压缩框架PocketFlow.doc_第4页
腾讯 AI Lab 开源世界首款自动化模型压缩框架PocketFlow.doc_第5页
资源描述:

《腾讯 AI Lab 开源世界首款自动化模型压缩框架PocketFlow.doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、腾讯AILab开源世界首款自动化模型压缩框架PocketFlow  AI科技评论按:腾讯AILab机器学习中心今日宣布成功研发出世界上首款自动化深度学习模型压缩框架——PocketFlow,并即将在近期发布开源代码。根据雷锋网AI科技评论了解,这是一款面向移动端AI开发者的自动模型压缩框架,集成了当前主流的模型压缩与训练算法,结合自研超参数优化组件实现了全程自动化托管式的模型压缩与加速。开发者无需了解具体算法细节,即可快速地将AI技术部署到移动端产品上,实现用户数据的本地高效处理。  随着AI技术的飞速发展,越来越多的公

2、司希望在自己的移动端产品中注入AI能力,但是主流的深度学习模型往往对计算资源要求较高,难以直接部署到消费级移动设备中。在这种情况下,众多模型压缩与加速算法应运而生,能够在较小的精度损失(甚至无损)下,有效提升CNN和RNN等网络结构的计算效率,从而使得深度学习模型在移动端的部署成为可能。但是,如何根据实际应用场景,选择合适的模型压缩与加速算法以及相应的超参数取值,往往需要较多的专业知识和实践经验,这无疑提高了这项技术对于一般开发者的使用门槛。  在此背景下,腾讯AILab机器学习中心研发了PocketFlow开源框架,以

3、实现自动化的深度学习模型压缩与加速,助力AI技术在更多移动端产品中的广泛应用。通过集成多种深度学习模型压缩算法,并创新性地引入超参数优化组件,极大地提升了模型压缩技术的自动化程度。开发者无需介入具体的模型压缩算法及其超参数取值的选取,仅需指定设定期望的性能指标,即可通过PocketFlow得到符合需求的压缩模型,并快速部署到移动端应用中。框架介绍  PocketFlow框架主要由两部分组件构成,分别是模型压缩/加速算法组件和超参数优化组件,具体结构如下图所示。    开发者将未压缩的原始模型作为PocketFlow框架的

4、输入,同时指定期望的性能指标,例如模型的压缩和/或加速倍数;在每一轮迭代过程中,超参数优化组件选取一组超参数取值组合,之后模型压缩/加速算法组件基于该超参数取值组合,对原始模型进行压缩,得到一个压缩后的候选模型;基于对候选模型进行性能评估的结果,超参数优化组件调整自身的模型参数,并选取一组新的超参数取值组合,以开始下一轮迭代过程;当迭代终止时,PocketFlow选取最优的超参数取值组合以及对应的候选模型,作为最终输出,返回给开发者用作移动端的模型部署。  具体地,PocketFlow通过下列各个算法组件的有效结合,实现

5、了精度损失更小、自动化程度更高的深度学习模型的压缩与加速:  a)通道剪枝(channelpruning)组件:在CNN网络中,通过对特征图中的通道维度进行剪枝,可以同时降低模型大小和计算复杂度,并且压缩后的模型可以直接基于现有的深度学习框架进行部署。在CIFAR-10图像分类任务中,通过对ResNet-56模型进行通道剪枝,可以实现2.5倍加速下分类精度损失0.4%,3.3倍加速下精度损失0.7%。  b)权重稀疏化(weightsparsification)组件:通过对网络权重引入稀疏性约束,可以大幅度降低网络权重中

6、的非零元素个数;压缩后模型的网络权重可以以稀疏矩阵的形式进行存储和传输,从而实现模型压缩。对于MobileNet图像分类模型,在删去50%网络权重后,在ImageNet数据集上的Top-1分类精度损失仅为0.6%。  c)权重量化(weightquantization)组件:通过对网络权重引入量化约束,可以降低用于表示每个网络权重所需的比特数;团队同时提供了对于均匀和非均匀两大类量化算法的支持,可以充分利用ARM和FPGA等设备的硬件优化,以提升移动端的计算效率,并为未来的神经网络芯片设计提供软件支持。以用于ImageN

7、et图像分类任务的ResNet-18模型为例,在8比特定点量化下可以实现精度无损的4倍压缩。  d)网络蒸馏(networkdistillation)组件:对于上述各种模型压缩组件,通过将未压缩的原始模型的输出作为额外的监督信息,指导压缩后模型的训练,在压缩/加速倍数不变的前提下均可以获得0.5%-2.0%不等的精度提升。  e)多GPU训练(multi-GPUtraining)组件:深度学习模型训练过程对计算资源要求较高,单个GPU难以在短时间内完成模型训练,因此团队提供了对于多机多卡分布式训练的全面支持,以加快使用者

8、的开发流程。无论是基于ImageNet数据的Resnet-50图像分类模型还是基于WMT14数据的Transformer机器翻译模型,均可以在一个小时内训练完毕。[1]  f)超参数优化(hyper-parameteroptimization)组件:多数开发者对模型压缩算法往往不甚了解,但超参数取值对最终结果往往有着

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。