澎峰科技高性能计算库PerfIPP介绍

    科创经济 朗峰江湖 2024-09-10 83364 次浏览

    一、PerfIPP介绍

    PerfIPP是专为计算机视觉处理和信号处理设计的优化计算库,计算驱动层基于OpenCL标准,支持异构计算加速。主要包括如下几类模块:

    序号 模块 已支持的子功能模块
    1 图像处理 图像数据交换及初始化、图像颜色变换、图像滤波、图像集合变换、图像直方图与积分图、图像特征提取等
    2 信号处理 信号逻辑及基本算术计算、信号统计计算、信号抽样与滤波计算、信号变换计算等

    二、PerfIPP性能优化策略概述

    性能优化模型Roofline指导下的性能优化

    层次化缓存感知的并行算法设计与开发

    体系结构和应用场景感知兼顾的性能智适应优化方法

    PerfIPP已支持的硬件平台

    AMDGPU/APU

    ARM:Cortex A9、A15、A57

    GPU:NVIDIA Kepler GPU,NVIDIA Maxwell GPU

    在AMD GPU/APU、ARM CPU/GPU、国产CPU/GPU之间实现性能的平滑移植。

    PerfIPP 性能测评

    本部分选择Cvt_color、warp_affine、warp_perspective、resize函数,PerfIPP与OpenCV在ARM系列处理器和GPU加速器的性能进行对比测试。

    1)PerfIPP VS OpenCV on ARM cortextA9(Speedup)

    wKgZombVh-iAMuOfAAHlW164cpI988.png

    2)PerfIPP VS OpenCV on ARM cortextA15(Speedup)

    3)PerfIPP VS OpenCV on ARM cortextA57(Speedup)

    4)PerfIPP VS OpenCV on NVIDIA Kepler GPU(Speedup)

    5)PerfIPP VS OpenCV on NVIDIA Maxwell GPU(Speedup)

    wKgaombViCWAYGuiAAGe_5uLLik464.png  

    、PerfIPP 加速计算机图像与信号处理

    图像处理和信号处理一直是计算软件栈的重要且基础软件,随着人工智能技术的迅猛发展,计算机图像与信号处理迎来了发展机遇与挑战:

    技术突破与创新:深度学习技术的不断发展,对图像与信号识别的分辨率、准确率和效率提出了挑战;

    行业应用广泛:图像与信号识别技术在医疗、安防、自动驾驶、零售等越来越多的领域得到了越来越广泛的应用,算法对多样化应用场景的适配提出了挑战;

    用户体验提升:图像与信号识别技术正在为人们的生活带来更多便利,例如,通过图像搜索,人们可以快速找到想要的信息,在购物时,图像识别技术可以帮助消费者快速识别商品信息、比较价格等。于是,海量的轻量级个人终端设备和云计算都提出了计算效能和算力适配的挑战;

    图像与信号技术的提升:计算机视觉和各种信号技术仍在不断提升,计算软件栈需要与图像和信号处理技术的协同发展和与时俱进;

    数据资源的丰富:随着互联网和物联网的发展,图像与信号的数据量快速增长,并发、高效处理对计算软件栈带来了技术挑战。

    计算机硬件技术的发展:随着人工智能技术的发展和多样化的应用场景需求,计算机硬件技术的发展正处于黄金时代。各种指令集、各种架构以及更复杂的异构计算平台层出不穷,应用侧企业需要有一个套统一的计算软件栈,降低算法的迁移和适配成本。

    PerfIPP 计算机视觉与信号处理库将进一步突破技术瓶颈,加速应用创新 和加速软件计算。