平替英伟达CUDA!摩尔线程发布MUSA4及其性能分析工具

硬件闲聊下 2025-04-21 09:37:00

摩尔线程MUSA SDK是一套完整的GPU并行计算开发环境,专为利用摩尔线程GPU加速程序而设计,也是NVIDIA CUDA开发环境的国产替代之一。

MUSA SDK包含运行时、C/C++编译器、GPU加速计算库、迁移和优化工具等组成的MUSAToolkits工具包,以及计算库、神经网络加速库、通信库等一系列开发工具,开发者可以一站式安装MUSA应用开发环境。

借助MUSA SDK,开发者能够轻松地利用摩尔线程GPU,加速各种应用,涵盖企业数据中心、桌面、工作站、云平台、超级计算机等多个领域。

现在,MUSA SDK重磅升级到了4.0.1版本,支持Intel处理器+Ubuntu操作系统、海光处理器+Kylin麒麟操作系统组成的平台。

【主要更新】

1、MUSA驱动和运行时

增加了对海光处理器、Kylin V10 SP1系统的支持。

2、Math-X

- muBLAS

mublasSgemmStrideBatched功能修复

mublasSgemm功能修复

mublasStrsm功能修复

- muSOLVER

优化LU分解性能

支持QR分解,覆盖单精度,双精度,单精度复数,双精度复数

- muSPARSE

稀疏矩阵性能优化

【兼容环境】

1、处理器、操作系统组合

x86架构:Intel、Ubuntu 22.04.x LTS x86_64

x86架构:海光、Kylin V10 SP1 2203

2、显卡

摩尔线程MTT S80、MTT S3000、MTT X300

3、驱动版本

musa_3.0.0_amd64.deb

MUSA 4.0.1下载地址:

https://developer.mthreads.com/sdk/download/musa?equipment=&;os=&driverVersion=&version=4.0.1

同时,摩尔线程同步带来了配套性能分析工具Moore Perf System的最新版本v1.3.0。

Moore Perf System是摩尔线程SDK中的基础组件,用于辅助开发者进行开发调试,可以方便、快速、准确地定位到系统级别的性能瓶颈,进而进行针对性分析和优化,使程序性能满足需求。

如果需要进一步分析计算类应用程序,请使用Moore Perf Compute。

如果需要进一步分析图形类应用程序,请使用Moore Perf Graphics。

主要功能——

支持采集OpenGL API 4.1(linux only)

支持采集Vulkan API 1.3.225(linux only)

支持采集DXD9 DXGI

支持采集DX11 API

支持采集WDDM

支持采集MUSA(linux only)

支持采集GPU Mertrics

支持采集OS runtime libraries

提供GUI图形界面,支持以timeline(时间线)方式回放报告

配套驱动版本,Linux系统下集成于MUSA SDK 4.0.1,Windows系统下不低于v270.80.1。

使用举例——

1、捕获有关分析过程中MUSA执行的信息。

2、跟踪OpenGL、OpenGL ES API,以帮助分析CPU和GPU交互。

详细资源、使用说明文档下载——

https://developer.mthreads.com/sdk/download/moore-perf-system?equipment=&;os=&driverVersion=&version=

0 阅读:0

硬件闲聊下

简介:感谢大家的关注