与性能相关的矩阵特征文献
版权声明:
除非注明,本博文章均为原创,转载请以链接形式标明本文地址。
Create 2024-06-04
以针对的算法为分类对象,总结目前与性能相关的矩阵特征文献
SpMV
(PPoPP’23)Yesil S, Heidarshenas A, Morrison A, et al. WISE: Predicting the performance of sparse matrix vector multiplication with machine learning[C]//Proceedings of the 28th ACM SIGPLAN Annual Symposium on Principles and Practice of Parallel Programming. 2023: 329-341.
文章主要创新点:提出了更丰富的矩阵特征,包括结构特征
(PPoPP’18)Zhao Y, Li J, Liao C, et al. Bridging the gap between deep learning and sparse matrix format se ...
AMG性能优化相关文章
版权声明:
除非注明,本博文章均为原创,转载请以链接形式标明本文地址。
Create 2023-03-31
Update 2023-10-11
Update 2024-06-04
Update 2024-06-11
性能优化是一个非常广泛的概念,这里指结合计算机体系结构提高性能,纯减少算法复杂度的工作并没有包括在内。AMG解法器非常多,最近开发活跃的如下表:
AMG解法器
开发者
说明
备注
BoomerAMG
LLNL(HYPRE)
实用比较广泛的经典AMG算法解法器
开源
Pyamg
Luke Olson
基于Python的AMG解法器
开源
RAPtor
Bienz Amanda
结点感知通信的AMG解法器
开源
AMGCL
Demidov, Denis
基于C++的AMG解法器
开源
JXPAMG
九所和湘潭大学
特征驱动的AMG解法器
开源
FASP
中科院数学与系统科学研究院
针对油藏模拟等应用领域开发
开源
FASP++
中科院数学与系统科学研究院
FASP的C++版本
开源
AMGX
NVIDIA
基于NVIDIA的GP ...
HPCToolKit基础使用教程
版权声明:
除非注明,本博文章均为原创,转载请以链接形式标明本文地址。
安装
1$ spack install hpctoolkit
性能数据采样
基础教程推荐看 HPCToolKit 手册 第三章 Quick Start
主要有以下几个流程
measurement of context-sensitive performance metrics while an application executes;
binary analysis to recover program structure from CPU and GPU binaries;
attribution of performance metrics by correlating dynamic performance metrics with static program structure;
presentation of performance metrics and associated source code.
具体示意图如下:
1. Compiling an Application
在使用HP ...
spack基础教程
版权声明:
除非注明,本博文章均为原创,转载请以链接形式标明本文地址。
参考资料:
Spack 入门指南 – refraction-ray (re-ra.xyz)
Spack:超算上最好的包管理器 - 知乎 (zhihu.com)
Spack — Spack 0.20.0.dev0 documentation
spack 安装
123$ git clone -c feature.manyFiles=true https://github.com/spack/spack.git$ cd spack/bin$ ./spack install libelf
spack 使用
加载 spack 环境
12345678# For bash/zsh/sh$ . spack/share/spack/setup-env.sh# For tcsh/csh$ source spack/share/spack/setup-env.csh# For fish$ . spack/share/spack/setup-env.fish
spack 文件夹架构
1234567891011121314151 ...
在后摩尔时代,驱动计算机性能发展的是顶部空间
版权声明:
除非注明,本博文章均为原创,转载请以链接形式标明本文地址。
在后摩尔时代,驱动计算机性能发展的是顶部空间
对于Science文章《There’s plenty of room at the Top-What will drive computer performance after Moore’s law》的总结
作者:
Charles E. Leiserson :计算机科学家,专门研究并行计算和分布式计算理论,开发了Cilk多线程语言,发明了胖树互连网络,一种在许多超级计算机中使用的硬件通用互连网络,并且为《算法导论》作者之一。
Neil C. Thompson :麻省理工学院计算机科学与人工智能实验室研究员,曾在劳伦斯·利弗莫尔国家实验室工作。
Joel Emer :计算机性能分析技术的先驱,也是微处理器架构师。目前是Nvidia的研究员和麻省理工学院的实践教授。
Bradley C. Kuszmaul :麻省理工学院计算机科学实验室超级计算技术小组研究员,研究方向为高性能计算中求解系统问题的算法设计,于2020年加入Google。
Butler W. La ...
Hexo搭建静态网页
版权声明:
除非注明,本博文章均为原创,转载请以链接形式标明本文地址。
Hexo搭建静态网页
其实网上教程很详细了,我只是以个人角度给一些建议:
搭建静态网页有很多框架选择,比如vue其它的,这里只是以Hexo为例。
平台选择:平台其实你是网页搭建在什么地方。国外提供商有GitHub、GitLab,国内提供商有coding,gitee。国外平台优点是限制少,无需实名认证等复杂操作,但访问速度(特别是图片)很慢;国内平台可能需要实名认证等操作,但访问速度快。
主题选择:主题来源可以从Hexo官网查找,喜欢哪个用哪个,也可以在GitHub中查找Hexo主题。如果对方网页源代码公开,可以直接拷贝,搭建自己的网页。
详细教程可参考:https://zhuanlan.zhihu.com/p/26625249
安装中注意的几点
域名不是必须的,搭建后平台会给你一个域名,只是不方便记忆。
npm安装后,记得百度搜素,如何更换国内软件源
.yml文件的修改一定要注意空格和对齐,和Python一样,强调书写格式,否则报错。
想要网页更符合自己的审美,每个主题都有详 ...