翻译:Writing_an_LLM_from_scratch_part_2
版权声明:
除非注明,本博文章均为原创,转载请以链接形式标明本文地址。
从零开始编写大型语言模型(LLM),第二部分
ref: https://www.gilesthomas.com/2024/12/llm-from-scratch-2
发布日期:2024年12月23日
分类:AI, Python, 从零开始编写LLM, TIL深度探索
我正在阅读Sebastian Raschka的书籍《从零开始构建大型语言模型》,并计划每天发布阅读笔记(至少在我阅读的日子里——圣诞节那天我可能不会发布),分享我觉得有趣的内容。
我原本计划每天阅读一章,但对于这样一本内容密集的书来说,这个目标似乎过于乐观了!所以今天,我阅读了第二章“处理文本数据”的前半部分。这一章概述了文本在进入LLM之前的预处理过程,接着描述了一个简单的分词系统(包括源代码),然后简要介绍了我们将在LLM中实际使用的字节对编码方法。
概述
核心思想是,LLM实际上无法直接处理文本——甚至无法直接处理单词。我认为,将文本输入LLM的第一步是进行分词(在我进行微调的冒险中,这一点非常常见),但事实证明,这只是第一步。
处理过程 ...
翻译:Writing_an_LLM_from_scratch_part_1
版权声明:
除非注明,本博文章均为原创,转载请以链接形式标明本文地址。
从零开始构建大型语言模型(LLM),第一部分
ref: https://www.gilesthomas.com/2024/12/llm-from-scratch-1
发布于 2024 年 12 月 22 日,主题:AI、从零开始构建 LLM、TIL 深度探索
在圣诞节假期(可能更久)期间,我计划学习Sebastian Raschka的书《从零开始构建大型语言模型》。我预计每天会学习一章或更少,以便有足够的时间消化内容。每天或每章结束后,我会在这里分享我觉得特别有趣的内容。
今天的内容可能是最简单的部分:第一章《理解大型语言模型》。
正如你所料,这一章主要是重申那些与 LLM 稍有接触的人已经知道的内容,因为 Raschka 需要为后续章节做铺垫。不过,这一章也提到了一些底层技术概念——虽然目前还比较粗略,但这些术语在后续章节中会得到详细解释。
Transformer
核心信息是,Transformer 架构是 LLM 如此强大的原因。他指出,LLM 不一定非得基于 Transformer 构建,基于 Tra ...
与性能相关的矩阵特征文献
版权声明:
除非注明,本博文章均为原创,转载请以链接形式标明本文地址。
Create 2024-06-04
以针对的算法为分类对象,总结目前与性能相关的矩阵特征文献
SpMV
(PPoPP’23)Yesil S, Heidarshenas A, Morrison A, et al. WISE: Predicting the performance of sparse matrix vector multiplication with machine learning[C]//Proceedings of the 28th ACM SIGPLAN Annual Symposium on Principles and Practice of Parallel Programming. 2023: 329-341.
文章主要创新点:提出了更丰富的矩阵特征,包括结构特征
(PPoPP’18)Zhao Y, Li J, Liao C, et al. Bridging the gap between deep learning and sparse matrix format se ...
AMG性能优化相关文章
版权声明:
除非注明,本博文章均为原创,转载请以链接形式标明本文地址。
Create 2023-03-31
Update 2023-10-11
Update 2024-06-04
Update 2024-06-11
性能优化是一个非常广泛的概念,这里指结合计算机体系结构提高性能,纯减少算法复杂度的工作并没有包括在内。AMG解法器非常多,最近开发活跃的如下表:
AMG解法器
开发者
说明
备注
BoomerAMG
LLNL(HYPRE)
实用比较广泛的经典AMG算法解法器
开源
Pyamg
Luke Olson
基于Python的AMG解法器
开源
RAPtor
Bienz Amanda
结点感知通信的AMG解法器
开源
AMGCL
Demidov, Denis
基于C++的AMG解法器
开源
JXPAMG
九所和湘潭大学
特征驱动的AMG解法器
开源
FASP
中科院数学与系统科学研究院
针对油藏模拟等应用领域开发
开源
FASP++
中科院数学与系统科学研究院
FASP的C++版本
开源
AMGX
NVIDIA
基于NVIDIA的GP ...
HPCToolKit基础使用教程
版权声明:
除非注明,本博文章均为原创,转载请以链接形式标明本文地址。
安装
1$ spack install hpctoolkit
性能数据采样
基础教程推荐看 HPCToolKit 手册 第三章 Quick Start
主要有以下几个流程
measurement of context-sensitive performance metrics while an application executes;
binary analysis to recover program structure from CPU and GPU binaries;
attribution of performance metrics by correlating dynamic performance metrics with static program structure;
presentation of performance metrics and associated source code.
具体示意图如下:
1. Compiling an Application
在使用HP ...
spack基础教程
版权声明:
除非注明,本博文章均为原创,转载请以链接形式标明本文地址。
参考资料:
Spack 入门指南 – refraction-ray (re-ra.xyz)
Spack:超算上最好的包管理器 - 知乎 (zhihu.com)
Spack — Spack 0.20.0.dev0 documentation
spack 安装
123$ git clone -c feature.manyFiles=true https://github.com/spack/spack.git$ cd spack/bin$ ./spack install libelf
spack 使用
加载 spack 环境
12345678# For bash/zsh/sh$ . spack/share/spack/setup-env.sh# For tcsh/csh$ source spack/share/spack/setup-env.csh# For fish$ . spack/share/spack/setup-env.fish
spack 文件夹架构
1234567891011121314151 ...