存算一体 - 综述
存算一体:综述
Related Notes
No.240801 ~ 240802
Introduction
内存瓶颈
冯·诺伊曼架构下,存算分离,访存带宽低,时延长,功耗高。在处理数据密集型算法时,大量能耗和信号延迟损失在频繁的数据搬运和内存访问上,即所谓存储墙瓶颈。同时,计算与访存性能发展严重失衡。(Fig. 1.)
Fig. 1(a). Comparation between von Neumann and CiM Architecture.
Fig. 1(b). The bandwidth is increasing very slowly.
同时,大数据和 AI 技术的兴起,对流式数据传输提出了高要求,其性能受存算分离架构的数据搬移影响最为严重。希望采用忆阻器等新兴介质,实现原位存储和计算,减小能耗和延时,消除传统架构下的内存瓶颈问题。
忆阻器
包括磁效应忆阻器、相变效应忆阻器和阻变效应忆阻器等。
Magnetoresistive RAM (MRAM)
磁效应忆阻器通过调整电子自旋,利用磁道磁阻效应实现电阻状态改变,达到存储信息的目的。其结构包含有 3 层, ...
Installing PMDK
DevEnv
Installing PMDK[1]
PMDK 是一系列包的总称,随着英特尔傲腾业务的终止,这些包逐渐不再被维护。Debian 12 软件仓库中目前只剩 libpmem ( 低级操作 )、libpmemblk 等主要包,或者手动从 Github 自行安装。
12$ apt search pmem$ apt-get install <library>
e.g. libpmem[2]
123Runtime: libpmem1Dev : libpmem-devDebug : libpmem1-debug
不装 dev 会导致编写程序时没有头文件
Installing NDCTL[3]
The ndctl utility is used to manage the libnvdimm (non-volatile memory device) sub-system in the Linux Kernel.
1$ apt install ndctl daxctl
Installing IPMCTL[4]
ipmctl is an open sourc ...
求生之路 2
求生之路 2
童年补票系列再添一员,MOD 打满了。只恨这两个月没有早点开玩。
Common
游玩
进入游戏显示不全,调全屏后闪退重进帧率不稳。几次实测后平均位于 80 fps 左右,火焰等粒子较多时可能跌到 40~50 fps.
喷图
在「多人联机」手动开启。
命令
命令一览 ☞ | Admin System 够用了
附基本命令 (启用作弊)
1sv_cheats 1
成就
进游戏第一件事,控制台绑定菜单。成就列表沉寂许久也没关注过。近几次游玩时发现,游戏 (甚至重装游戏后) 记住了我的常用绑定,不需要再开控制台了。而成就列表居然有了些进步。
推测,部分成就只要没有「开控制台」这个动作,就是正常统计的。
Mods
收藏 | 当前订阅
每次启动都要重新处理冲突十分麻烦,可以手动[1]收藏后取消订阅。
枪械
每型枪只能加载一个 MOD,需要在开始页面手动调整。
常用
Admin System
神中神。配合 Melee Unlock[2] 食用。快捷键绑定如下
1bind b "show_menu Menu"
下载问题
指路 ☞
[02/ ...
MIPS - A Deep Dive(一)
MIPS Q&A
About MIPS32.
Page Fault
What is a page fault ?
A page fault is an exception that MMU raises when a process accesses a memory page without proper preparations.
Accessing the page requires:
A mapping be added to the process’s virtual address space.
The actual page contents be loaded from a back-up, e.g. a disk.
The page fault is detected by the memory management unit (MMU), and the exception is handled by the OS kernel by making the required page accessible in the physical memory ...
论文复现 - Memtis(一)
§1 资源准备
ASPLOS’23
Repo
Setting tiered memory systems with Intel DCPMM
Reconfigures a namespace with devdax mode.
1sudo ndctl create-namespace -f -e namespace0.0 --mode=devdax
-f: Allow the operation to continue on enabled namespaces
-e: Reconfigure existing namespace configuration
--mode: Define the namespace mode - fsdax, devdax, sector, and raw
Reconfigures a dax device with system-ram mode (KMEM DAX).
1sudo daxctl reconfigure-device dax0.0 --mode=system-ram
--mode: system-ram or devda ...
论文复现 - Memtis(二)
§2 实验复现
前置
cgroup
参考 [1] [2] [3]。
kthread
参考 [4]。
taskset
…
Benchmarks
gapbs
对 benchmark/bench.mk 做少许修改,手动下载解压。[5]
liblinear
2.45 没有了,现版本 2.47。对 datasets.mk 做少许修改,kdd 需要手动下载。[6]
graph500
3.0.0 和 vmitosis-workloads/graph500 均无法使用,单独安装了 2.1.4.[7]
Benchmark Specification - Graph 500
btree
123# change the number of elements and lookup requestsvim btree/btree.c# see line 61
XSBench
Programming Model: openmp-threading
This is the “default” version of XSBench that is appropriate for seria ...
PMDK Documention
Persistent Memory Documentation
Getting Started Guide
PMDK Introduction
Tuned and validated on both Linux and Windows, the libraries build on the Direct Access (DAX) feature which allows applications to directly access persistent memory as memory-mapped files[1].
*Raw Device Access: 裸设备访问
**注意这里 PMDK 没有经过 NVDIMM Driver
The ‘Persistent Memory’ area describes the fastest possible access (? why faster than with a cache) because the application I/O bypasses existing filesystem page caches and go ...
SetupTools(一)
Setuptools
基于一个简单项目对 Setuptools 进行讲解。最后,项目还使用 Electron-Builder 将 Web 应用封装为桌面应用。
项目结构
123456789101112131415161718192021cli/- .streamlit/ - config.toml- hooks/ - hook_streamlit.py- pages/ - 1_PageOne.py - 2_PageTwo.py- Index.py- run_index.py- run_index.specpack/- main.js- main.bat- package.json- package-lock.json- resources/ - run_index.exe- static/ - icon/
RuskDesk 配置记录
RustDesk
现在 RayLink 时好时坏,苦于没有能用的远程软件,遂尝试 RustDesk 自建中继服务器。
安装及配置
教程移步 ☞
Server
首先在服务器面板和 ufw 分别放行端口。可能是以前装 Hexon 时装了 pm2,所以采用 pm2 部署。从 .pub 文件获取 Key,本地需要填写。
Client
填写云服务器 IP 和 Key[1],没改默认端口,至此已经可以运行。
体验
释怀地似了,比 RustDesk 更卡。给服务器测个速看看。
speedtest
librespeed/speedtest | Tutor | Repo
顺手修了下宝塔,查看配置使用 bt 14,原来端口后面还有一小串路由,加上才能访问。添加网站后测速如下。
下行是正常的,只能是封端口或者流量特征检测之类。
修复
恼火。突然发现 PicUploader 一直 401,首先怀疑是在宝塔弄测速时把 Nginx 碰坏了,检查了一个多小时,一无所获。把测速网站整个删光并重启 Nginx,清除浏览器数据。无效。
换用 Edge 和 Chrome (无痕),均正常。记录至此, ...
SSL 证书自动更新及部署
SSL 证书自动化更新 / 部署
Backgrounds
OHTTPS Dachboard | OHTTPS 文档
腾讯云附赠的一年 SSL 证书到期了,再续便是 90 天有效期,十分麻烦。偶然得知 OHTTPS 服务可支持主流云服务商及多种平台 SSL 免费证书的自动化申请 / 更新及部署,一探究竟,记之此文。
笔者去年主要给四个三级域名申请了证书 ( 因为腾讯云不给泛解析证书 ),其中三个位于自己的轻量服务器,一个绑定七牛云 CDN.
Solutions
注册账号后申请了 Let’s Encrypt 的泛解析证书,向 DNS 解析添加一条 CNAME 便完成。
参考 OHTTPS 教程 进行自动化证书更新 / 部署,更新周期设为最长 75 天。七牛云节点容易配置,服务器节点则稍费工夫,通过创建 SSH 节点完成。
SSH 节点部署
前置
建议创建专门用于证书部署的用户。
1234# 新建cert用户useradd -m cert# 设置cert用户登录密码passwd cert
权限控制
1sudo sudoer
进入 NANO 后在文件末尾添加
1cert AL ...