1. C++对象模型--继承关系下的虚函数实现

    C++对象模型-继承关系下的虚函数实现

    2023/04/01 C++

  2. 汇编语言学习-王爽版

    汇编语言学习

    2023/03/20 汇编语言学习

  3. SIMD探索学习--Intel的SSE和AVX指令集

    SIMD简介 在深度学习中经常会涉及到向量和矩阵运算,在之前实现的算子中通常会采用循环或者开源的向量运算加速库来提高计算效率,例如openmp、EIGEN、MKL等等。这些库的底层除了利用处理器的并行化能力,还会调用指令集优化代码。这里的指令集优化,大多数使用的是SIMD指令。

    2023/03/18 高性能计算

  4. 庖丁解码--Triton源码学习和流程总结(一)

    Triton简介 Triton Inference Server是一个开源的推理服务软件,可以简化人工智能推理。Triton使团队能够从多个深度学习和机器学习框架中部署任何AI模型,包括TensorRT、TensorFlow、PyTorch、ONNX、OpenVINO、Python、RAPIDS FIL等。Triton支持跨NVIDIA gpu、x86和ARM CPU或AWS Inferentia上的云、数据中心、边缘和嵌入式设备的推理。Triton为许多查询类型提供了优化的性能,包括实时、批处理、集成和音频/视频流。 主要特性包括:

    2023/03/14 源码学习

  5. ARM的紧耦合内存--TCM

    TCM简介 TCM :TIghtly Coupled Memory 的缩写。为了弥补 Cache 访问的不确定性,而增加的 OnChip Memory. 有的 CPU 含有分立的 InstrucTIon TCM / Data TCM.TCM 包含在存储器的地址映射空间中,可以作为快速存储器来访问。TCM 使用物理地址,对 TCM 的写访问,受到 MMU 内部保护信息的控制。向 TCM 中的内存位置写入时,不会发生任何外部写入。

    2023/03/10 硬件相关

  6. CPU亲和性(绑核)和numa节点配置

    学习背景

    2023/03/05 Linux内核架构与系统编程

  7. 【转载】基于可变模板参数的静态多态

    基于虚函数实现动态多态很容易,只要重写基类虚方法即可:

    2023/02/21 C++

  8. 记录一个多进程高并发框架(不断维护优化)

    多进程高并发代码框架 ```c++ #define _GNU_SOURCE #include #include #include #include #include

    2023/02/16 Linux内核架构与系统编程

  9. 竞态条件和数据竞争(下)

    写在前面

    2023/02/09 C++

  10. 竞态条件和数据竞争(上)

    写在前面

    2023/02/08 C++