1. C++性能调优工具使用

    背景介绍 随着工程项目的迭代深入,对程序的性能、内存占用等需求会越来越高,因此性能调优是程序走向稳定成熟的必经之路。C++程序的性能调优可以借助很多工具,工具的安装、环境依赖以及使用不尽相同,本文意在记录常用的C++性能调优工具和可视化工具的使用方式,便于日常迅速查询,进行性能分析和调优。

    2023/05/24 C++性能调优

  2. 高性能计算--OpenMP

    OpenMP 线程和OpenMP编程模型

    2023/05/18 高性能计算

  3. CMake--set, option 和add_definitions使用说明

    set()

    2023/05/16 cmake

  4. Linux环境中C++生成类的uml和函数调用关系图

    背景 对于一个新项目或者开源代码库的熟悉和学习,如果能够快速生成UML图或者类图以及函数调用关系图等,可以方便我们迅速熟悉代码,加深对项目的理解。 在Linux + C++的开发环境中,目前能够简单方便生成这类调用关系图和类图的工具我了解到的比较少,本文将根据自己的切身需求,不断收集整理可用的工具,并实际使用和测试相关配置,以备不时之需。

    2023/05/01 C++

  5. 常用设计模式

    设计模式 设计模式是针对软件开发中经常遇到的一些设计问题,总结出来的一套解决方案或者设计思路。大部分设计模式要解决的都是代码的可扩展性问题。设计模式相对于设计原则来说,没有那么抽象,而且大部分都不难理解,代码实现也并不复杂。这一块的学习难点是了解它们都能解决哪些问题,掌握典型的应用场景,并且懂得不过度应用。

    2023/04/19 设计模式

  6. C++对象模型--继承关系下的虚函数实现

    C++对象模型-继承关系下的虚函数实现

    2023/04/01 C++

  7. 汇编语言学习-王爽版

    汇编语言学习

    2023/03/20 汇编语言学习

  8. SIMD探索学习--Intel的SSE和AVX指令集

    SIMD简介 在深度学习中经常会涉及到向量和矩阵运算,在之前实现的算子中通常会采用循环或者开源的向量运算加速库来提高计算效率,例如openmp、EIGEN、MKL等等。这些库的底层除了利用处理器的并行化能力,还会调用指令集优化代码。这里的指令集优化,大多数使用的是SIMD指令。

    2023/03/18 高性能计算

  9. 庖丁解码--Triton源码学习和流程总结(一)

    Triton简介 Triton Inference Server是一个开源的推理服务软件,可以简化人工智能推理。Triton使团队能够从多个深度学习和机器学习框架中部署任何AI模型,包括TensorRT、TensorFlow、PyTorch、ONNX、OpenVINO、Python、RAPIDS FIL等。Triton支持跨NVIDIA gpu、x86和ARM CPU或AWS Inferentia上的云、数据中心、边缘和嵌入式设备的推理。Triton为许多查询类型提供了优化的性能,包括实时、批处理、集成和音频/视频流。 主要特性包括:

    2023/03/14 源码学习

  10. ARM的紧耦合内存--TCM

    TCM简介 TCM :TIghtly Coupled Memory 的缩写。为了弥补 Cache 访问的不确定性,而增加的 OnChip Memory. 有的 CPU 含有分立的 InstrucTIon TCM / Data TCM.TCM 包含在存储器的地址映射空间中,可以作为快速存储器来访问。TCM 使用物理地址,对 TCM 的写访问,受到 MMU 内部保护信息的控制。向 TCM 中的内存位置写入时,不会发生任何外部写入。

    2023/03/10 硬件相关