《JIT Technical Overview》翻译 | PyTorch
本文是 PyTorch 官方文档 JIT Technical Overview 的中文翻译。对于看不太明白的部分,暂不翻译,直接放上原文。
《JIT Technical Overview》翻译 | PyTorch
本文是 PyTorch 官方文档 JIT Technical Overview 的中文翻译。对于看不太明白的部分,暂不翻译,直接放上原文。
OpenCL 是一个异构计算开放标准。支持 OpenCL 的各厂商设备的硬件实现可能不一样,但是都可以通过 OpenCL 来调度计算单元完成计算任务。
new 和 make_shared 在内存上的区别 | C & C++
先 new 然后赋值的方式,会导致内存碎片化;make_shared 的方法分配内存,不会导致内存产生过多的碎片。
首先区分两个概念:new 和 operator new。new 是一个关键字,和 sizeof 一样,我们无法修改其具体功能。new 主要做三件事:调用 operator new 分配空间、初始化对象、返回指针。本文中这两个概念都有涉及,注意区分。
本文介绍了使用 CUDA 实现矩阵乘法的思路与优化方法。
本文介绍了 C++ 中的返回值优化。
本文介绍了 C++ 的对象在不同继承方式下的内存布局。
本文介绍了 C++ 中的 ABI 兼容问题与解决方法。
本文介绍了使用 CUDA 实现前缀和的思路与优化方法。
本文介绍了使用 CUDA 实现归约的思路与优化方法。