release/current/vega_2insts_2op__encodings_8hh_source.html

 /*

  * Copyright (c) 2016-2021 Advanced Micro Devices, Inc.

  * All rights reserved.

  *

  * Redistribution and use in source and binary forms, with or without

  * modification, are permitted provided that the following conditions are met:

  *

  * 1. Redistributions of source code must retain the above copyright notice,

  * this list of conditions and the following disclaimer.

  *

  * 2. Redistributions in binary form must reproduce the above copyright notice,

  * this list of conditions and the following disclaimer in the documentation

  * and/or other materials provided with the distribution.

  *

  * 3. Neither the name of the copyright holder nor the names of its

  * contributors may be used to endorse or promote products derived from this

  * software without specific prior written permission.

  *

  * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS"

  * AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE

  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE

  * ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT HOLDER OR CONTRIBUTORS BE

  * LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR

  * CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF

  * SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS

  * INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN

  * CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)

  * ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE

  * POSSIBILITY OF SUCH DAMAGE.

  */


 #ifndef __ARCH_VEGA_INSTS_OP_ENCODINGS_HH__

 #define __ARCH_VEGA_INSTS_OP_ENCODINGS_HH__


 #include "arch/amdgpu/vega/gpu_decoder.hh"

 #include "arch/amdgpu/vega/gpu_mem_helpers.hh"

 #include "arch/amdgpu/vega/insts/gpu_static_inst.hh"

 #include "arch/amdgpu/vega/operand.hh"

 #include "debug/GPUExec.hh"

 #include "debug/VEGA.hh"

 #include "mem/ruby/system/RubySystem.hh"


 namespace gem5

 {


 namespace VegaISA

 {

     struct BufferRsrcDescriptor

     {

         uint64_t baseAddr : 48;

         uint32_t stride : 14;

         uint32_t cacheSwizzle : 1;

         uint32_t swizzleEn : 1;

         uint32_t numRecords : 32;

         uint32_t dstSelX : 3;

         uint32_t dstSelY : 3;

         uint32_t dstSelZ : 3;

         uint32_t dstSelW : 3;

         uint32_t numFmt : 3;

         uint32_t dataFmt : 4;

         uint32_t elemSize : 2;

         uint32_t idxStride : 2;

         uint32_t addTidEn : 1;

         uint32_t atc : 1;

         uint32_t hashEn : 1;

         uint32_t heap : 1;

         uint32_t mType : 3;

         uint32_t type : 2;

     };


     // --- purely virtual instruction classes ---


     class Inst_SOP2 : public VEGAGPUStaticInst

     {

       public:

         Inst_SOP2(InFmt_SOP2*, const std::string &opcode);


         int instSize() const override;

         void generateDisassembly() override;


         void initOperandInfo() override;


       protected:

         // first instruction DWORD

         InFmt_SOP2 instData;

         // possible second DWORD

         InstFormat extData;

         uint32_t varSize;


       private:

         bool hasSecondDword(InFmt_SOP2 *);

     }; // Inst_SOP2


     class Inst_SOPK : public VEGAGPUStaticInst

     {

       public:

         Inst_SOPK(InFmt_SOPK*, const std::string &opcode);

         ~Inst_SOPK();


         int instSize() const override;

         void generateDisassembly() override;


         void initOperandInfo() override;


       protected:

         // first instruction DWORD

         InFmt_SOPK instData;

         // possible second DWORD

         InstFormat extData;

         uint32_t varSize;


       private:

         bool hasSecondDword(InFmt_SOPK *);

     }; // Inst_SOPK


     class Inst_SOP1 : public VEGAGPUStaticInst

     {

       public:

         Inst_SOP1(InFmt_SOP1*, const std::string &opcode);

         ~Inst_SOP1();


         int instSize() const override;

         void generateDisassembly() override;


         void initOperandInfo() override;


       protected:

         // first instruction DWORD

         InFmt_SOP1 instData;

         // possible second DWORD

         InstFormat extData;

         uint32_t varSize;


       private:

         bool hasSecondDword(InFmt_SOP1 *);

     }; // Inst_SOP1


     class Inst_SOPC : public VEGAGPUStaticInst

     {

       public:

         Inst_SOPC(InFmt_SOPC*, const std::string &opcode);

         ~Inst_SOPC();


         int instSize() const override;

         void generateDisassembly() override;


         void initOperandInfo() override;


       protected:

         // first instruction DWORD

         InFmt_SOPC instData;

         // possible second DWORD

         InstFormat extData;

         uint32_t varSize;


       private:

         bool hasSecondDword(InFmt_SOPC *);

     }; // Inst_SOPC


     class Inst_SOPP : public VEGAGPUStaticInst

     {

       public:

         Inst_SOPP(InFmt_SOPP*, const std::string &opcode);

         ~Inst_SOPP();


         int instSize() const override;

         void generateDisassembly() override;


         void initOperandInfo() override;


       protected:

         // first instruction DWORD

         InFmt_SOPP instData;

     }; // Inst_SOPP


     class Inst_SMEM : public VEGAGPUStaticInst

     {

       public:

         Inst_SMEM(InFmt_SMEM*, const std::string &opcode);

         ~Inst_SMEM();


         int instSize() const override;

         void generateDisassembly() override;


         void initOperandInfo() override;


       protected:

         template<int N>

         void

         initMemRead(GPUDynInstPtr gpuDynInst)

         {

             initMemReqScalarHelper<ScalarRegU32, N>(gpuDynInst,

                                                     MemCmd::ReadReq);

         }


         template<int N>

         void

         initMemWrite(GPUDynInstPtr gpuDynInst)

         {

             initMemReqScalarHelper<ScalarRegU32, N>(gpuDynInst,

                                                     MemCmd::WriteReq);

         }


         void

         calcAddr(GPUDynInstPtr gpu_dyn_inst, ConstScalarOperandU64 &addr,

                  ScalarRegU32 offset)

         {

             Addr vaddr = ((addr.rawData() + offset) & ~0x3);

             gpu_dyn_inst->scalarAddr = vaddr;

         }


         void

         calcAddr(GPUDynInstPtr gpu_dyn_inst,

                  ConstScalarOperandU128 &s_rsrc_desc, ScalarRegU32 offset)

         {

             BufferRsrcDescriptor rsrc_desc;

             ScalarRegU32 clamped_offset(offset);

             std::memcpy((void*)&rsrc_desc, s_rsrc_desc.rawDataPtr(),

                         sizeof(BufferRsrcDescriptor));


             if (!rsrc_desc.stride && offset >= rsrc_desc.numRecords) {

                 clamped_offset = rsrc_desc.numRecords;

             } else if (rsrc_desc.stride && offset

                        > (rsrc_desc.stride * rsrc_desc.numRecords)) {

                 clamped_offset = (rsrc_desc.stride * rsrc_desc.numRecords);

             }


             Addr vaddr = ((rsrc_desc.baseAddr + clamped_offset) & ~0x3);

             gpu_dyn_inst->scalarAddr = vaddr;

         }


         // first instruction DWORD

         InFmt_SMEM instData;

         // second instruction DWORD

         InFmt_SMEM_1 extData;

     }; // Inst_SMEM


     class Inst_VOP2 : public VEGAGPUStaticInst

     {

       public:

         Inst_VOP2(InFmt_VOP2*, const std::string &opcode);

         ~Inst_VOP2();


         int instSize() const override;

         void generateDisassembly() override;


         void initOperandInfo() override;


       protected:

         // first instruction DWORD

         InFmt_VOP2 instData;

         // possible second DWORD

         InstFormat extData;

         uint32_t varSize;


       private:

         bool hasSecondDword(InFmt_VOP2 *);

     }; // Inst_VOP2


     class Inst_VOP1 : public VEGAGPUStaticInst

     {

       public:

         Inst_VOP1(InFmt_VOP1*, const std::string &opcode);

         ~Inst_VOP1();


         int instSize() const override;

         void generateDisassembly() override;


         void initOperandInfo() override;


       protected:

         // first instruction DWORD

         InFmt_VOP1 instData;

         // possible second DWORD

         InstFormat extData;

         uint32_t varSize;


       private:

         bool hasSecondDword(InFmt_VOP1 *);

     }; // Inst_VOP1


     class Inst_VOPC : public VEGAGPUStaticInst

     {

       public:

         Inst_VOPC(InFmt_VOPC*, const std::string &opcode);

         ~Inst_VOPC();


         int instSize() const override;

         void generateDisassembly() override;


         void initOperandInfo() override;


       protected:

         // first instruction DWORD

         InFmt_VOPC instData;

         // possible second DWORD

         InstFormat extData;

         uint32_t varSize;


       private:

         bool hasSecondDword(InFmt_VOPC *);

     }; // Inst_VOPC


     class Inst_VINTRP : public VEGAGPUStaticInst

     {

       public:

         Inst_VINTRP(InFmt_VINTRP*, const std::string &opcode);

         ~Inst_VINTRP();


         int instSize() const override;


       protected:

         // first instruction DWORD

         InFmt_VINTRP instData;

     }; // Inst_VINTRP


     class Inst_VOP3A : public VEGAGPUStaticInst

     {

       public:

         Inst_VOP3A(InFmt_VOP3A*, const std::string &opcode, bool sgpr_dst);

         ~Inst_VOP3A();


         int instSize() const override;

         void generateDisassembly() override;


         void initOperandInfo() override;


       protected:

         // first instruction DWORD

         InFmt_VOP3A instData;

         // second instruction DWORD

         InFmt_VOP3_1 extData;


       private:

         bool hasSecondDword(InFmt_VOP3A *);

         const bool sgprDst;

     }; // Inst_VOP3A


     class Inst_VOP3B : public VEGAGPUStaticInst

     {

       public:

         Inst_VOP3B(InFmt_VOP3B*, const std::string &opcode);

         ~Inst_VOP3B();


         int instSize() const override;

         void generateDisassembly() override;


         void initOperandInfo() override;


       protected:

         // first instruction DWORD

         InFmt_VOP3B instData;

         // second instruction DWORD

         InFmt_VOP3_1 extData;


       private:

         bool hasSecondDword(InFmt_VOP3B *);

     }; // Inst_VOP3B


     class Inst_DS : public VEGAGPUStaticInst

     {

       public:

         Inst_DS(InFmt_DS*, const std::string &opcode);

         ~Inst_DS();


         int instSize() const override;

         void generateDisassembly() override;


         void initOperandInfo() override;


       protected:

         template<typename T>

         void

         initMemRead(GPUDynInstPtr gpuDynInst, Addr offset)

         {

             Wavefront *wf = gpuDynInst->wavefront();


             for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {

                 if (gpuDynInst->exec_mask[lane]) {

                     Addr vaddr = gpuDynInst->addr[lane] + offset;


                     (reinterpret_cast<T*>(gpuDynInst->d_data))[lane]

                         = wf->ldsChunk->read<T>(vaddr);

                 }

             }

         }


         template<int N>

         void

         initMemRead(GPUDynInstPtr gpuDynInst, Addr offset)

         {

             Wavefront *wf = gpuDynInst->wavefront();


             for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {

                 if (gpuDynInst->exec_mask[lane]) {

                     Addr vaddr = gpuDynInst->addr[lane] + offset;

                     for (int i = 0; i < N; ++i) {

                         (reinterpret_cast<VecElemU32*>(

                             gpuDynInst->d_data))[lane * N + i]

                             = wf->ldsChunk->read<VecElemU32>(

                                 vaddr + i*sizeof(VecElemU32));

                     }

                 }

             }

         }


         template<typename T>

         void

         initDualMemRead(GPUDynInstPtr gpuDynInst, Addr offset0, Addr offset1)

         {

             Wavefront *wf = gpuDynInst->wavefront();


             for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {

                 if (gpuDynInst->exec_mask[lane]) {

                     Addr vaddr0 = gpuDynInst->addr[lane] + offset0;

                     Addr vaddr1 = gpuDynInst->addr[lane] + offset1;


                     (reinterpret_cast<T*>(gpuDynInst->d_data))[lane * 2]

                         = wf->ldsChunk->read<T>(vaddr0);

                     (reinterpret_cast<T*>(gpuDynInst->d_data))[lane * 2 + 1]

                         = wf->ldsChunk->read<T>(vaddr1);

                 }

             }

         }


         template<typename T>

         void

         initMemWrite(GPUDynInstPtr gpuDynInst, Addr offset)

         {

             Wavefront *wf = gpuDynInst->wavefront();


             for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {

                 if (gpuDynInst->exec_mask[lane]) {

                     Addr vaddr = gpuDynInst->addr[lane] + offset;

                     wf->ldsChunk->write<T>(vaddr,

                         (reinterpret_cast<T*>(gpuDynInst->d_data))[lane]);

                 }

             }

         }


         template<int N>

         void

         initMemWrite(GPUDynInstPtr gpuDynInst, Addr offset)

         {

             Wavefront *wf = gpuDynInst->wavefront();


             for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {

                 if (gpuDynInst->exec_mask[lane]) {

                     Addr vaddr = gpuDynInst->addr[lane] + offset;

                     for (int i = 0; i < N; ++i) {

                         wf->ldsChunk->write<VecElemU32>(

                             vaddr + i*sizeof(VecElemU32),

                             (reinterpret_cast<VecElemU32*>(

                                 gpuDynInst->d_data))[lane * N + i]);

                     }

                 }

             }

         }


         template<typename T>

         void

         initDualMemWrite(GPUDynInstPtr gpuDynInst, Addr offset0, Addr offset1)

         {

             Wavefront *wf = gpuDynInst->wavefront();


             for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {

                 if (gpuDynInst->exec_mask[lane]) {

                     Addr vaddr0 = gpuDynInst->addr[lane] + offset0;

                     Addr vaddr1 = gpuDynInst->addr[lane] + offset1;

                     wf->ldsChunk->write<T>(vaddr0, (reinterpret_cast<T*>(

                         gpuDynInst->d_data))[lane * 2]);

                     wf->ldsChunk->write<T>(vaddr1, (reinterpret_cast<T*>(

                         gpuDynInst->d_data))[lane * 2 + 1]);

                 }

             }

         }


         template<typename T>

         void

         initAtomicAccess(GPUDynInstPtr gpuDynInst, Addr offset)

         {

             Wavefront *wf = gpuDynInst->wavefront();


             for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {

                 if (gpuDynInst->exec_mask[lane]) {

                     Addr vaddr = gpuDynInst->addr[lane] + offset;


                     AtomicOpFunctorPtr amo_op =

                         gpuDynInst->makeAtomicOpFunctor<T>(

                         &(reinterpret_cast<T*>(gpuDynInst->a_data))[lane],

                         &(reinterpret_cast<T*>(gpuDynInst->x_data))[lane]);


                     (reinterpret_cast<T*>(gpuDynInst->d_data))[lane]

                         = wf->ldsChunk->atomic<T>(vaddr, std::move(amo_op));

                 }

             }

         }


         void

         calcAddr(GPUDynInstPtr gpuDynInst, ConstVecOperandU32 &addr)

         {

             Wavefront *wf = gpuDynInst->wavefront();


             for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {

                 if (wf->execMask(lane)) {

                     gpuDynInst->addr.at(lane) = (Addr)addr[lane];

                 }

             }

         }


         // first instruction DWORD

         InFmt_DS instData;

         // second instruction DWORD

         InFmt_DS_1 extData;

     }; // Inst_DS


     class Inst_MUBUF : public VEGAGPUStaticInst

     {

       public:

         Inst_MUBUF(InFmt_MUBUF*, const std::string &opcode);

         ~Inst_MUBUF();


         int instSize() const override;

         void generateDisassembly() override;


         void initOperandInfo() override;


       protected:

         template<typename T>

         void

         initMemRead(GPUDynInstPtr gpuDynInst)

         {

             // temporarily modify exec_mask to supress memory accesses to oob

             // regions.  Only issue memory requests for lanes that have their

             // exec_mask set and are not out of bounds.

             VectorMask old_exec_mask = gpuDynInst->exec_mask;

             gpuDynInst->exec_mask &= ~oobMask;

             initMemReqHelper<T, 1>(gpuDynInst, MemCmd::ReadReq);

             gpuDynInst->exec_mask = old_exec_mask;

         }


         template<int N>

         void

         initMemRead(GPUDynInstPtr gpuDynInst)

         {

             // temporarily modify exec_mask to supress memory accesses to oob

             // regions.  Only issue memory requests for lanes that have their

             // exec_mask set and are not out of bounds.

             VectorMask old_exec_mask = gpuDynInst->exec_mask;

             gpuDynInst->exec_mask &= ~oobMask;

             initMemReqHelper<VecElemU32, N>(gpuDynInst, MemCmd::ReadReq);

             gpuDynInst->exec_mask = old_exec_mask;

         }


         template<typename T>

         void

         initMemWrite(GPUDynInstPtr gpuDynInst)

         {

             // temporarily modify exec_mask to supress memory accesses to oob

             // regions.  Only issue memory requests for lanes that have their

             // exec_mask set and are not out of bounds.

             VectorMask old_exec_mask = gpuDynInst->exec_mask;

             gpuDynInst->exec_mask &= ~oobMask;

             initMemReqHelper<T, 1>(gpuDynInst, MemCmd::WriteReq);

             gpuDynInst->exec_mask = old_exec_mask;

         }


         template<int N>

         void

         initMemWrite(GPUDynInstPtr gpuDynInst)

         {

             // temporarily modify exec_mask to supress memory accesses to oob

             // regions.  Only issue memory requests for lanes that have their

             // exec_mask set and are not out of bounds.

             VectorMask old_exec_mask = gpuDynInst->exec_mask;

             gpuDynInst->exec_mask &= ~oobMask;

             initMemReqHelper<VecElemU32, N>(gpuDynInst, MemCmd::WriteReq);

             gpuDynInst->exec_mask = old_exec_mask;

         }


         void

         injectGlobalMemFence(GPUDynInstPtr gpuDynInst)

         {

             // create request and set flags

             gpuDynInst->resetEntireStatusVector();

             gpuDynInst->setStatusVector(0, 1);

             RequestPtr req = std::make_shared<Request>(0, 0, 0,

                                        gpuDynInst->computeUnit()->

                                        requestorId(), 0,

                                        gpuDynInst->wfDynId);

             gpuDynInst->setRequestFlags(req);

             gpuDynInst->computeUnit()->

                 injectGlobalMemFence(gpuDynInst, false, req);

         }


         template<typename VOFF, typename VIDX, typename SRSRC, typename SOFF>

         void

         calcAddr(GPUDynInstPtr gpuDynInst, VOFF v_off, VIDX v_idx,

             SRSRC s_rsrc_desc, SOFF s_offset, int inst_offset)

         {

             Addr vaddr = 0;

             Addr base_addr = 0;

             Addr stride = 0;

             Addr buf_idx = 0;

             Addr buf_off = 0;

             Addr buffer_offset = 0;

             BufferRsrcDescriptor rsrc_desc;


             std::memcpy((void*)&rsrc_desc, s_rsrc_desc.rawDataPtr(),

                 sizeof(BufferRsrcDescriptor));


             base_addr = rsrc_desc.baseAddr;


             stride = rsrc_desc.addTidEn ? ((rsrc_desc.dataFmt << 14)

                 + rsrc_desc.stride) : rsrc_desc.stride;


             for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {

                 if (gpuDynInst->exec_mask[lane]) {

                     vaddr = base_addr + s_offset.rawData();

                     buf_idx = v_idx[lane] + (rsrc_desc.addTidEn ? lane : 0);


                     buf_off = v_off[lane] + inst_offset;


                     if (rsrc_desc.swizzleEn) {

                         Addr idx_stride = 8 << rsrc_desc.idxStride;

                         Addr elem_size = 2 << rsrc_desc.elemSize;

                         Addr idx_msb = buf_idx / idx_stride;

                         Addr idx_lsb = buf_idx % idx_stride;

                         Addr off_msb = buf_off / elem_size;

                         Addr off_lsb = buf_off % elem_size;

                         DPRINTF(VEGA, "mubuf swizzled lane %d: "

                                 "idx_stride = %llx, elem_size = %llx, "

                                 "idx_msb = %llx, idx_lsb = %llx, "

                                 "off_msb = %llx, off_lsb = %llx\n",

                                 lane, idx_stride, elem_size, idx_msb, idx_lsb,

                                 off_msb, off_lsb);


                         buffer_offset =(idx_msb * stride + off_msb * elem_size)

                             * idx_stride + idx_lsb * elem_size + off_lsb;

                     } else {

                         buffer_offset = buf_off + stride * buf_idx;

                     }


                     if (rsrc_desc.stride == 0 || !rsrc_desc.swizzleEn) {

                         if (buffer_offset >=

                             rsrc_desc.numRecords - s_offset.rawData()) {

                             DPRINTF(VEGA, "mubuf out-of-bounds condition 1: "

                                     "lane = %d, buffer_offset = %llx, "

                                     "const_stride = %llx, "

                                     "const_num_records = %llx\n",

                                     lane, buf_off + stride * buf_idx,

                                     stride, rsrc_desc.numRecords);

                             oobMask.set(lane);

                             continue;

                         }

                     }


                     if (rsrc_desc.stride != 0 && rsrc_desc.swizzleEn) {

                         if (buf_idx >= rsrc_desc.numRecords ||

                             buf_off >= stride) {

                             DPRINTF(VEGA, "mubuf out-of-bounds condition 2: "

                                     "lane = %d, offset = %llx, "

                                     "index = %llx, "

                                     "const_num_records = %llx\n",

                                     lane, buf_off, buf_idx,

                                     rsrc_desc.numRecords);

                             oobMask.set(lane);

                             continue;

                         }

                     }


                     vaddr += buffer_offset;


                     DPRINTF(VEGA, "Calculating mubuf address for lane %d: "

                             "vaddr = %llx, base_addr = %llx, "

                             "stride = %llx, buf_idx = %llx, buf_off = %llx\n",

                             lane, vaddr, base_addr, stride,

                             buf_idx, buf_off);

                     gpuDynInst->addr.at(lane) = vaddr;

                 }

             }

         }


         // first instruction DWORD

         InFmt_MUBUF instData;

         // second instruction DWORD

         InFmt_MUBUF_1 extData;

         // Mask of lanes with out-of-bounds accesses.  Needs to be tracked

         // seperately from the exec_mask so that we remember to write zero

         // to the registers associated with out of bounds lanes.

         VectorMask oobMask;

     }; // Inst_MUBUF


     class Inst_MTBUF : public VEGAGPUStaticInst

     {

       public:

         Inst_MTBUF(InFmt_MTBUF*, const std::string &opcode);

         ~Inst_MTBUF();


         int instSize() const override;

         void initOperandInfo() override;


       protected:

         // first instruction DWORD

         InFmt_MTBUF instData;

         // second instruction DWORD

         InFmt_MTBUF_1 extData;


       private:

         bool hasSecondDword(InFmt_MTBUF *);

     }; // Inst_MTBUF


     class Inst_MIMG : public VEGAGPUStaticInst

     {

       public:

         Inst_MIMG(InFmt_MIMG*, const std::string &opcode);

         ~Inst_MIMG();


         int instSize() const override;

         void initOperandInfo() override;


       protected:

         // first instruction DWORD

         InFmt_MIMG instData;

         // second instruction DWORD

         InFmt_MIMG_1 extData;

     }; // Inst_MIMG


     class Inst_EXP : public VEGAGPUStaticInst

     {

       public:

         Inst_EXP(InFmt_EXP*, const std::string &opcode);

         ~Inst_EXP();


         int instSize() const override;

         void initOperandInfo() override;


       protected:

         // first instruction DWORD

         InFmt_EXP instData;

         // second instruction DWORD

         InFmt_EXP_1 extData;

     }; // Inst_EXP


     class Inst_FLAT : public VEGAGPUStaticInst

     {

       public:

         Inst_FLAT(InFmt_FLAT*, const std::string &opcode);

         ~Inst_FLAT();


         int instSize() const override;

         void generateDisassembly() override;


         void initOperandInfo() override;


       protected:

         template<typename T>

         void

         initMemRead(GPUDynInstPtr gpuDynInst)

         {

             if (gpuDynInst->executedAs() == enums::SC_GLOBAL) {

                 initMemReqHelper<T, 1>(gpuDynInst, MemCmd::ReadReq);

             } else if (gpuDynInst->executedAs() == enums::SC_GROUP) {

                 Wavefront *wf = gpuDynInst->wavefront();

                 for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {

                     if (gpuDynInst->exec_mask[lane]) {

                         Addr vaddr = gpuDynInst->addr[lane];

                         (reinterpret_cast<T*>(gpuDynInst->d_data))[lane]

                             = wf->ldsChunk->read<T>(vaddr);

                     }

                 }

             }

         }


         template<int N>

         void

         initMemRead(GPUDynInstPtr gpuDynInst)

         {

             if (gpuDynInst->executedAs() == enums::SC_GLOBAL) {

                 initMemReqHelper<VecElemU32, N>(gpuDynInst, MemCmd::ReadReq);

             } else if (gpuDynInst->executedAs() == enums::SC_GROUP) {

                 Wavefront *wf = gpuDynInst->wavefront();

                 for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {

                     if (gpuDynInst->exec_mask[lane]) {

                         Addr vaddr = gpuDynInst->addr[lane];

                         for (int i = 0; i < N; ++i) {

                             (reinterpret_cast<VecElemU32*>(

                                 gpuDynInst->d_data))[lane * N + i]

                                 = wf->ldsChunk->read<VecElemU32>(

                                         vaddr + i*sizeof(VecElemU32));

                         }

                     }

                 }

             }

         }


         template<typename T>

         void

         initMemWrite(GPUDynInstPtr gpuDynInst)

         {

             if (gpuDynInst->executedAs() == enums::SC_GLOBAL) {

                 initMemReqHelper<T, 1>(gpuDynInst, MemCmd::WriteReq);

             } else if (gpuDynInst->executedAs() == enums::SC_GROUP) {

                 Wavefront *wf = gpuDynInst->wavefront();

                 for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {

                     if (gpuDynInst->exec_mask[lane]) {

                         Addr vaddr = gpuDynInst->addr[lane];

                         wf->ldsChunk->write<T>(vaddr,

                             (reinterpret_cast<T*>(gpuDynInst->d_data))[lane]);

                     }

                 }

             }

         }


         template<int N>

         void

         initMemWrite(GPUDynInstPtr gpuDynInst)

         {

             if (gpuDynInst->executedAs() == enums::SC_GLOBAL) {

                 initMemReqHelper<VecElemU32, N>(gpuDynInst, MemCmd::WriteReq);

             } else if (gpuDynInst->executedAs() == enums::SC_GROUP) {

                 Wavefront *wf = gpuDynInst->wavefront();

                 for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {

                     if (gpuDynInst->exec_mask[lane]) {

                         Addr vaddr = gpuDynInst->addr[lane];

                         for (int i = 0; i < N; ++i) {

                             wf->ldsChunk->write<VecElemU32>(

                                 vaddr + i*sizeof(VecElemU32),

                                 (reinterpret_cast<VecElemU32*>(

                                     gpuDynInst->d_data))[lane * N + i]);

                         }

                     }

                 }

             }

         }


         template<typename T>

         void

         initAtomicAccess(GPUDynInstPtr gpuDynInst)

         {

             if (gpuDynInst->executedAs() == enums::SC_GLOBAL) {

                 initMemReqHelper<T, 1>(gpuDynInst, MemCmd::SwapReq, true);

             } else if (gpuDynInst->executedAs() == enums::SC_GROUP) {

                 Wavefront *wf = gpuDynInst->wavefront();

                 for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {

                     if (gpuDynInst->exec_mask[lane]) {

                         Addr vaddr = gpuDynInst->addr[lane];

                         auto amo_op =

                             gpuDynInst->makeAtomicOpFunctor<T>(

                                 &(reinterpret_cast<T*>(

                                     gpuDynInst->a_data))[lane],

                                 &(reinterpret_cast<T*>(

                                     gpuDynInst->x_data))[lane]);


                         T tmp = wf->ldsChunk->read<T>(vaddr);

                         (*amo_op)(reinterpret_cast<uint8_t *>(&tmp));

                         wf->ldsChunk->write<T>(vaddr, tmp);

                         (reinterpret_cast<T*>(gpuDynInst->d_data))[lane] = tmp;

                     }

                 }

             }

         }


         void

         calcAddr(GPUDynInstPtr gpuDynInst, ConstVecOperandU64 &vaddr,

                  ScalarRegU32 saddr, ScalarRegI32 offset)

         {

             // Offset is a 13-bit field w/the following meanings:

             // In Flat instructions, offset is a 12-bit unsigned number

             // In Global/Scratch instructions, offset is a 13-bit signed number

             if (isFlat()) {

                 offset = offset & 0xfff;

             } else {

                 offset = (ScalarRegI32)sext<13>(offset);

             }

             // If saddr = 0x7f there is no scalar reg to read and address will

             // be a 64-bit address. Otherwise, saddr is the reg index for a

             // scalar reg used as the base address for a 32-bit address.

             if ((saddr == 0x7f && isFlatGlobal()) || isFlat()) {

                 calcAddrVgpr(gpuDynInst, vaddr, offset);

             } else {

                 // Assume we are operating in 64-bit mode and read a pair of

                 // SGPRs for the address base.

                 ConstScalarOperandU64 sbase(gpuDynInst, saddr);

                 sbase.read();


                 calcAddrSgpr(gpuDynInst, vaddr, sbase, offset);

             }


             if (isFlat()) {

                 gpuDynInst->resolveFlatSegment(gpuDynInst->exec_mask);

             } else {

                 gpuDynInst->staticInstruction()->executed_as =

                     enums::SC_GLOBAL;

             }

         }


         void

         issueRequestHelper(GPUDynInstPtr gpuDynInst)

         {

             if ((gpuDynInst->executedAs() == enums::SC_GLOBAL && isFlat())

                     || isFlatGlobal()) {

                 gpuDynInst->computeUnit()->globalMemoryPipe

                     .issueRequest(gpuDynInst);

             } else if (gpuDynInst->executedAs() == enums::SC_GROUP) {

                 assert(isFlat());

                 gpuDynInst->computeUnit()->localMemoryPipe

                     .issueRequest(gpuDynInst);

             } else {

                 fatal("Unsupported scope for flat instruction.\n");

             }

         }


         // first instruction DWORD

         InFmt_FLAT instData;

         // second instruction DWORD

         InFmt_FLAT_1 extData;


       private:

         void initFlatOperandInfo();

         void initGlobalOperandInfo();


         void generateFlatDisassembly();

         void generateGlobalDisassembly();


         void

         calcAddrSgpr(GPUDynInstPtr gpuDynInst, ConstVecOperandU64 &vaddr,

                      ConstScalarOperandU64 &saddr, ScalarRegI32 offset)

         {

             // Use SGPR pair as a base address and add VGPR-offset and

             // instruction offset. The VGPR-offset is always 32-bits so we

             // mask any upper bits from the vaddr.

             for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {

                 if (gpuDynInst->exec_mask[lane]) {

                     gpuDynInst->addr.at(lane) =

                         saddr.rawData() + (vaddr[lane] & 0xffffffff) + offset;

                 }

             }

         }


         void

         calcAddrVgpr(GPUDynInstPtr gpuDynInst, ConstVecOperandU64 &addr,

                      ScalarRegI32 offset)

         {

             for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {

                 if (gpuDynInst->exec_mask[lane]) {

                     gpuDynInst->addr.at(lane) = addr[lane] + offset;

                 }

             }

         }

     }; // Inst_FLAT

 } // namespace VegaISA

 } // namespace gem5


 #endif // __ARCH_VEGA_INSTS_OP_ENCODINGS_HH__

RubySystem.hh

gpu_static_inst.hh

DPRINTF
#define DPRINTF(x,...)
Definition: trace.hh:186

gem5::GPUStaticInst::opcode
const std::string & opcode() const
Definition: gpu_static_inst.hh:263

gem5::GPUStaticInst::isFlat
bool isFlat() const
Definition: gpu_static_inst.hh:131

gem5::GPUStaticInst::isFlatGlobal
bool isFlatGlobal() const
Definition: gpu_static_inst.hh:132

gem5::LdsChunk::write
void write(const uint32_t index, const T value)
a write operation
Definition: lds_state.hh:90

gem5::LdsChunk::atomic
T atomic(const uint32_t index, AtomicOpFunctorPtr amoOp)
an atomic operation
Definition: lds_state.hh:109

gem5::LdsChunk::read
T read(const uint32_t index)
a read operation
Definition: lds_state.hh:71

gem5::MemCmd::SwapReq
@ SwapReq
Definition: packet.hh:119

gem5::MemCmd::WriteReq
@ WriteReq
Definition: packet.hh:89

gem5::MemCmd::ReadReq
@ ReadReq
Definition: packet.hh:86

gem5::VegaISA::Inst_DS
Definition: op_encodings.hh:390

gem5::VegaISA::Inst_DS::instData
InFmt_DS instData
Definition: op_encodings.hh:541

gem5::VegaISA::Inst_DS::extData
InFmt_DS_1 extData
Definition: op_encodings.hh:543

gem5::VegaISA::Inst_DS::initMemRead
void initMemRead(GPUDynInstPtr gpuDynInst, Addr offset)
Definition: op_encodings.hh:403

gem5::VegaISA::Inst_DS::initOperandInfo
void initOperandInfo() override
Definition: op_encodings.cc:1200

gem5::VegaISA::Inst_DS::~Inst_DS
~Inst_DS()
Definition: op_encodings.cc:1195

gem5::VegaISA::Inst_DS::initDualMemRead
void initDualMemRead(GPUDynInstPtr gpuDynInst, Addr offset0, Addr offset1)
Definition: op_encodings.hh:438

gem5::VegaISA::Inst_DS::initMemWrite
void initMemWrite(GPUDynInstPtr gpuDynInst, Addr offset)
Definition: op_encodings.hh:457

gem5::VegaISA::Inst_DS::Inst_DS
Inst_DS(InFmt_DS *, const std::string &opcode)
Definition: op_encodings.cc:1183

gem5::VegaISA::Inst_DS::calcAddr
void calcAddr(GPUDynInstPtr gpuDynInst, ConstVecOperandU32 &addr)
Definition: op_encodings.hh:529

gem5::VegaISA::Inst_DS::generateDisassembly
void generateDisassembly() override
Definition: op_encodings.cc:1229

gem5::VegaISA::Inst_DS::instSize
int instSize() const override
Definition: op_encodings.cc:1223

gem5::VegaISA::Inst_DS::initAtomicAccess
void initAtomicAccess(GPUDynInstPtr gpuDynInst, Addr offset)
Definition: op_encodings.hh:509

gem5::VegaISA::Inst_DS::initDualMemWrite
void initDualMemWrite(GPUDynInstPtr gpuDynInst, Addr offset0, Addr offset1)
Definition: op_encodings.hh:491

gem5::VegaISA::Inst_EXP
Definition: op_encodings.hh:793

gem5::VegaISA::Inst_EXP::Inst_EXP
Inst_EXP(InFmt_EXP *, const std::string &opcode)
Definition: op_encodings.cc:1503

gem5::VegaISA::Inst_EXP::~Inst_EXP
~Inst_EXP()
Definition: op_encodings.cc:1513

gem5::VegaISA::Inst_EXP::instData
InFmt_EXP instData
Definition: op_encodings.hh:803

gem5::VegaISA::Inst_EXP::initOperandInfo
void initOperandInfo() override
Definition: op_encodings.cc:1518

gem5::VegaISA::Inst_EXP::instSize
int instSize() const override
Definition: op_encodings.cc:1536

gem5::VegaISA::Inst_EXP::extData
InFmt_EXP_1 extData
Definition: op_encodings.hh:805

gem5::VegaISA::Inst_FLAT
Definition: op_encodings.hh:809

gem5::VegaISA::Inst_FLAT::generateFlatDisassembly
void generateFlatDisassembly()
Definition: op_encodings.cc:1706

gem5::VegaISA::Inst_FLAT::~Inst_FLAT
~Inst_FLAT()
Definition: op_encodings.cc:1568

gem5::VegaISA::Inst_FLAT::instData
InFmt_FLAT instData
Definition: op_encodings.hh:978

gem5::VegaISA::Inst_FLAT::initFlatOperandInfo
void initFlatOperandInfo()
Definition: op_encodings.cc:1588

gem5::VegaISA::Inst_FLAT::calcAddrSgpr
void calcAddrSgpr(GPUDynInstPtr gpuDynInst, ConstVecOperandU64 &vaddr, ConstScalarOperandU64 &saddr, ScalarRegI32 offset)
Definition: op_encodings.hh:990

gem5::VegaISA::Inst_FLAT::Inst_FLAT
Inst_FLAT(InFmt_FLAT *, const std::string &opcode)
Definition: op_encodings.cc:1543

gem5::VegaISA::Inst_FLAT::initGlobalOperandInfo
void initGlobalOperandInfo()
Definition: op_encodings.cc:1625

gem5::VegaISA::Inst_FLAT::extData
InFmt_FLAT_1 extData
Definition: op_encodings.hh:980

gem5::VegaISA::Inst_FLAT::initMemRead
void initMemRead(GPUDynInstPtr gpuDynInst)
Definition: op_encodings.hh:822

gem5::VegaISA::Inst_FLAT::generateDisassembly
void generateDisassembly() override
Definition: op_encodings.cc:1691

gem5::VegaISA::Inst_FLAT::calcAddrVgpr
void calcAddrVgpr(GPUDynInstPtr gpuDynInst, ConstVecOperandU64 &addr, ScalarRegI32 offset)
Definition: op_encodings.hh:1005

gem5::VegaISA::Inst_FLAT::initOperandInfo
void initOperandInfo() override
Definition: op_encodings.cc:1573

gem5::VegaISA::Inst_FLAT::issueRequestHelper
void issueRequestHelper(GPUDynInstPtr gpuDynInst)
Definition: op_encodings.hh:962

gem5::VegaISA::Inst_FLAT::initAtomicAccess
void initAtomicAccess(GPUDynInstPtr gpuDynInst)
Definition: op_encodings.hh:902

gem5::VegaISA::Inst_FLAT::calcAddr
void calcAddr(GPUDynInstPtr gpuDynInst, ConstVecOperandU64 &vaddr, ScalarRegU32 saddr, ScalarRegI32 offset)
Definition: op_encodings.hh:928

gem5::VegaISA::Inst_FLAT::initMemWrite
void initMemWrite(GPUDynInstPtr gpuDynInst)
Definition: op_encodings.hh:862

gem5::VegaISA::Inst_FLAT::generateGlobalDisassembly
void generateGlobalDisassembly()
Definition: op_encodings.cc:1723

gem5::VegaISA::Inst_FLAT::instSize
int instSize() const override
Definition: op_encodings.cc:1685

gem5::VegaISA::Inst_MIMG
Definition: op_encodings.hh:777

gem5::VegaISA::Inst_MIMG::~Inst_MIMG
~Inst_MIMG()
Definition: op_encodings.cc:1444

gem5::VegaISA::Inst_MIMG::instSize
int instSize() const override
Definition: op_encodings.cc:1496

gem5::VegaISA::Inst_MIMG::initOperandInfo
void initOperandInfo() override
Definition: op_encodings.cc:1449

gem5::VegaISA::Inst_MIMG::Inst_MIMG
Inst_MIMG(InFmt_MIMG *, const std::string &opcode)
Definition: op_encodings.cc:1428

gem5::VegaISA::Inst_MIMG::extData
InFmt_MIMG_1 extData
Definition: op_encodings.hh:789

gem5::VegaISA::Inst_MIMG::instData
InFmt_MIMG instData
Definition: op_encodings.hh:787

gem5::VegaISA::Inst_MTBUF
Definition: op_encodings.hh:758

gem5::VegaISA::Inst_MTBUF::~Inst_MTBUF
~Inst_MTBUF()
Definition: op_encodings.cc:1372

gem5::VegaISA::Inst_MTBUF::extData
InFmt_MTBUF_1 extData
Definition: op_encodings.hh:770

gem5::VegaISA::Inst_MTBUF::instSize
int instSize() const override
Definition: op_encodings.cc:1421

gem5::VegaISA::Inst_MTBUF::hasSecondDword
bool hasSecondDword(InFmt_MTBUF *)

gem5::VegaISA::Inst_MTBUF::instData
InFmt_MTBUF instData
Definition: op_encodings.hh:768

gem5::VegaISA::Inst_MTBUF::initOperandInfo
void initOperandInfo() override
Definition: op_encodings.cc:1377

gem5::VegaISA::Inst_MTBUF::Inst_MTBUF
Inst_MTBUF(InFmt_MTBUF *, const std::string &opcode)
Definition: op_encodings.cc:1356

gem5::VegaISA::Inst_MUBUF
Definition: op_encodings.hh:547

gem5::VegaISA::Inst_MUBUF::oobMask
VectorMask oobMask
Definition: op_encodings.hh:754

gem5::VegaISA::Inst_MUBUF::initOperandInfo
void initOperandInfo() override
Definition: op_encodings.cc:1284

gem5::VegaISA::Inst_MUBUF::generateDisassembly
void generateDisassembly() override
Definition: op_encodings.cc:1337

gem5::VegaISA::Inst_MUBUF::~Inst_MUBUF
~Inst_MUBUF()
Definition: op_encodings.cc:1279

gem5::VegaISA::Inst_MUBUF::initMemWrite
void initMemWrite(GPUDynInstPtr gpuDynInst)
Definition: op_encodings.hh:587

gem5::VegaISA::Inst_MUBUF::injectGlobalMemFence
void injectGlobalMemFence(GPUDynInstPtr gpuDynInst)
Definition: op_encodings.hh:612

gem5::VegaISA::Inst_MUBUF::extData
InFmt_MUBUF_1 extData
Definition: op_encodings.hh:750

gem5::VegaISA::Inst_MUBUF::instData
InFmt_MUBUF instData
Definition: op_encodings.hh:748

gem5::VegaISA::Inst_MUBUF::calcAddr
void calcAddr(GPUDynInstPtr gpuDynInst, VOFF v_off, VIDX v_idx, SRSRC s_rsrc_desc, SOFF s_offset, int inst_offset)
MUBUF insructions calculate their addresses as follows:
Definition: op_encodings.hh:648

gem5::VegaISA::Inst_MUBUF::initMemRead
void initMemRead(GPUDynInstPtr gpuDynInst)
Definition: op_encodings.hh:560

gem5::VegaISA::Inst_MUBUF::Inst_MUBUF
Inst_MUBUF(InFmt_MUBUF *, const std::string &opcode)
Definition: op_encodings.cc:1263

gem5::VegaISA::Inst_MUBUF::instSize
int instSize() const override
Definition: op_encodings.cc:1331

gem5::VegaISA::Inst_SMEM
Definition: op_encodings.hh:177

gem5::VegaISA::Inst_SMEM::initOperandInfo
void initOperandInfo() override
Definition: op_encodings.cc:513

gem5::VegaISA::Inst_SMEM::~Inst_SMEM
~Inst_SMEM()
Definition: op_encodings.cc:508

gem5::VegaISA::Inst_SMEM::instData
InFmt_SMEM instData
Definition: op_encodings.hh:252

gem5::VegaISA::Inst_SMEM::extData
InFmt_SMEM_1 extData
Definition: op_encodings.hh:254

gem5::VegaISA::Inst_SMEM::calcAddr
void calcAddr(GPUDynInstPtr gpu_dyn_inst, ConstScalarOperandU128 &s_rsrc_desc, ScalarRegU32 offset)
For s_buffer_load_dword/s_buffer_store_dword instruction addresses.
Definition: op_encodings.hh:227

gem5::VegaISA::Inst_SMEM::Inst_SMEM
Inst_SMEM(InFmt_SMEM *, const std::string &opcode)
Definition: op_encodings.cc:492

gem5::VegaISA::Inst_SMEM::generateDisassembly
void generateDisassembly() override
Definition: op_encodings.cc:565

gem5::VegaISA::Inst_SMEM::initMemRead
void initMemRead(GPUDynInstPtr gpuDynInst)
initiate a memory read access for N dwords
Definition: op_encodings.hh:193

gem5::VegaISA::Inst_SMEM::instSize
int instSize() const override
Definition: op_encodings.cc:559

gem5::VegaISA::Inst_SMEM::calcAddr
void calcAddr(GPUDynInstPtr gpu_dyn_inst, ConstScalarOperandU64 &addr, ScalarRegU32 offset)
For normal s_load_dword/s_store_dword instruction addresses.
Definition: op_encodings.hh:214

gem5::VegaISA::Inst_SMEM::initMemWrite
void initMemWrite(GPUDynInstPtr gpuDynInst)
initiate a memory write access for N dwords
Definition: op_encodings.hh:204

gem5::VegaISA::Inst_SOP1
Definition: op_encodings.hh:117

gem5::VegaISA::Inst_SOP1::instSize
int instSize() const override
Definition: op_encodings.cc:279

gem5::VegaISA::Inst_SOP1::generateDisassembly
void generateDisassembly() override
Definition: op_encodings.cc:294

gem5::VegaISA::Inst_SOP1::initOperandInfo
void initOperandInfo() override
Definition: op_encodings.cc:245

gem5::VegaISA::Inst_SOP1::Inst_SOP1
Inst_SOP1(InFmt_SOP1 *, const std::string &opcode)
Definition: op_encodings.cc:223

gem5::VegaISA::Inst_SOP1::varSize
uint32_t varSize
Definition: op_encodings.hh:132

gem5::VegaISA::Inst_SOP1::instData
InFmt_SOP1 instData
Definition: op_encodings.hh:129

gem5::VegaISA::Inst_SOP1::~Inst_SOP1
~Inst_SOP1()
Definition: op_encodings.cc:240

gem5::VegaISA::Inst_SOP1::hasSecondDword
bool hasSecondDword(InFmt_SOP1 *)
Definition: op_encodings.cc:285

gem5::VegaISA::Inst_SOP1::extData
InstFormat extData
Definition: op_encodings.hh:131

gem5::VegaISA::Inst_SOP2
Definition: op_encodings.hh:74

gem5::VegaISA::Inst_SOP2::varSize
uint32_t varSize
Definition: op_encodings.hh:88

gem5::VegaISA::Inst_SOP2::hasSecondDword
bool hasSecondDword(InFmt_SOP2 *)
Definition: op_encodings.cc:91

gem5::VegaISA::Inst_SOP2::generateDisassembly
void generateDisassembly() override
Definition: op_encodings.cc:103

gem5::VegaISA::Inst_SOP2::Inst_SOP2
Inst_SOP2(InFmt_SOP2 *, const std::string &opcode)
Definition: op_encodings.cc:43

gem5::VegaISA::Inst_SOP2::initOperandInfo
void initOperandInfo() override
Definition: op_encodings.cc:61

gem5::VegaISA::Inst_SOP2::instData
InFmt_SOP2 instData
Definition: op_encodings.hh:85

gem5::VegaISA::Inst_SOP2::extData
InstFormat extData
Definition: op_encodings.hh:87

gem5::VegaISA::Inst_SOP2::instSize
int instSize() const override
Definition: op_encodings.cc:85

gem5::VegaISA::Inst_SOPC
Definition: op_encodings.hh:139

gem5::VegaISA::Inst_SOPC::~Inst_SOPC
~Inst_SOPC()
Definition: op_encodings.cc:329

gem5::VegaISA::Inst_SOPC::extData
InstFormat extData
Definition: op_encodings.hh:153

gem5::VegaISA::Inst_SOPC::instData
InFmt_SOPC instData
Definition: op_encodings.hh:151

gem5::VegaISA::Inst_SOPC::instSize
int instSize() const override
Definition: op_encodings.cc:351

gem5::VegaISA::Inst_SOPC::hasSecondDword
bool hasSecondDword(InFmt_SOPC *)
Definition: op_encodings.cc:357

gem5::VegaISA::Inst_SOPC::generateDisassembly
void generateDisassembly() override
Definition: op_encodings.cc:369

gem5::VegaISA::Inst_SOPC::varSize
uint32_t varSize
Definition: op_encodings.hh:154

gem5::VegaISA::Inst_SOPC::initOperandInfo
void initOperandInfo() override
Definition: op_encodings.cc:334

gem5::VegaISA::Inst_SOPC::Inst_SOPC
Inst_SOPC(InFmt_SOPC *, const std::string &opcode)
Definition: op_encodings.cc:312

gem5::VegaISA::Inst_SOPK
Definition: op_encodings.hh:95

gem5::VegaISA::Inst_SOPK::Inst_SOPK
Inst_SOPK(InFmt_SOPK *, const std::string &opcode)
Definition: op_encodings.cc:128

gem5::VegaISA::Inst_SOPK::instSize
int instSize() const override
Definition: op_encodings.cc:178

gem5::VegaISA::Inst_SOPK::generateDisassembly
void generateDisassembly() override
Definition: op_encodings.cc:201

gem5::VegaISA::Inst_SOPK::~Inst_SOPK
~Inst_SOPK()
Definition: op_encodings.cc:145

gem5::VegaISA::Inst_SOPK::varSize
uint32_t varSize
Definition: op_encodings.hh:110

gem5::VegaISA::Inst_SOPK::extData
InstFormat extData
Definition: op_encodings.hh:109

gem5::VegaISA::Inst_SOPK::instData
InFmt_SOPK instData
Definition: op_encodings.hh:107

gem5::VegaISA::Inst_SOPK::hasSecondDword
bool hasSecondDword(InFmt_SOPK *)
Definition: op_encodings.cc:184

gem5::VegaISA::Inst_SOPK::initOperandInfo
void initOperandInfo() override
Definition: op_encodings.cc:150

gem5::VegaISA::Inst_SOPP
Definition: op_encodings.hh:161

gem5::VegaISA::Inst_SOPP::generateDisassembly
void generateDisassembly() override
Definition: op_encodings.cc:437

gem5::VegaISA::Inst_SOPP::instData
InFmt_SOPP instData
Definition: op_encodings.hh:173

gem5::VegaISA::Inst_SOPP::initOperandInfo
void initOperandInfo() override
Definition: op_encodings.cc:407

gem5::VegaISA::Inst_SOPP::~Inst_SOPP
~Inst_SOPP()
Definition: op_encodings.cc:402

gem5::VegaISA::Inst_SOPP::instSize
int instSize() const override
Definition: op_encodings.cc:431

gem5::VegaISA::Inst_SOPP::Inst_SOPP
Inst_SOPP(InFmt_SOPP *, const std::string &opcode)
Definition: op_encodings.cc:393

gem5::VegaISA::Inst_VINTRP
Definition: op_encodings.hh:324

gem5::VegaISA::Inst_VINTRP::instSize
int instSize() const override
Definition: op_encodings.cc:949

gem5::VegaISA::Inst_VINTRP::Inst_VINTRP
Inst_VINTRP(InFmt_VINTRP *, const std::string &opcode)
Definition: op_encodings.cc:937

gem5::VegaISA::Inst_VINTRP::instData
InFmt_VINTRP instData
Definition: op_encodings.hh:333

gem5::VegaISA::Inst_VINTRP::~Inst_VINTRP
~Inst_VINTRP()
Definition: op_encodings.cc:944

gem5::VegaISA::Inst_VOP1
Definition: op_encodings.hh:280

gem5::VegaISA::Inst_VOP1::varSize
uint32_t varSize
Definition: op_encodings.hh:295

gem5::VegaISA::Inst_VOP1::Inst_VOP1
Inst_VOP1(InFmt_VOP1 *, const std::string &opcode)
Definition: op_encodings.cc:736

gem5::VegaISA::Inst_VOP1::generateDisassembly
void generateDisassembly() override
Definition: op_encodings.cc:822

gem5::VegaISA::Inst_VOP1::instData
InFmt_VOP1 instData
Definition: op_encodings.hh:292

gem5::VegaISA::Inst_VOP1::initOperandInfo
void initOperandInfo() override
Definition: op_encodings.cc:761

gem5::VegaISA::Inst_VOP1::instSize
int instSize() const override
Definition: op_encodings.cc:797

gem5::VegaISA::Inst_VOP1::hasSecondDword
bool hasSecondDword(InFmt_VOP1 *)
Definition: op_encodings.cc:803

gem5::VegaISA::Inst_VOP1::~Inst_VOP1
~Inst_VOP1()
Definition: op_encodings.cc:756

gem5::VegaISA::Inst_VOP1::extData
InstFormat extData
Definition: op_encodings.hh:294

gem5::VegaISA::Inst_VOP2
Definition: op_encodings.hh:258

gem5::VegaISA::Inst_VOP2::initOperandInfo
void initOperandInfo() override
Definition: op_encodings.cc:626

gem5::VegaISA::Inst_VOP2::instSize
int instSize() const override
Definition: op_encodings.cc:665

gem5::VegaISA::Inst_VOP2::extData
InstFormat extData
Definition: op_encodings.hh:272

gem5::VegaISA::Inst_VOP2::varSize
uint32_t varSize
Definition: op_encodings.hh:273

gem5::VegaISA::Inst_VOP2::~Inst_VOP2
~Inst_VOP2()
Definition: op_encodings.cc:621

gem5::VegaISA::Inst_VOP2::instData
InFmt_VOP2 instData
Definition: op_encodings.hh:270

gem5::VegaISA::Inst_VOP2::hasSecondDword
bool hasSecondDword(InFmt_VOP2 *)
Definition: op_encodings.cc:671

gem5::VegaISA::Inst_VOP2::Inst_VOP2
Inst_VOP2(InFmt_VOP2 *, const std::string &opcode)
Definition: op_encodings.cc:601

gem5::VegaISA::Inst_VOP2::generateDisassembly
void generateDisassembly() override
Definition: op_encodings.cc:696

gem5::VegaISA::Inst_VOP3A
Definition: op_encodings.hh:337

gem5::VegaISA::Inst_VOP3A::Inst_VOP3A
Inst_VOP3A(InFmt_VOP3A *, const std::string &opcode, bool sgpr_dst)
Definition: op_encodings.cc:956

gem5::VegaISA::Inst_VOP3A::extData
InFmt_VOP3_1 extData
Definition: op_encodings.hh:351

gem5::VegaISA::Inst_VOP3A::generateDisassembly
void generateDisassembly() override
Definition: op_encodings.cc:1018

gem5::VegaISA::Inst_VOP3A::~Inst_VOP3A
~Inst_VOP3A()
Definition: op_encodings.cc:967

gem5::VegaISA::Inst_VOP3A::sgprDst
const bool sgprDst
the v_cmp and readlane instructions in the VOP3 encoding are unique because they are the only instruc...
Definition: op_encodings.hh:365

gem5::VegaISA::Inst_VOP3A::instData
InFmt_VOP3A instData
Definition: op_encodings.hh:349

gem5::VegaISA::Inst_VOP3A::instSize
int instSize() const override
Definition: op_encodings.cc:1012

gem5::VegaISA::Inst_VOP3A::initOperandInfo
void initOperandInfo() override
Definition: op_encodings.cc:972

gem5::VegaISA::Inst_VOP3A::hasSecondDword
bool hasSecondDword(InFmt_VOP3A *)

gem5::VegaISA::Inst_VOP3B
Definition: op_encodings.hh:369

gem5::VegaISA::Inst_VOP3B::extData
InFmt_VOP3_1 extData
Definition: op_encodings.hh:383

gem5::VegaISA::Inst_VOP3B::~Inst_VOP3B
~Inst_VOP3B()
Definition: op_encodings.cc:1087

gem5::VegaISA::Inst_VOP3B::Inst_VOP3B
Inst_VOP3B(InFmt_VOP3B *, const std::string &opcode)
Definition: op_encodings.cc:1077

gem5::VegaISA::Inst_VOP3B::hasSecondDword
bool hasSecondDword(InFmt_VOP3B *)

gem5::VegaISA::Inst_VOP3B::initOperandInfo
void initOperandInfo() override
Definition: op_encodings.cc:1092

gem5::VegaISA::Inst_VOP3B::instData
InFmt_VOP3B instData
Definition: op_encodings.hh:381

gem5::VegaISA::Inst_VOP3B::generateDisassembly
void generateDisassembly() override
Definition: op_encodings.cc:1138

gem5::VegaISA::Inst_VOP3B::instSize
int instSize() const override
Definition: op_encodings.cc:1132

gem5::VegaISA::Inst_VOPC
Definition: op_encodings.hh:302

gem5::VegaISA::Inst_VOPC::hasSecondDword
bool hasSecondDword(InFmt_VOPC *)
Definition: op_encodings.cc:898

gem5::VegaISA::Inst_VOPC::generateDisassembly
void generateDisassembly() override
Definition: op_encodings.cc:917

gem5::VegaISA::Inst_VOPC::initOperandInfo
void initOperandInfo() override
Definition: op_encodings.cc:868

gem5::VegaISA::Inst_VOPC::extData
InstFormat extData
Definition: op_encodings.hh:316

gem5::VegaISA::Inst_VOPC::instSize
int instSize() const override
Definition: op_encodings.cc:892

gem5::VegaISA::Inst_VOPC::varSize
uint32_t varSize
Definition: op_encodings.hh:317

gem5::VegaISA::Inst_VOPC::instData
InFmt_VOPC instData
Definition: op_encodings.hh:314

gem5::VegaISA::Inst_VOPC::~Inst_VOPC
~Inst_VOPC()
Definition: op_encodings.cc:863

gem5::VegaISA::Inst_VOPC::Inst_VOPC
Inst_VOPC(InFmt_VOPC *, const std::string &opcode)
Definition: op_encodings.cc:842

gem5::VegaISA::ScalarOperand
Definition: operand.hh:366

gem5::VegaISA::ScalarOperand::rawData
std::enable_if< Condition, DataType >::type rawData() const
we store scalar data in a std::array, however if we need the full operand data we use this method to ...
Definition: operand.hh:391

gem5::VegaISA::ScalarOperand::rawDataPtr
void * rawDataPtr()
Definition: operand.hh:402

gem5::VegaISA::ScalarOperand::read
void read() override
read from and write to the underlying register(s) that this operand is referring to.
Definition: operand.hh:408

gem5::VegaISA::VEGAGPUStaticInst
Definition: gpu_static_inst.hh:48

gem5::VegaISA::VecOperand
Definition: operand.hh:102

gem5::Wavefront
Definition: wavefront.hh:61

gem5::Wavefront::ldsChunk
LdsChunk * ldsChunk
Definition: wavefront.hh:223

gem5::Wavefront::execMask
VectorMask & execMask()
Definition: wavefront.cc:1399

gem5::AtomicOpFunctorPtr
std::unique_ptr< AtomicOpFunctor > AtomicOpFunctorPtr
Definition: amo.hh:242

fatal
#define fatal(...)
This implements a cprintf based fatal() function.
Definition: logging.hh:190

gem5::ArmISA::i
Bitfield< 7 > i
Definition: misc_types.hh:67

gem5::ArmISA::offset
Bitfield< 23, 0 > offset
Definition: types.hh:144

gem5::ArmISA::stride
Bitfield< 21, 20 > stride
Definition: misc_types.hh:453

gem5::MipsISA::vaddr
vaddr
Definition: pra_constants.hh:278

gem5::VegaISA::ScalarRegI32
int32_t ScalarRegI32
Definition: gpu_registers.hh:154

gem5::VegaISA::VecElemU32
uint32_t VecElemU32
Definition: gpu_registers.hh:165

gem5::VegaISA::NumVecElemPerVecReg
const int NumVecElemPerVecReg(64)

gem5::VegaISA::ScalarRegU32
uint32_t ScalarRegU32
Definition: gpu_registers.hh:153

gem5::X86ISA::addr
Bitfield< 3 > addr
Definition: types.hh:84

gem5
Reference material can be found at the JEDEC website: UFS standard http://www.jedec....
Definition: gpu_translation_state.hh:38

gem5::RequestPtr
std::shared_ptr< Request > RequestPtr
Definition: request.hh:92

gem5::GPUDynInstPtr
std::shared_ptr< GPUDynInst > GPUDynInstPtr
Definition: misc.hh:49

gem5::Addr
uint64_t Addr
Address type This will probably be moved somewhere else in the near future.
Definition: types.hh:147

gem5::VectorMask
std::bitset< std::numeric_limits< unsigned long long >::digits > VectorMask
Definition: misc.hh:45

gem5::VegaISA::BufferRsrcDescriptor
Definition: op_encodings.hh:49

gem5::VegaISA::BufferRsrcDescriptor::stride
uint32_t stride
Definition: op_encodings.hh:51

gem5::VegaISA::BufferRsrcDescriptor::numFmt
uint32_t numFmt
Definition: op_encodings.hh:59

gem5::VegaISA::BufferRsrcDescriptor::type
uint32_t type
Definition: op_encodings.hh:68

gem5::VegaISA::BufferRsrcDescriptor::hashEn
uint32_t hashEn
Definition: op_encodings.hh:65

gem5::VegaISA::BufferRsrcDescriptor::atc
uint32_t atc
Definition: op_encodings.hh:64

gem5::VegaISA::BufferRsrcDescriptor::baseAddr
uint64_t baseAddr
Definition: op_encodings.hh:50

gem5::VegaISA::BufferRsrcDescriptor::dstSelZ
uint32_t dstSelZ
Definition: op_encodings.hh:57

gem5::VegaISA::BufferRsrcDescriptor::elemSize
uint32_t elemSize
Definition: op_encodings.hh:61

gem5::VegaISA::BufferRsrcDescriptor::dstSelW
uint32_t dstSelW
Definition: op_encodings.hh:58

gem5::VegaISA::BufferRsrcDescriptor::idxStride
uint32_t idxStride
Definition: op_encodings.hh:62

gem5::VegaISA::BufferRsrcDescriptor::dataFmt
uint32_t dataFmt
Definition: op_encodings.hh:60

gem5::VegaISA::BufferRsrcDescriptor::dstSelY
uint32_t dstSelY
Definition: op_encodings.hh:56

gem5::VegaISA::BufferRsrcDescriptor::addTidEn
uint32_t addTidEn
Definition: op_encodings.hh:63

gem5::VegaISA::BufferRsrcDescriptor::numRecords
uint32_t numRecords
Definition: op_encodings.hh:54

gem5::VegaISA::BufferRsrcDescriptor::swizzleEn
uint32_t swizzleEn
Definition: op_encodings.hh:53

gem5::VegaISA::BufferRsrcDescriptor::mType
uint32_t mType
Definition: op_encodings.hh:67

gem5::VegaISA::BufferRsrcDescriptor::cacheSwizzle
uint32_t cacheSwizzle
Definition: op_encodings.hh:52

gem5::VegaISA::BufferRsrcDescriptor::dstSelX
uint32_t dstSelX
Definition: op_encodings.hh:55

gem5::VegaISA::BufferRsrcDescriptor::heap
uint32_t heap
Definition: op_encodings.hh:66

gem5::VegaISA::InFmt_DS_1
Definition: gpu_decoder.hh:1612

gem5::VegaISA::InFmt_DS
Definition: gpu_decoder.hh:1603

gem5::VegaISA::InFmt_EXP_1
Definition: gpu_decoder.hh:1629

gem5::VegaISA::InFmt_EXP
Definition: gpu_decoder.hh:1619

gem5::VegaISA::InFmt_FLAT_1
Definition: gpu_decoder.hh:1647

gem5::VegaISA::InFmt_FLAT
Definition: gpu_decoder.hh:1636

gem5::VegaISA::InFmt_MIMG_1
Definition: gpu_decoder.hh:1674

gem5::VegaISA::InFmt_MIMG
Definition: gpu_decoder.hh:1659

gem5::VegaISA::InFmt_MTBUF_1
Definition: gpu_decoder.hh:1694

gem5::VegaISA::InFmt_MTBUF
Definition: gpu_decoder.hh:1683

gem5::VegaISA::InFmt_MUBUF_1
Definition: gpu_decoder.hh:1717

gem5::VegaISA::InFmt_MUBUF
Definition: gpu_decoder.hh:1704

gem5::VegaISA::InFmt_SMEM_1
Definition: gpu_decoder.hh:1738

gem5::VegaISA::InFmt_SMEM
Definition: gpu_decoder.hh:1726

gem5::VegaISA::InFmt_SOP1
Definition: gpu_decoder.hh:1744

gem5::VegaISA::InFmt_SOP2
Definition: gpu_decoder.hh:1751

gem5::VegaISA::InFmt_SOPC
Definition: gpu_decoder.hh:1759

gem5::VegaISA::InFmt_SOPK
Definition: gpu_decoder.hh:1766

gem5::VegaISA::InFmt_SOPP
Definition: gpu_decoder.hh:1773

gem5::VegaISA::InFmt_VINTRP
Definition: gpu_decoder.hh:1779

gem5::VegaISA::InFmt_VOP1
Definition: gpu_decoder.hh:1788

gem5::VegaISA::InFmt_VOP2
Definition: gpu_decoder.hh:1795

gem5::VegaISA::InFmt_VOP3A
Definition: gpu_decoder.hh:1803

gem5::VegaISA::InFmt_VOP3B
Definition: gpu_decoder.hh:1820

gem5::VegaISA::InFmt_VOP3_1
Definition: gpu_decoder.hh:1812

gem5::VegaISA::InFmt_VOPC
Definition: gpu_decoder.hh:1828

gem5::VegaISA::InstFormat
Definition: gpu_decoder.hh:1904

gpu_decoder.hh

gpu_mem_helpers.hh

operand.hh