release/v20-0-0-2/op__encodings_8hh_source.html

 /*
  * Copyright (c) 2016-2017 Advanced Micro Devices, Inc.
  * All rights reserved.
  *
  * For use for simulation and test purposes only
  *
  * Redistribution and use in source and binary forms, with or without
  * modification, are permitted provided that the following conditions are met:
  *
  * 1. Redistributions of source code must retain the above copyright notice,
  * this list of conditions and the following disclaimer.
  *
  * 2. Redistributions in binary form must reproduce the above copyright notice,
  * this list of conditions and the following disclaimer in the documentation
  * and/or other materials provided with the distribution.
  *
  * 3. Neither the name of the copyright holder nor the names of its
  * contributors may be used to endorse or promote products derived from this
  * software without specific prior written permission.
  *
  * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS"
  * AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
  * ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT HOLDER OR CONTRIBUTORS BE
  * LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR
  * CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF
  * SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS
  * INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN
  * CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)
  * ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE
  * POSSIBILITY OF SUCH DAMAGE.
  *
  * Authors: Anthony Gutierrez
  */

 #ifndef __ARCH_GCN3_INSTS_OP_ENCODINGS_HH__
 #define __ARCH_GCN3_INSTS_OP_ENCODINGS_HH__

 #include "arch/gcn3/gpu_decoder.hh"
 #include "arch/gcn3/insts/gpu_static_inst.hh"
 #include "arch/gcn3/operand.hh"
 #include "debug/GPUExec.hh"
 #include "mem/ruby/system/RubySystem.hh"

 namespace Gcn3ISA
 {
     // --- purely virtual instruction classes ---

     class Inst_SOP2 : public GCN3GPUStaticInst
     {
       public:
         Inst_SOP2(InFmt_SOP2*, const std::string &opcode);

         int instSize() const override;
         void generateDisassembly() override;

         bool isScalarRegister(int opIdx) override;
         bool isVectorRegister(int opIdx) override;
         int getRegisterIndex(int opIdx, GPUDynInstPtr gpuDynInst) override;

       protected:
         // first instruction DWORD
         InFmt_SOP2 instData;
         // possible second DWORD
         InstFormat extData;
         uint32_t varSize;

       private:
         bool hasSecondDword(InFmt_SOP2 *);
     }; // Inst_SOP2

     class Inst_SOPK : public GCN3GPUStaticInst
     {
       public:
         Inst_SOPK(InFmt_SOPK*, const std::string &opcode);
         ~Inst_SOPK();

         int instSize() const override;
         void generateDisassembly() override;

         bool isScalarRegister(int opIdx) override;
         bool isVectorRegister(int opIdx) override;
         int getRegisterIndex(int opIdx, GPUDynInstPtr gpuDynInst) override;

       protected:
         // first instruction DWORD
         InFmt_SOPK instData;
     }; // Inst_SOPK

     class Inst_SOP1 : public GCN3GPUStaticInst
     {
       public:
         Inst_SOP1(InFmt_SOP1*, const std::string &opcode);
         ~Inst_SOP1();

         int instSize() const override;
         void generateDisassembly() override;

         bool isScalarRegister(int opIdx) override;
         bool isVectorRegister(int opIdx) override;
         int getRegisterIndex(int opIdx, GPUDynInstPtr gpuDynInst) override;

       protected:
         // first instruction DWORD
         InFmt_SOP1 instData;
         // possible second DWORD
         InstFormat extData;
         uint32_t varSize;

       private:
         bool hasSecondDword(InFmt_SOP1 *);
     }; // Inst_SOP1

     class Inst_SOPC : public GCN3GPUStaticInst
     {
       public:
         Inst_SOPC(InFmt_SOPC*, const std::string &opcode);
         ~Inst_SOPC();

         int instSize() const override;
         void generateDisassembly() override;

         bool isScalarRegister(int opIdx) override;
         bool isVectorRegister(int opIdx) override;
         int getRegisterIndex(int opIdx, GPUDynInstPtr gpuDynInst) override;

       protected:
         // first instruction DWORD
         InFmt_SOPC instData;
         // possible second DWORD
         InstFormat extData;
         uint32_t varSize;

       private:
         bool hasSecondDword(InFmt_SOPC *);
     }; // Inst_SOPC

     class Inst_SOPP : public GCN3GPUStaticInst
     {
       public:
         Inst_SOPP(InFmt_SOPP*, const std::string &opcode);
         ~Inst_SOPP();

         int instSize() const override;
         void generateDisassembly() override;

         bool isScalarRegister(int opIdx) override;
         bool isVectorRegister(int opIdx) override;
         int getRegisterIndex(int opIdx, GPUDynInstPtr gpuDynInst) override;

       protected:
         // first instruction DWORD
         InFmt_SOPP instData;
     }; // Inst_SOPP

     class Inst_SMEM : public GCN3GPUStaticInst
     {
       public:
         Inst_SMEM(InFmt_SMEM*, const std::string &opcode);
         ~Inst_SMEM();

         int instSize() const override;
         void generateDisassembly() override;

         bool isScalarRegister(int opIdx) override;
         bool isVectorRegister(int opIdx) override;
         int getRegisterIndex(int opIdx, GPUDynInstPtr gpuDynInst) override;

       protected:
         template<int N>
         void
         initMemRead(GPUDynInstPtr gpuDynInst)
         {
             int block_size = gpuDynInst->computeUnit()->cacheLineSize();
             int req_size = N * sizeof(ScalarRegU32);
             Addr vaddr = gpuDynInst->scalarAddr;

             Addr split_addr = roundDown(vaddr + req_size - 1, block_size);

             assert(split_addr <= vaddr || split_addr - vaddr < block_size);
             bool misaligned_acc = split_addr > vaddr;

             RequestPtr req = new Request(0, vaddr, req_size, 0,
                     gpuDynInst->computeUnit()->masterId(), 0,
                     gpuDynInst->wfDynId);

             if (misaligned_acc) {
                 RequestPtr req1, req2;
                 req->splitOnVaddr(split_addr, req1, req2);
                 gpuDynInst->numScalarReqs = 2;
                 gpuDynInst->setRequestFlags(req1);
                 gpuDynInst->setRequestFlags(req2);
                 PacketPtr pkt1 = new Packet(req1, MemCmd::ReadReq);
                 PacketPtr pkt2 = new Packet(req2, MemCmd::ReadReq);
                 pkt1->dataStatic(gpuDynInst->scalar_data);
                 pkt2->dataStatic(gpuDynInst->scalar_data + req1->getSize());
                 gpuDynInst->computeUnit()->sendScalarRequest(gpuDynInst, pkt1);
                 gpuDynInst->computeUnit()->sendScalarRequest(gpuDynInst, pkt2);
                 delete req;
             } else {
                 gpuDynInst->numScalarReqs = 1;
                 gpuDynInst->setRequestFlags(req);
                 PacketPtr pkt = new Packet(req, MemCmd::ReadReq);
                 pkt->dataStatic(gpuDynInst->scalar_data);
                 gpuDynInst->computeUnit()->sendScalarRequest(gpuDynInst, pkt);
             }
         }

         template<int N>
         void
         initMemWrite(GPUDynInstPtr gpuDynInst)
         {
             int block_size = gpuDynInst->computeUnit()->cacheLineSize();
             int req_size = N * sizeof(ScalarRegU32);
             Addr vaddr = gpuDynInst->scalarAddr;

             Addr split_addr = roundDown(vaddr + req_size - 1, block_size);

             assert(split_addr <= vaddr || split_addr - vaddr < block_size);
             bool misaligned_acc = split_addr > vaddr;

             RequestPtr req = new Request(0, vaddr, req_size, 0,
                     gpuDynInst->computeUnit()->masterId(), 0,
                     gpuDynInst->wfDynId);

             if (misaligned_acc) {
                 RequestPtr req1, req2;
                 req->splitOnVaddr(split_addr, req1, req2);
                 gpuDynInst->numScalarReqs = 2;
                 gpuDynInst->setRequestFlags(req1);
                 gpuDynInst->setRequestFlags(req2);
                 PacketPtr pkt1 = new Packet(req1, MemCmd::WriteReq);
                 PacketPtr pkt2 = new Packet(req2, MemCmd::WriteReq);
                 pkt1->dataStatic(gpuDynInst->scalar_data);
                 pkt2->dataStatic(gpuDynInst->scalar_data + req1->getSize());
                 gpuDynInst->computeUnit()->sendScalarRequest(gpuDynInst, pkt1);
                 gpuDynInst->computeUnit()->sendScalarRequest(gpuDynInst, pkt2);
                 delete req;
             } else {
                 gpuDynInst->numScalarReqs = 1;
                 gpuDynInst->setRequestFlags(req);
                 PacketPtr pkt = new Packet(req, MemCmd::ReadReq);
                 pkt->dataStatic(gpuDynInst->scalar_data);
                 gpuDynInst->computeUnit()->sendScalarRequest(gpuDynInst, pkt);
             }
         }

         void
         calcAddr(GPUDynInstPtr gpuDynInst, ConstScalarOperandU64 &addr,
             ScalarRegU32 offset)
         {
             Addr vaddr = addr.rawData();
             vaddr += offset;
             vaddr &= ~0x3;
             gpuDynInst->scalarAddr = vaddr;
         }

         // first instruction DWORD
         InFmt_SMEM instData;
         // second instruction DWORD
         InFmt_SMEM_1 extData;
     }; // Inst_SMEM

     class Inst_VOP2 : public GCN3GPUStaticInst
     {
       public:
         Inst_VOP2(InFmt_VOP2*, const std::string &opcode);
         ~Inst_VOP2();

         int instSize() const override;
         void generateDisassembly() override;

         bool isScalarRegister(int opIdx) override;
         bool isVectorRegister(int opIdx) override;
         int getRegisterIndex(int opIdx, GPUDynInstPtr gpuDynInst) override;

       protected:
         // first instruction DWORD
         InFmt_VOP2 instData;
         // possible second DWORD
         InstFormat extData;
         uint32_t varSize;

       private:
         bool hasSecondDword(InFmt_VOP2 *);
     }; // Inst_VOP2

     class Inst_VOP1 : public GCN3GPUStaticInst
     {
       public:
         Inst_VOP1(InFmt_VOP1*, const std::string &opcode);
         ~Inst_VOP1();

         int instSize() const override;
         void generateDisassembly() override;

         bool isScalarRegister(int opIdx) override;
         bool isVectorRegister(int opIdx) override;
         int getRegisterIndex(int opIdx, GPUDynInstPtr gpuDynInst) override;

       protected:
         // first instruction DWORD
         InFmt_VOP1 instData;
         // possible second DWORD
         InstFormat extData;
         uint32_t varSize;

       private:
         bool hasSecondDword(InFmt_VOP1 *);
     }; // Inst_VOP1

     class Inst_VOPC : public GCN3GPUStaticInst
     {
       public:
         Inst_VOPC(InFmt_VOPC*, const std::string &opcode);
         ~Inst_VOPC();

         int instSize() const override;
         void generateDisassembly() override;

         bool isScalarRegister(int opIdx) override;
         bool isVectorRegister(int opIdx) override;
         int getRegisterIndex(int opIdx, GPUDynInstPtr gpuDynInst) override;

       protected:
         // first instruction DWORD
         InFmt_VOPC instData;
         // possible second DWORD
         InstFormat extData;
         uint32_t varSize;

       private:
         bool hasSecondDword(InFmt_VOPC *);
     }; // Inst_VOPC

     class Inst_VINTRP : public GCN3GPUStaticInst
     {
       public:
         Inst_VINTRP(InFmt_VINTRP*, const std::string &opcode);
         ~Inst_VINTRP();

         int instSize() const override;

       protected:
         // first instruction DWORD
         InFmt_VINTRP instData;
     }; // Inst_VINTRP

     class Inst_VOP3 : public GCN3GPUStaticInst
     {
       public:
         Inst_VOP3(InFmt_VOP3*, const std::string &opcode, bool sgpr_dst);
         ~Inst_VOP3();

         int instSize() const override;
         void generateDisassembly() override;

         bool isScalarRegister(int opIdx) override;
         bool isVectorRegister(int opIdx) override;
         int getRegisterIndex(int opIdx, GPUDynInstPtr gpuDynInst) override;

       protected:
         // first instruction DWORD
         InFmt_VOP3 instData;
         // second instruction DWORD
         InFmt_VOP3_1 extData;

       private:
         bool hasSecondDword(InFmt_VOP3 *);
         const bool sgprDst;
     }; // Inst_VOP3

     class Inst_VOP3_SDST_ENC : public GCN3GPUStaticInst
     {
       public:
         Inst_VOP3_SDST_ENC(InFmt_VOP3_SDST_ENC*, const std::string &opcode);
         ~Inst_VOP3_SDST_ENC();

         int instSize() const override;
         void generateDisassembly() override;

         bool isScalarRegister(int opIdx) override;
         bool isVectorRegister(int opIdx) override;
         int getRegisterIndex(int opIdx, GPUDynInstPtr gpuDynInst) override;

       protected:
         // first instruction DWORD
         InFmt_VOP3_SDST_ENC instData;
         // second instruction DWORD
         InFmt_VOP3_1 extData;

       private:
         bool hasSecondDword(InFmt_VOP3_SDST_ENC *);
     }; // Inst_VOP3_SDST_ENC

     class Inst_DS : public GCN3GPUStaticInst
     {
       public:
         Inst_DS(InFmt_DS*, const std::string &opcode);
         ~Inst_DS();

         int instSize() const override;
         void generateDisassembly() override;

         bool isScalarRegister(int opIdx) override;
         bool isVectorRegister(int opIdx) override;
         int getRegisterIndex(int opIdx, GPUDynInstPtr gpuDynInst) override;

       protected:
         template<typename T>
         void
         initMemRead(GPUDynInstPtr gpuDynInst, Addr offset)
         {
             Wavefront *wf = gpuDynInst->wavefront();

             for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {
                 if (gpuDynInst->exec_mask[lane]) {
                     Addr vaddr = gpuDynInst->addr[lane] + offset;

                     (reinterpret_cast<T*>(gpuDynInst->d_data))[lane]
                         = wf->ldsChunk->read<T>(vaddr);
                 }
             }
         }

         template<typename T>
         void
         initDualMemRead(GPUDynInstPtr gpuDynInst, Addr offset0, Addr offset1)
         {
             Wavefront *wf = gpuDynInst->wavefront();

             for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {
                 if (gpuDynInst->exec_mask[lane]) {
                     Addr vaddr0 = gpuDynInst->addr[lane] + offset0;
                     Addr vaddr1 = gpuDynInst->addr[lane] + offset1;

                     (reinterpret_cast<T*>(gpuDynInst->d_data))[lane * 2]
                         = wf->ldsChunk->read<T>(vaddr0);
                     (reinterpret_cast<T*>(gpuDynInst->d_data))[lane * 2 + 1]
                         = wf->ldsChunk->read<T>(vaddr1);
                 }
             }
         }

         template<typename T>
         void
         initMemWrite(GPUDynInstPtr gpuDynInst, Addr offset)
         {
             Wavefront *wf = gpuDynInst->wavefront();

             for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {
                 if (gpuDynInst->exec_mask[lane]) {
                     Addr vaddr = gpuDynInst->addr[lane] + offset;
                     wf->ldsChunk->write<T>(vaddr,
                         (reinterpret_cast<T*>(gpuDynInst->d_data))[lane]);
                 }
             }
         }

         template<typename T>
         void
         initDualMemWrite(GPUDynInstPtr gpuDynInst, Addr offset0, Addr offset1)
         {
             Wavefront *wf = gpuDynInst->wavefront();

             for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {
                 if (gpuDynInst->exec_mask[lane]) {
                     Addr vaddr0 = gpuDynInst->addr[lane] + offset0;
                     Addr vaddr1 = gpuDynInst->addr[lane] + offset1;
                     wf->ldsChunk->write<T>(vaddr0, (reinterpret_cast<T*>(
                         gpuDynInst->d_data))[lane * 2]);
                     wf->ldsChunk->write<T>(vaddr1, (reinterpret_cast<T*>(
                         gpuDynInst->d_data))[lane * 2 + 1]);
                 }
             }
         }

         void
         calcAddr(GPUDynInstPtr gpuDynInst, ConstVecOperandU32 &addr)
         {
             Wavefront *wf = gpuDynInst->wavefront();

             for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {
                 if (wf->execMask(lane)) {
                     gpuDynInst->addr.at(lane) = (Addr)addr[lane];
                 }
             }
         }

         // first instruction DWORD
         InFmt_DS instData;
         // second instruction DWORD
         InFmt_DS_1 extData;
     }; // Inst_DS

     class Inst_MUBUF : public GCN3GPUStaticInst
     {
       public:
         Inst_MUBUF(InFmt_MUBUF*, const std::string &opcode);
         ~Inst_MUBUF();

         int instSize() const override;
         void generateDisassembly() override;

         bool isScalarRegister(int opIdx) override;
         bool isVectorRegister(int opIdx) override;
         int getRegisterIndex(int opIdx, GPUDynInstPtr gpuDynInst) override;

       protected:
         struct BufferRsrcDescriptor
         {
             uint64_t baseAddr : 48;
             uint32_t stride : 14;
             uint32_t cacheSwizzle : 1;
             uint32_t swizzleEn : 1;
             uint32_t numRecords : 32;
             uint32_t dstSelX : 3;
             uint32_t dstSelY : 3;
             uint32_t dstSelZ : 3;
             uint32_t dstSelW : 3;
             uint32_t numFmt : 3;
             uint32_t dataFmt : 4;
             uint32_t elemSize : 2;
             uint32_t idxStride : 2;
             uint32_t addTidEn : 1;
             uint32_t atc : 1;
             uint32_t hashEn : 1;
             uint32_t heap : 1;
             uint32_t mType : 3;
             uint32_t type : 2;
         };

         template<typename T>
         void
         initMemRead(GPUDynInstPtr gpuDynInst)
         {
             gpuDynInst->statusBitVector = gpuDynInst->exec_mask;

             for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {
                 if (gpuDynInst->exec_mask[lane]) {
                     Addr vaddr = gpuDynInst->addr[lane];

                     RequestPtr req = new Request(0, vaddr, sizeof(T), 0,
                         gpuDynInst->computeUnit()->masterId(), 0,
                         gpuDynInst->wfDynId);

                     gpuDynInst->setRequestFlags(req);

                     PacketPtr pkt = new Packet(req, MemCmd::ReadReq);
                     pkt->dataStatic(&(reinterpret_cast<T*>(
                         gpuDynInst->d_data))[lane]);

                     gpuDynInst->computeUnit()->sendRequest(gpuDynInst, lane,
                         pkt);
                 }
             }
         }

         template<typename T>
         void
         initMemWrite(GPUDynInstPtr gpuDynInst)
         {
             gpuDynInst->statusBitVector = gpuDynInst->exec_mask;

             for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {
                 if (gpuDynInst->exec_mask[lane]) {
                     Addr vaddr = gpuDynInst->addr[lane];

                     RequestPtr req = new Request(0, vaddr, sizeof(T), 0,
                         gpuDynInst->computeUnit()->masterId(),
                         0, gpuDynInst->wfDynId);

                     gpuDynInst->setRequestFlags(req);
                     PacketPtr pkt = new Packet(req, MemCmd::WriteReq);
                     pkt->dataStatic(&(reinterpret_cast<T*>(
                         gpuDynInst->d_data))[lane]);
                     gpuDynInst->computeUnit()->sendRequest(gpuDynInst, lane,
                         pkt);
                 }
             }
         }

         void
         injectGlobalMemFence(GPUDynInstPtr gpuDynInst)
         {
             // create request and set flags
             gpuDynInst->statusBitVector = VectorMask(1);
             Request *req = new Request(0, 0, 0, 0,
                                        gpuDynInst->computeUnit()->
                                        masterId(), 0,
                                        gpuDynInst->wfDynId);
             gpuDynInst->setRequestFlags(req);
             gpuDynInst->computeUnit()->
                 injectGlobalMemFence(gpuDynInst, false, req);
         }

         template<typename VOFF, typename VIDX, typename SRSRC, typename SOFF>
         void
         calcAddr(GPUDynInstPtr gpuDynInst, VOFF v_off, VIDX v_idx,
             SRSRC s_rsrc_desc, SOFF s_offset, int inst_offset)
         {
             Addr vaddr = 0;
             Addr base_addr = 0;
             Addr stride = 0;
             Addr buf_idx = 0;
             Addr buf_off = 0;
             BufferRsrcDescriptor rsrc_desc;

             std::memcpy((void*)&rsrc_desc, s_rsrc_desc.rawDataPtr(),
                 sizeof(BufferRsrcDescriptor));

             base_addr = rsrc_desc.baseAddr;

             stride = rsrc_desc.addTidEn ? ((rsrc_desc.dataFmt << 14)
                 + rsrc_desc.stride) : rsrc_desc.stride;

             for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {
                 if (gpuDynInst->exec_mask[lane]) {
                     vaddr = base_addr + s_offset.rawData();
                     buf_idx = v_idx[lane] + (rsrc_desc.addTidEn ? lane : 0);

                     buf_off = v_off[lane] + inst_offset;

                     if (rsrc_desc.swizzleEn) {
                         Addr idx_stride = 8 << rsrc_desc.idxStride;
                         Addr elem_size = 2 << rsrc_desc.elemSize;
                         Addr idx_msb = buf_idx / idx_stride;
                         Addr idx_lsb = buf_idx % idx_stride;
                         Addr off_msb = buf_off / elem_size;
                         Addr off_lsb = buf_off % elem_size;

                         vaddr += ((idx_msb * stride + off_msb * elem_size)
                             * idx_stride + idx_lsb * elem_size + off_lsb);
                     } else {
                         vaddr += buf_off + stride * buf_idx;
                     }

                     gpuDynInst->addr.at(lane) = vaddr;
                 }
             }
         }

         // first instruction DWORD
         InFmt_MUBUF instData;
         // second instruction DWORD
         InFmt_MUBUF_1 extData;
     }; // Inst_MUBUF

     class Inst_MTBUF : public GCN3GPUStaticInst
     {
       public:
         Inst_MTBUF(InFmt_MTBUF*, const std::string &opcode);
         ~Inst_MTBUF();

         int instSize() const override;

       protected:
         // first instruction DWORD
         InFmt_MTBUF instData;
         // second instruction DWORD
         InFmt_MTBUF_1 extData;

       private:
         bool hasSecondDword(InFmt_MTBUF *);
     }; // Inst_MTBUF

     class Inst_MIMG : public GCN3GPUStaticInst
     {
       public:
         Inst_MIMG(InFmt_MIMG*, const std::string &opcode);
         ~Inst_MIMG();

         int instSize() const override;

       protected:
         // first instruction DWORD
         InFmt_MIMG instData;
         // second instruction DWORD
         InFmt_MIMG_1 extData;
     }; // Inst_MIMG

     class Inst_EXP : public GCN3GPUStaticInst
     {
       public:
         Inst_EXP(InFmt_EXP*, const std::string &opcode);
         ~Inst_EXP();

         int instSize() const override;

       protected:
         // first instruction DWORD
         InFmt_EXP instData;
         // second instruction DWORD
         InFmt_EXP_1 extData;
     }; // Inst_EXP

     class Inst_FLAT : public GCN3GPUStaticInst
     {
       public:
         Inst_FLAT(InFmt_FLAT*, const std::string &opcode);
         ~Inst_FLAT();

         int instSize() const override;
         void generateDisassembly() override;

         bool isScalarRegister(int opIdx) override;
         bool isVectorRegister(int opIdx) override;
         int getRegisterIndex(int opIdx, GPUDynInstPtr gpuDynInst) override;

       protected:
         template<typename T>
         void
         initMemRead(GPUDynInstPtr gpuDynInst)
         {
             gpuDynInst->statusBitVector = gpuDynInst->exec_mask;

             for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {
                 if (gpuDynInst->exec_mask[lane]) {
                     Addr vaddr = gpuDynInst->addr[lane];

                     RequestPtr req = new Request(0, vaddr, sizeof(T), 0,
                             gpuDynInst->computeUnit()->masterId(), 0,
                             gpuDynInst->wfDynId);

                     gpuDynInst->setRequestFlags(req);
                     PacketPtr pkt = new Packet(req, MemCmd::ReadReq);
                     pkt->dataStatic(&(reinterpret_cast<T*>(
                         gpuDynInst->d_data))[lane]);
                     gpuDynInst->computeUnit()
                         ->sendRequest(gpuDynInst, lane, pkt);
                 }
             }
         }

         template<int N>
         void
         initMemRead(GPUDynInstPtr gpuDynInst)
         {
             int req_size = N * sizeof(VecElemU32);
             gpuDynInst->statusBitVector = gpuDynInst->exec_mask;

             for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {
                 if (gpuDynInst->exec_mask[lane]) {
                     Addr vaddr = gpuDynInst->addr[lane];

                     RequestPtr req = new Request(0, vaddr, req_size, 0,
                         gpuDynInst->computeUnit()->masterId(), 0,
                         gpuDynInst->wfDynId);

                    gpuDynInst->setRequestFlags(req);
                    PacketPtr pkt = new Packet(req, MemCmd::ReadReq);
                    pkt->dataStatic(&(reinterpret_cast<VecElemU32*>(
                         gpuDynInst->d_data))[lane * N]);
                    gpuDynInst->computeUnit()
                         ->sendRequest(gpuDynInst, lane, pkt);
                 }
             }
         }

         template<typename T>
         void
         initMemWrite(GPUDynInstPtr gpuDynInst)
         {
             gpuDynInst->statusBitVector = gpuDynInst->exec_mask;

             for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {
                 if (gpuDynInst->exec_mask[lane]) {
                     Addr vaddr = gpuDynInst->addr[lane];

                     RequestPtr req = new Request(0, vaddr, sizeof(T), 0,
                         gpuDynInst->computeUnit()->masterId(),
                             0, gpuDynInst->wfDynId);

                     gpuDynInst->setRequestFlags(req);
                     PacketPtr pkt = new Packet(req, MemCmd::WriteReq);
                     pkt->dataStatic(&(reinterpret_cast<T*>(
                         gpuDynInst->d_data))[lane]);
                     gpuDynInst->computeUnit()->sendRequest(gpuDynInst, lane,
                                                            pkt);
                 }
             }
         }

         template<int N>
         void
         initMemWrite(GPUDynInstPtr gpuDynInst)
         {
             int req_size = N * sizeof(VecElemU32);
             gpuDynInst->statusBitVector = gpuDynInst->exec_mask;

             for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {
                 if (gpuDynInst->exec_mask[lane]) {
                     Addr vaddr = gpuDynInst->addr[lane];

                     RequestPtr req = new Request(0, vaddr, req_size, 0,
                         gpuDynInst->computeUnit()->masterId(),
                             0, gpuDynInst->wfDynId);

                     gpuDynInst->setRequestFlags(req);
                     PacketPtr pkt = new Packet(req, MemCmd::WriteReq);
                     pkt->dataStatic(&(reinterpret_cast<VecElemU32*>(
                         gpuDynInst->d_data))[lane * N]);
                     gpuDynInst->computeUnit()->sendRequest(gpuDynInst, lane,
                         pkt);
                 }
             }
         }

         template<typename T>
         void
         initAtomicAccess(GPUDynInstPtr gpuDynInst)
         {
             gpuDynInst->statusBitVector = gpuDynInst->exec_mask;

             for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {
                 if (gpuDynInst->exec_mask[lane]) {
                     Addr vaddr = gpuDynInst->addr[lane];

                     RequestPtr req = new Request(0, vaddr, sizeof(T), 0,
                         gpuDynInst->computeUnit()->masterId(), 0,
                         gpuDynInst->wfDynId,
                         gpuDynInst->makeAtomicOpFunctor<T>(
                             &(reinterpret_cast<T*>(gpuDynInst->a_data))[lane],
                             &(reinterpret_cast<T*>(
                                 gpuDynInst->x_data))[lane]));

                     gpuDynInst->setRequestFlags(req);

                     PacketPtr pkt = new Packet(req, MemCmd::SwapReq);
                     pkt->dataStatic(&(reinterpret_cast<T*>(
                         gpuDynInst->d_data))[lane]);

                     gpuDynInst->computeUnit()->sendRequest(gpuDynInst, lane,
                         pkt);
                 }
             }
         }

         void
         calcAddr(GPUDynInstPtr gpuDynInst, ConstVecOperandU64 &addr)
         {
             for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {
                 if (gpuDynInst->exec_mask[lane]) {
                     gpuDynInst->addr.at(lane) = addr[lane];
                 }
             }
             gpuDynInst->resolveFlatSegment(gpuDynInst->exec_mask);
         }

         // first instruction DWORD
         InFmt_FLAT instData;
         // second instruction DWORD
         InFmt_FLAT_1 extData;
     }; // Inst_FLAT
 } // namespace Gcn3ISA

 #endif // __ARCH_GCN3_INSTS_OP_ENCODINGS_HH__
Gcn3ISA::InFmt_FLAT_1
Definition: gpu_decoder.hh:1399

Wavefront
Definition: wavefront.hh:145

Gcn3ISA::Inst_SOPC
Definition: op_encodings.hh:114

Gcn3ISA::Inst_VOP1::extData
InstFormat extData
Definition: op_encodings.hh:329

Gcn3ISA::Inst_SOP2::hasSecondDword
bool hasSecondDword(InFmt_SOP2 *)
Definition: op_encodings.cc:68

Gcn3ISA::InFmt_SOPK
Definition: gpu_decoder.hh:1513

Gcn3ISA::Inst_SOPC::instData
InFmt_SOPC instData
Definition: op_encodings.hh:129

Gcn3ISA::InFmt_FLAT
Definition: gpu_decoder.hh:1390

Gcn3ISA::Inst_MUBUF::BufferRsrcDescriptor::dstSelZ
uint32_t dstSelZ
Definition: op_encodings.hh:553

Gcn3ISA::InFmt_VOP3_1
Definition: gpu_decoder.hh:1559

Gcn3ISA::InFmt_VOP1
Definition: gpu_decoder.hh:1535

Gcn3ISA::Inst_SOP2::instSize
int instSize() const override
Definition: op_encodings.cc:62

Gcn3ISA::Inst_MUBUF::BufferRsrcDescriptor::dstSelY
uint32_t dstSelY
Definition: op_encodings.hh:552

Gcn3ISA::Inst_SMEM
Definition: op_encodings.hh:156

Gcn3ISA::Inst_SOPP
Definition: op_encodings.hh:138

Gcn3ISA::InFmt_VOP3
Definition: gpu_decoder.hh:1550

Gcn3ISA::InFmt_SOP1
Definition: gpu_decoder.hh:1491

Gcn3ISA::InFmt_VOP3_SDST_ENC
Definition: gpu_decoder.hh:1567

Gcn3ISA::Inst_SMEM::calcAddr
void calcAddr(GPUDynInstPtr gpuDynInst, ConstScalarOperandU64 &addr, ScalarRegU32 offset)
Definition: op_encodings.hh:273

Gcn3ISA::Inst_MUBUF::extData
InFmt_MUBUF_1 extData
Definition: op_encodings.hh:705

Gcn3ISA::Inst_MUBUF::BufferRsrcDescriptor::dstSelW
uint32_t dstSelW
Definition: op_encodings.hh:554

Gcn3ISA::InFmt_MTBUF
Definition: gpu_decoder.hh:1434

Gcn3ISA::Inst_VOP1
Definition: op_encodings.hh:312

Gcn3ISA::Inst_SOP2::getRegisterIndex
int getRegisterIndex(int opIdx, GPUDynInstPtr gpuDynInst) override
Definition: op_encodings.cc:133

Gcn3ISA::Inst_SMEM::extData
InFmt_SMEM_1 extData
Definition: op_encodings.hh:285

ArmISA::stride
Bitfield< 21, 20 > stride
Definition: miscregs_types.hh:441

RequestPtr
std::shared_ptr< Request > RequestPtr
Definition: request.hh:81

Gcn3ISA::Inst_SOP2::generateDisassembly
void generateDisassembly() override
Definition: op_encodings.cc:80

Gcn3ISA::InFmt_MUBUF
Definition: gpu_decoder.hh:1455

Gcn3ISA::Inst_DS::initDualMemRead
void initDualMemRead(GPUDynInstPtr gpuDynInst, Addr offset0, Addr offset1)
Definition: op_encodings.hh:462

Gcn3ISA::Inst_SOP1
Definition: op_encodings.hh:90

VectorMask
std::bitset< std::numeric_limits< unsigned long long >::digits > VectorMask
Definition: misc.hh:43

addr
ip6_addr_t addr
Definition: inet.hh:330

Gcn3ISA::Inst_VINTRP::instData
InFmt_VINTRP instData
Definition: op_encodings.hh:370

GPUStaticInst::opcode
const std::string opcode
Definition: gpu_static_inst.hh:247

Gcn3ISA::Inst_MUBUF::BufferRsrcDescriptor::swizzleEn
uint32_t swizzleEn
Definition: op_encodings.hh:549

Gcn3ISA::Inst_SOP2::extData
InstFormat extData
Definition: op_encodings.hh:65

Gcn3ISA::InFmt_VINTRP
Definition: gpu_decoder.hh:1526

Gcn3ISA::Inst_MUBUF::BufferRsrcDescriptor::numRecords
uint32_t numRecords
Definition: op_encodings.hh:550

Gcn3ISA::Inst_DS::initMemRead
void initMemRead(GPUDynInstPtr gpuDynInst, Addr offset)
Definition: op_encodings.hh:446

Gcn3ISA::InFmt_SMEM
Definition: gpu_decoder.hh:1477

ArmISA::offset
Bitfield< 23, 0 > offset
Definition: types.hh:152

Gcn3ISA::GCN3GPUStaticInst
Definition: gpu_static_inst.hh:48

MemCmd::WriteReq
Definition: packet.hh:84

Gcn3ISA::Inst_MUBUF::BufferRsrcDescriptor::hashEn
uint32_t hashEn
Definition: op_encodings.hh:561

Gcn3ISA::Inst_SOPP::instData
InFmt_SOPP instData
Definition: op_encodings.hh:153

Gcn3ISA::Inst_SOPK
Definition: op_encodings.hh:72

Gcn3ISA::Inst_SOPC::extData
InstFormat extData
Definition: op_encodings.hh:131

Gcn3ISA::InFmt_EXP
Definition: gpu_decoder.hh:1373

Gcn3ISA::Inst_MTBUF::extData
InFmt_MTBUF_1 extData
Definition: op_encodings.hh:720

Wavefront::ldsChunk
LdsChunk * ldsChunk
Definition: wavefront.hh:258

Gcn3ISA::InFmt_DS
Definition: gpu_decoder.hh:1357

Gcn3ISA::Inst_MIMG::extData
InFmt_MIMG_1 extData
Definition: op_encodings.hh:738

Gcn3ISA::VecElemU32
uint32_t VecElemU32
Definition: registers.hh:166

Gcn3ISA::Inst_MUBUF::BufferRsrcDescriptor::elemSize
uint32_t elemSize
Definition: op_encodings.hh:557

Request
Definition: request.hh:86

Packet::dataStatic
void dataStatic(T *p)
Set the data pointer to the following value that should not be freed.
Definition: packet.hh:1034

Gcn3ISA::Inst_DS::calcAddr
void calcAddr(GPUDynInstPtr gpuDynInst, ConstVecOperandU32 &addr)
Definition: op_encodings.hh:513

operand.hh

Gcn3ISA::Inst_EXP::extData
InFmt_EXP_1 extData
Definition: op_encodings.hh:753

Gcn3ISA::Inst_MUBUF::BufferRsrcDescriptor::numFmt
uint32_t numFmt
Definition: op_encodings.hh:555

Gcn3ISA::InFmt_MUBUF_1
Definition: gpu_decoder.hh:1468

GPUDynInstPtr
std::shared_ptr< GPUDynInst > GPUDynInstPtr
Definition: misc.hh:46

Gcn3ISA::Inst_DS::initDualMemWrite
void initDualMemWrite(GPUDynInstPtr gpuDynInst, Addr offset0, Addr offset1)
Definition: op_encodings.hh:496

Gcn3ISA::Inst_FLAT::initMemRead
void initMemRead(GPUDynInstPtr gpuDynInst)
Definition: op_encodings.hh:772

Gcn3ISA::Inst_VOP3_SDST_ENC::instData
InFmt_VOP3_SDST_ENC instData
Definition: op_encodings.hh:422

Gcn3ISA::Inst_VOP2::varSize
uint32_t varSize
Definition: op_encodings.hh:306

Gcn3ISA::Inst_SMEM::initMemWrite
void initMemWrite(GPUDynInstPtr gpuDynInst)
initiate a memory write access for N dwords
Definition: op_encodings.hh:226

Gcn3ISA::Inst_VOPC::instData
InFmt_VOPC instData
Definition: op_encodings.hh:351

Gcn3ISA::Inst_SOP2::isVectorRegister
bool isVectorRegister(int opIdx) override
Definition: op_encodings.cc:123

Gcn3ISA::Inst_EXP
Definition: op_encodings.hh:741

Gcn3ISA::Inst_FLAT::instData
InFmt_FLAT instData
Definition: op_encodings.hh:910

Gcn3ISA::Inst_MUBUF::BufferRsrcDescriptor
Definition: op_encodings.hh:544

Gcn3ISA::Inst_SOPK::instData
InFmt_SOPK instData
Definition: op_encodings.hh:87

Gcn3ISA::Inst_MUBUF::BufferRsrcDescriptor::idxStride
uint32_t idxStride
Definition: op_encodings.hh:558

Gcn3ISA::InFmt_DS_1
Definition: gpu_decoder.hh:1366

Gcn3ISA
classes that represnt vector/scalar operands in GCN3 ISA.
Definition: decoder.cc:44

Gcn3ISA::Inst_SOP1::varSize
uint32_t varSize
Definition: op_encodings.hh:108

Gcn3ISA::Inst_MUBUF::BufferRsrcDescriptor::atc
uint32_t atc
Definition: op_encodings.hh:560

Gcn3ISA::InFmt_EXP_1
Definition: gpu_decoder.hh:1383

Gcn3ISA::Inst_SMEM::instData
InFmt_SMEM instData
Definition: op_encodings.hh:283

Gcn3ISA::Inst_MUBUF::BufferRsrcDescriptor::type
uint32_t type
Definition: op_encodings.hh:564

Gcn3ISA::Inst_SOP2::Inst_SOP2
Inst_SOP2(InFmt_SOP2 *, const std::string &opcode)
Definition: op_encodings.cc:44

Gcn3ISA::Inst_MTBUF::instData
InFmt_MTBUF instData
Definition: op_encodings.hh:718

MipsISA::vaddr
vaddr
Definition: pra_constants.hh:275

Gcn3ISA::Inst_MUBUF::BufferRsrcDescriptor::stride
uint32_t stride
Definition: op_encodings.hh:547

Request::splitOnVaddr
void splitOnVaddr(Addr split_addr, RequestPtr &req1, RequestPtr &req2)
Generate two requests as if this request had been split into two pieces.
Definition: request.hh:481

Gcn3ISA::Inst_VOP1::varSize
uint32_t varSize
Definition: op_encodings.hh:330

Gcn3ISA::Inst_SOP1::instData
InFmt_SOP1 instData
Definition: op_encodings.hh:105

Gcn3ISA::Inst_MUBUF::BufferRsrcDescriptor::baseAddr
uint64_t baseAddr
Definition: op_encodings.hh:546

Gcn3ISA::Inst_VOPC::extData
InstFormat extData
Definition: op_encodings.hh:353

RubySystem.hh

roundDown
T roundDown(const T &val, const U &align)
This function is used to align addresses in memory.
Definition: intmath.hh:131

Gcn3ISA::Inst_VOP2::instData
InFmt_VOP2 instData
Definition: op_encodings.hh:303

Gcn3ISA::Inst_VOP3::extData
InFmt_VOP3_1 extData
Definition: op_encodings.hh:390

Gcn3ISA::Inst_VOP3::sgprDst
const bool sgprDst
the v_cmp and readlane instructions in the VOP3 encoding are unique because they are the only instruc...
Definition: op_encodings.hh:404

LdsChunk::read
T read(const uint32_t index)
a read operation
Definition: lds_state.hh:71

Gcn3ISA::Inst_MUBUF::injectGlobalMemFence
void injectGlobalMemFence(GPUDynInstPtr gpuDynInst)
Definition: op_encodings.hh:618

Gcn3ISA::InFmt_MIMG
Definition: gpu_decoder.hh:1411

Addr
uint64_t Addr
Address type This will probably be moved somewhere else in the near future.
Definition: types.hh:140

Gcn3ISA::InFmt_MTBUF_1
Definition: gpu_decoder.hh:1445

Gcn3ISA::VecOperand
Definition: operand.hh:102

Gcn3ISA::Inst_MUBUF::initMemRead
void initMemRead(GPUDynInstPtr gpuDynInst)
Definition: op_encodings.hh:569

Packet
A Packet is used to encapsulate a transfer between two objects in the memory system (e...
Definition: packet.hh:249

Gcn3ISA::InFmt_SOPP
Definition: gpu_decoder.hh:1520

gpu_static_inst.hh

Gcn3ISA::Inst_DS::extData
InFmt_DS_1 extData
Definition: op_encodings.hh:527

Gcn3ISA::Inst_DS
Definition: op_encodings.hh:430

Gcn3ISA::Inst_FLAT::extData
InFmt_FLAT_1 extData
Definition: op_encodings.hh:912

Gcn3ISA::Inst_MIMG
Definition: op_encodings.hh:726

Gcn3ISA::Inst_MUBUF::BufferRsrcDescriptor::dstSelX
uint32_t dstSelX
Definition: op_encodings.hh:551

Gcn3ISA::Inst_SOP2::varSize
uint32_t varSize
Definition: op_encodings.hh:66

Gcn3ISA::Inst_SOP1::extData
InstFormat extData
Definition: op_encodings.hh:107

Gcn3ISA::Inst_MUBUF::calcAddr
void calcAddr(GPUDynInstPtr gpuDynInst, VOFF v_off, VIDX v_idx, SRSRC s_rsrc_desc, SOFF s_offset, int inst_offset)
MUBUF insructions calculate their addresses as follows:
Definition: op_encodings.hh:653

Gcn3ISA::Inst_VOPC::varSize
uint32_t varSize
Definition: op_encodings.hh:354

Gcn3ISA::Inst_MUBUF::BufferRsrcDescriptor::dataFmt
uint32_t dataFmt
Definition: op_encodings.hh:556

Gcn3ISA::Inst_VOP3_SDST_ENC
Definition: op_encodings.hh:407

Gcn3ISA::Inst_VOP3
Definition: op_encodings.hh:373

MemCmd::SwapReq
Definition: packet.hh:109

Gcn3ISA::Inst_MUBUF::BufferRsrcDescriptor::mType
uint32_t mType
Definition: op_encodings.hh:563

Gcn3ISA::ScalarRegU32
uint32_t ScalarRegU32
Definition: registers.hh:154

MemCmd::ReadReq
Definition: packet.hh:81

Gcn3ISA::Inst_MUBUF::instData
InFmt_MUBUF instData
Definition: op_encodings.hh:703

Gcn3ISA::Inst_EXP::instData
InFmt_EXP instData
Definition: op_encodings.hh:751

Gcn3ISA::Inst_FLAT::initAtomicAccess
void initAtomicAccess(GPUDynInstPtr gpuDynInst)
Definition: op_encodings.hh:870

Wavefront::execMask
VectorMask execMask() const
Definition: wavefront.cc:837

Gcn3ISA::Inst_VOP1::instData
InFmt_VOP1 instData
Definition: op_encodings.hh:327

Gcn3ISA::ScalarOperand
Definition: operand.hh:98

Gcn3ISA::Inst_SMEM::initMemRead
void initMemRead(GPUDynInstPtr gpuDynInst)
initiate a memory read access for N dwords
Definition: op_encodings.hh:175

Gcn3ISA::Inst_VOP2::extData
InstFormat extData
Definition: op_encodings.hh:305

LdsChunk::write
void write(const uint32_t index, const T value)
a write operation
Definition: lds_state.hh:84

Gcn3ISA::Inst_MUBUF::BufferRsrcDescriptor::addTidEn
uint32_t addTidEn
Definition: op_encodings.hh:559

Gcn3ISA::Inst_SOPC::varSize
uint32_t varSize
Definition: op_encodings.hh:132

Gcn3ISA::Inst_FLAT::initMemWrite
void initMemWrite(GPUDynInstPtr gpuDynInst)
Definition: op_encodings.hh:821

Gcn3ISA::Inst_FLAT::calcAddr
void calcAddr(GPUDynInstPtr gpuDynInst, ConstVecOperandU64 &addr)
Definition: op_encodings.hh:899

Gcn3ISA::InFmt_VOP2
Definition: gpu_decoder.hh:1542

Gcn3ISA::Inst_SOP2::isScalarRegister
bool isScalarRegister(int opIdx) override
Definition: op_encodings.cc:104

Gcn3ISA::Inst_MUBUF::BufferRsrcDescriptor::cacheSwizzle
uint32_t cacheSwizzle
Definition: op_encodings.hh:548

Gcn3ISA::ScalarOperand::rawData
std::enable_if< Condition, DataType >::type rawData() const
we store scalar data in a std::array, however if we need the full operand data we use this method to ...
Definition: operand.hh:396

Gcn3ISA::InFmt_SMEM_1
Definition: gpu_decoder.hh:1487

Gcn3ISA::Inst_VOP3::instData
InFmt_VOP3 instData
Definition: op_encodings.hh:388

Gcn3ISA::Inst_MUBUF::initMemWrite
void initMemWrite(GPUDynInstPtr gpuDynInst)
Definition: op_encodings.hh:595

Gcn3ISA::Inst_DS::initMemWrite
void initMemWrite(GPUDynInstPtr gpuDynInst, Addr offset)
Definition: op_encodings.hh:481

Gcn3ISA::InFmt_SOP2
Definition: gpu_decoder.hh:1498

Gcn3ISA::Inst_FLAT
Definition: op_encodings.hh:756

gpu_decoder.hh

Gcn3ISA::Inst_MUBUF
Definition: op_encodings.hh:530

Gcn3ISA::InstFormat
Definition: gpu_decoder.hh:1612

Gcn3ISA::Inst_VOP3_SDST_ENC::extData
InFmt_VOP3_1 extData
Definition: op_encodings.hh:424

Gcn3ISA::Inst_VINTRP
Definition: op_encodings.hh:360

Gcn3ISA::Inst_MUBUF::BufferRsrcDescriptor::heap
uint32_t heap
Definition: op_encodings.hh:562

Gcn3ISA::Inst_DS::instData
InFmt_DS instData
Definition: op_encodings.hh:525

Gcn3ISA::Inst_MTBUF
Definition: op_encodings.hh:708

Gcn3ISA::Inst_VOP2
Definition: op_encodings.hh:288

Gcn3ISA::Inst_MIMG::instData
InFmt_MIMG instData
Definition: op_encodings.hh:736

Gcn3ISA::InFmt_VOPC
Definition: gpu_decoder.hh:1575

Gcn3ISA::InFmt_MIMG_1
Definition: gpu_decoder.hh:1425

Gcn3ISA::Inst_SOP2
Definition: op_encodings.hh:49

Gcn3ISA::InFmt_SOPC
Definition: gpu_decoder.hh:1506

ProbePoints::Packet
ProbePointArg< PacketInfo > Packet
Packet probe point.
Definition: mem.hh:103

Gcn3ISA::Inst_VOPC
Definition: op_encodings.hh:336

Gcn3ISA::NumVecElemPerVecReg
const int NumVecElemPerVecReg(64)

Gcn3ISA::Inst_SOP2::instData
InFmt_SOP2 instData
Definition: op_encodings.hh:63