develop/gpu-compute_2gpu__static__inst_8hh_source.html

/*

 * Copyright (c) 2015 Advanced Micro Devices, Inc.

 * All rights reserved.

 *

 * Redistribution and use in source and binary forms, with or without

 * modification, are permitted provided that the following conditions are met:

 *

 * 1. Redistributions of source code must retain the above copyright notice,

 * this list of conditions and the following disclaimer.

 *

 * 2. Redistributions in binary form must reproduce the above copyright notice,

 * this list of conditions and the following disclaimer in the documentation

 * and/or other materials provided with the distribution.

 *

 * 3. Neither the name of the copyright holder nor the names of its

 * contributors may be used to endorse or promote products derived from this

 * software without specific prior written permission.

 *

 * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS"

 * AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE

 * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE

 * ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT HOLDER OR CONTRIBUTORS BE

 * LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR

 * CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF

 * SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS

 * INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN

 * CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)

 * ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE

 * POSSIBILITY OF SUCH DAMAGE.

 */


#ifndef __GPU_STATIC_INST_HH__

#define __GPU_STATIC_INST_HH__


/*

 * @file gpu_static_inst.hh

 *

 * Defines the base class representing static instructions for the GPU. The

 * instructions are "static" because they contain no dynamic instruction

 * information. GPUStaticInst corresponds to the StaticInst class for the CPU

 * models.

 */


#include <cstdint>

#include <string>

#include <vector>


#include "enums/GPUStaticInstFlags.hh"

#include "enums/StorageClassType.hh"

#include "gpu-compute/gpu_dyn_inst.hh"

#include "gpu-compute/misc.hh"

#include "gpu-compute/operand_info.hh"

#include "gpu-compute/wavefront.hh"


namespace gem5

{


class BaseOperand;

class BaseRegOperand;


class GPUStaticInst : public GPUStaticInstFlags

{

  public:

    GPUStaticInst(const std::string &opcode);

    virtual ~GPUStaticInst() { }

    void instAddr(int inst_addr) { _instAddr = inst_addr; }

    int instAddr() const { return _instAddr; }

    int nextInstAddr() const { return _instAddr + instSize(); }


    void instNum(int num) { _instNum = num; }


    int instNum() { return _instNum;  }


    void ipdInstNum(int num) { _ipdInstNum = num; }


    int ipdInstNum() const { return _ipdInstNum; }


    virtual TheGpuISA::ScalarRegU32 srcLiteral() const { return 0; }


    void initDynOperandInfo(Wavefront *wf, ComputeUnit *cu);


    virtual void initOperandInfo() = 0;

    virtual void execute(GPUDynInstPtr gpuDynInst) = 0;

    virtual void generateDisassembly() = 0;

    const std::string& disassemble();

    virtual int getNumOperands() = 0;

    virtual bool isFlatScratchRegister(int opIdx) = 0;

    virtual bool isExecMaskRegister(int opIdx) = 0;

    virtual int getOperandSize(int operandIndex) = 0;


    virtual int numDstRegOperands() = 0;

    virtual int numSrcRegOperands() = 0;


    int numSrcVecOperands();

    int numDstVecOperands();

    int numSrcVecDWords();

    int numDstVecDWords();


    int numSrcScalarOperands();

    int numDstScalarOperands();

    int numSrcScalarDWords();

    int numDstScalarDWords();


    int maxOperandSize();


    virtual int coalescerTokenCount() const { return 0; }


    bool isALU() const { return _flags[ALU]; }

    bool isBranch() const { return _flags[Branch]; }

    bool isCondBranch() const { return _flags[CondBranch]; }

    bool isNop() const { return _flags[Nop]; }

    bool isReturn() const { return _flags[Return]; }

    bool isEndOfKernel() const { return _flags[EndOfKernel]; }

    bool isKernelLaunch() const { return _flags[KernelLaunch]; }

    bool isSDWAInst() const { return _flags[IsSDWA]; }

    bool isDPPInst() const { return _flags[IsDPP]; }


    bool


    isUnconditionalJump() const

    {

        return _flags[UnconditionalJump];

    }


    bool isSpecialOp() const { return _flags[SpecialOp]; }

    bool isWaitcnt() const { return _flags[Waitcnt]; }

    bool isSleep() const { return _flags[Sleep]; }


    bool isBarrier() const { return _flags[MemBarrier]; }

    bool isMemSync() const { return _flags[MemSync]; }

    bool isMemRef() const { return _flags[MemoryRef]; }

    bool isFlat() const { return _flags[Flat]; }

    bool isFlatGlobal() const { return _flags[FlatGlobal]; }

    bool isFlatScratch() const { return _flags[FlatScratch]; }

    bool isLoad() const { return _flags[Load]; }

    bool isStore() const { return _flags[Store]; }


    bool


    isAtomic() const

    {

        return _flags[AtomicReturn] || _flags[AtomicNoReturn];

    }


    bool isAtomicNoRet() const { return _flags[AtomicNoReturn]; }

    bool isAtomicRet() const { return _flags[AtomicReturn]; }


    bool isScalar() const { return _flags[Scalar]; }

    bool readsSCC() const { return _flags[ReadsSCC]; }

    bool writesSCC() const { return _flags[WritesSCC]; }

    bool readsVCC() const { return _flags[ReadsVCC]; }

    bool writesVCC() const { return _flags[WritesVCC]; }

    // Identify instructions that implicitly read the Execute mask

    // as a source operand but not to dictate which threads execute.

    bool readsEXEC() const { return _flags[ReadsEXEC]; }

    bool writesEXEC() const { return _flags[WritesEXEC]; }

    bool readsMode() const { return _flags[ReadsMode]; }

    bool writesMode() const { return _flags[WritesMode]; }

    bool ignoreExec() const { return _flags[IgnoreExec]; }


    bool isAtomicAnd() const { return _flags[AtomicAnd]; }

    bool isAtomicOr() const { return _flags[AtomicOr]; }

    bool isAtomicXor() const { return _flags[AtomicXor]; }

    bool isAtomicCAS() const { return _flags[AtomicCAS]; }

    bool isAtomicExch() const { return _flags[AtomicExch]; }

    bool isAtomicAdd() const { return _flags[AtomicAdd]; }

    bool isAtomicSub() const { return _flags[AtomicSub]; }

    bool isAtomicInc() const { return _flags[AtomicInc]; }

    bool isAtomicDec() const { return _flags[AtomicDec]; }

    bool isAtomicMax() const { return _flags[AtomicMax]; }

    bool isAtomicMin() const { return _flags[AtomicMin]; }

    bool isAtomicPkAddBF16() const { return _flags[AtomicPkAddBF16]; }


    bool


    isArgLoad() const

    {

        return (_flags[KernArgSegment] || _flags[ArgSegment]) && _flags[Load];

    }


    bool


    isGlobalMem() const

    {

        return _flags[MemoryRef] && (_flags[GlobalSegment] ||

               _flags[PrivateSegment] || _flags[ReadOnlySegment] ||

               _flags[SpillSegment] || _flags[FlatGlobal] ||

               _flags[FlatScratch]);

    }


    bool


    isLocalMem() const

    {

        return _flags[MemoryRef] && _flags[GroupSegment];

    }


    bool isArgSeg() const { return _flags[ArgSegment]; }

    bool isGlobalSeg() const { return _flags[GlobalSegment]; }

    bool isGroupSeg() const { return _flags[GroupSegment]; }

    bool isKernArgSeg() const { return _flags[KernArgSegment]; }

    bool isPrivateSeg() const { return _flags[PrivateSegment]; }

    bool isReadOnlySeg() const { return _flags[ReadOnlySegment]; }

    bool isSpillSeg() const { return _flags[SpillSegment]; }


    bool isGloballyCoherent() const { return _flags[GloballyCoherent]; }

    bool isSystemCoherent() const { return _flags[SystemCoherent]; }


    // Floating-point instructions

    bool isI8() const { return _flags[I8]; }

    bool isF16() const { return _flags[F16]; }

    bool isF32() const { return _flags[F32]; }

    bool isF64() const { return _flags[F64]; }


    // FMA, MAC, MAD instructions

    bool isFMA() const { return _flags[FMA]; }

    bool isMAC() const { return _flags[MAC]; }

    bool isMAD() const { return _flags[MAD]; }

    bool isMFMA() const { return _flags[MFMA]; }


    bool hasNoAddr() const { return _flags[NoAddr]; }


    virtual int instSize() const = 0;


    // only used for memory instructions

    virtual void


    initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        fatal("calling initiateAcc() on a non-memory instruction.\n");

    }


    // only used for memory instructions

    virtual void


    completeAcc(GPUDynInstPtr gpuDynInst)

    {

        fatal("calling completeAcc() on a non-memory instruction.\n");

    }


    virtual uint32_t getTargetPc() { return 0; }


    static uint64_t dynamic_id_count;


    // For flat memory accesses

    enums::StorageClassType executed_as;


    void setFlag(Flags flag) {

        _flags[flag] = true;


        if (isGroupSeg()) {

            executed_as = enums::SC_GROUP;

        } else if (isGlobalSeg()) {

            executed_as = enums::SC_GLOBAL;

        } else if (isPrivateSeg()) {

            executed_as = enums::SC_PRIVATE;

        } else if (isSpillSeg()) {

            executed_as = enums::SC_SPILL;

        } else if (isReadOnlySeg()) {

            executed_as = enums::SC_READONLY;

        } else if (isKernArgSeg()) {

            executed_as = enums::SC_KERNARG;

        } else if (isArgSeg()) {

            executed_as = enums::SC_ARG;

        }

    }


    const std::string& opcode() const { return _opcode; }


    const std::vector<OperandInfo>& srcOperands() const { return srcOps; }

    const std::vector<OperandInfo>& dstOperands() const { return dstOps; }


    const std::vector<OperandInfo>&


    srcVecRegOperands() const

    {

        return srcVecRegOps;

    }


    const std::vector<OperandInfo>&


    dstVecRegOperands() const

    {

        return dstVecRegOps;

    }


    const std::vector<OperandInfo>&


    srcScalarRegOperands() const

    {

        return srcScalarRegOps;

    }


    const std::vector<OperandInfo>&


    dstScalarRegOperands() const

    {

        return dstScalarRegOps;

    }


    // These next 2 lines are used in initDynOperandInfo to let the lambda

    // function work

    typedef int (RegisterManager::*MapRegFn)(Wavefront *, int);

    enum OpType { SRC_VEC, SRC_SCALAR, DST_VEC, DST_SCALAR };


  protected:

    const std::string _opcode;

    std::string disassembly;

    int _instNum;

    int _instAddr;

    std::vector<OperandInfo> srcOps;

    std::vector<OperandInfo> dstOps;


  private:

    int srcVecDWords;

    int dstVecDWords;

    int srcScalarDWords;

    int dstScalarDWords;

    int maxOpSize;


    std::vector<OperandInfo> srcVecRegOps;

    std::vector<OperandInfo> dstVecRegOps;

    std::vector<OperandInfo> srcScalarRegOps;

    std::vector<OperandInfo> dstScalarRegOps;


    int _ipdInstNum;


    std::bitset<Num_Flags> _flags;


    void generateVirtToPhysMap(Wavefront *wf, ComputeUnit *cu, OperandInfo& op,

                               std::vector<OperandInfo>& opVec, OpType opType);

};


class KernelLaunchStaticInst : public GPUStaticInst

{

  public:


    KernelLaunchStaticInst() : GPUStaticInst("kernel_launch")

    {

        setFlag(Nop);

        setFlag(KernelLaunch);

        setFlag(MemSync);

        setFlag(Scalar);

        setFlag(GlobalSegment);

    }


    void


    execute(GPUDynInstPtr gpuDynInst) override

    {

        fatal("kernel launch instruction should not be executed\n");

    }


    void


    generateDisassembly() override

    {

        disassembly = _opcode;

    }


    void initOperandInfo() override { return; }

    int getNumOperands() override { return 0; }

    bool isFlatScratchRegister(int opIdx) override { return false; }

    // return true if the Execute mask is explicitly used as a source

    // register operand

    bool isExecMaskRegister(int opIdx) override { return false; }

    int getOperandSize(int operandIndex) override { return 0; }


    int numDstRegOperands() override { return 0; }

    int numSrcRegOperands() override { return 0; }

    int instSize() const override { return 0; }

};


} // namespace gem5


#endif // __GPU_STATIC_INST_HH__

gem5::ComputeUnit
Definition compute_unit.hh:204

gem5::Flags
Wrapper that groups a few flag bits under the same undelying container.
Definition flags.hh:45

gem5::GPUStaticInst::numDstRegOperands
virtual int numDstRegOperands()=0

gem5::GPUStaticInst::numSrcScalarDWords
int numSrcScalarDWords()
Definition gpu_static_inst.cc:175

gem5::GPUStaticInst::~GPUStaticInst
virtual ~GPUStaticInst()
Definition gpu_static_inst.hh:65

gem5::GPUStaticInst::isGlobalMem
bool isGlobalMem() const
Definition gpu_static_inst.hh:179

gem5::GPUStaticInst::_flags
std::bitset< Num_Flags > _flags
Definition gpu_static_inst.hh:329

gem5::GPUStaticInst::srcLiteral
virtual TheGpuISA::ScalarRegU32 srcLiteral() const
Definition gpu_static_inst.hh:78

gem5::GPUStaticInst::isAtomicDec
bool isAtomicDec() const
Definition gpu_static_inst.hh:167

gem5::GPUStaticInst::isGloballyCoherent
bool isGloballyCoherent() const
Coherence domain of a memory instruction.
Definition gpu_static_inst.hh:211

gem5::GPUStaticInst::writesEXEC
bool writesEXEC() const
Definition gpu_static_inst.hh:154

gem5::GPUStaticInst::readsMode
bool readsMode() const
Definition gpu_static_inst.hh:155

gem5::GPUStaticInst::srcOps
std::vector< OperandInfo > srcOps
Definition gpu_static_inst.hh:309

gem5::GPUStaticInst::maxOpSize
int maxOpSize
Definition gpu_static_inst.hh:317

gem5::GPUStaticInst::isMFMA
bool isMFMA() const
Definition gpu_static_inst.hh:224

gem5::GPUStaticInst::isDPPInst
bool isDPPInst() const
Definition gpu_static_inst.hh:116

gem5::GPUStaticInst::disassemble
const std::string & disassemble()
Definition gpu_static_inst.cc:47

gem5::GPUStaticInst::isMemRef
bool isMemRef() const
Definition gpu_static_inst.hh:130

gem5::GPUStaticInst::isArgLoad
bool isArgLoad() const
Definition gpu_static_inst.hh:173

gem5::GPUStaticInst::setFlag
void setFlag(Flags flag)
Definition gpu_static_inst.hh:251

gem5::GPUStaticInst::isAtomicPkAddBF16
bool isAtomicPkAddBF16() const
Definition gpu_static_inst.hh:170

gem5::GPUStaticInst::dstVecRegOperands
const std::vector< OperandInfo > & dstVecRegOperands() const
Definition gpu_static_inst.hh:282

gem5::GPUStaticInst::writesVCC
bool writesVCC() const
Definition gpu_static_inst.hh:150

gem5::GPUStaticInst::srcScalarRegOperands
const std::vector< OperandInfo > & srcScalarRegOperands() const
Definition gpu_static_inst.hh:288

gem5::GPUStaticInst::numDstVecOperands
int numDstVecOperands()
Definition gpu_static_inst.cc:125

gem5::GPUStaticInst::isSpecialOp
bool isSpecialOp() const
Definition gpu_static_inst.hh:124

gem5::GPUStaticInst::isReadOnlySeg
bool isReadOnlySeg() const
Definition gpu_static_inst.hh:198

gem5::GPUStaticInst::dstScalarRegOps
std::vector< OperandInfo > dstScalarRegOps
Definition gpu_static_inst.hh:322

gem5::GPUStaticInst::executed_as
enums::StorageClassType executed_as
Definition gpu_static_inst.hh:249

gem5::GPUStaticInst::opcode
const std::string & opcode() const
Definition gpu_static_inst.hh:270

gem5::GPUStaticInst::isF16
bool isF16() const
Definition gpu_static_inst.hh:216

gem5::GPUStaticInst::isSDWAInst
bool isSDWAInst() const
Definition gpu_static_inst.hh:115

gem5::GPUStaticInst::maxOperandSize
int maxOperandSize()
Definition gpu_static_inst.cc:205

gem5::GPUStaticInst::isF64
bool isF64() const
Definition gpu_static_inst.hh:218

gem5::GPUStaticInst::generateDisassembly
virtual void generateDisassembly()=0

gem5::GPUStaticInst::isMemSync
bool isMemSync() const
Definition gpu_static_inst.hh:129

gem5::GPUStaticInst::isPrivateSeg
bool isPrivateSeg() const
Definition gpu_static_inst.hh:197

gem5::GPUStaticInst::OpType
OpType
Definition gpu_static_inst.hh:302

gem5::GPUStaticInst::SRC_SCALAR
@ SRC_SCALAR
Definition gpu_static_inst.hh:302

gem5::GPUStaticInst::DST_SCALAR
@ DST_SCALAR
Definition gpu_static_inst.hh:302

gem5::GPUStaticInst::DST_VEC
@ DST_VEC
Definition gpu_static_inst.hh:302

gem5::GPUStaticInst::SRC_VEC
@ SRC_VEC
Definition gpu_static_inst.hh:302

gem5::GPUStaticInst::isAtomic
bool isAtomic() const
Definition gpu_static_inst.hh:138

gem5::GPUStaticInst::getOperandSize
virtual int getOperandSize(int operandIndex)=0

gem5::GPUStaticInst::isScalar
bool isScalar() const
Definition gpu_static_inst.hh:146

gem5::GPUStaticInst::readsVCC
bool readsVCC() const
Definition gpu_static_inst.hh:149

gem5::GPUStaticInst::isGlobalSeg
bool isGlobalSeg() const
Definition gpu_static_inst.hh:194

gem5::GPUStaticInst::isAtomicSub
bool isAtomicSub() const
Definition gpu_static_inst.hh:165

gem5::GPUStaticInst::isExecMaskRegister
virtual bool isExecMaskRegister(int opIdx)=0

gem5::GPUStaticInst::ipdInstNum
int ipdInstNum() const
Definition gpu_static_inst.hh:76

gem5::GPUStaticInst::srcOperands
const std::vector< OperandInfo > & srcOperands() const
Definition gpu_static_inst.hh:272

gem5::GPUStaticInst::numDstScalarDWords
int numDstScalarDWords()
Definition gpu_static_inst.cc:190

gem5::GPUStaticInst::isArgSeg
bool isArgSeg() const
Definition gpu_static_inst.hh:193

gem5::GPUStaticInst::dstScalarRegOperands
const std::vector< OperandInfo > & dstScalarRegOperands() const
Definition gpu_static_inst.hh:294

gem5::GPUStaticInst::isAtomicMin
bool isAtomicMin() const
Definition gpu_static_inst.hh:169

gem5::GPUStaticInst::ipdInstNum
void ipdInstNum(int num)
Definition gpu_static_inst.hh:74

gem5::GPUStaticInst::GPUStaticInst
GPUStaticInst(const std::string &opcode)
Definition gpu_static_inst.cc:39

gem5::GPUStaticInst::dstVecRegOps
std::vector< OperandInfo > dstVecRegOps
Definition gpu_static_inst.hh:320

gem5::GPUStaticInst::_ipdInstNum
int _ipdInstNum
Identifier of the immediate post-dominator instruction.
Definition gpu_static_inst.hh:327

gem5::GPUStaticInst::isFlat
bool isFlat() const
Definition gpu_static_inst.hh:131

gem5::GPUStaticInst::dstVecDWords
int dstVecDWords
Definition gpu_static_inst.hh:314

gem5::GPUStaticInst::dstOps
std::vector< OperandInfo > dstOps
Definition gpu_static_inst.hh:310

gem5::GPUStaticInst::dynamic_id_count
static uint64_t dynamic_id_count
Definition gpu_static_inst.hh:246

gem5::GPUStaticInst::isKernArgSeg
bool isKernArgSeg() const
Definition gpu_static_inst.hh:196

gem5::GPUStaticInst::writesSCC
bool writesSCC() const
Definition gpu_static_inst.hh:148

gem5::GPUStaticInst::isMAD
bool isMAD() const
Definition gpu_static_inst.hh:223

gem5::GPUStaticInst::isF32
bool isF32() const
Definition gpu_static_inst.hh:217

gem5::GPUStaticInst::isEndOfKernel
bool isEndOfKernel() const
Definition gpu_static_inst.hh:113

gem5::GPUStaticInst::isCondBranch
bool isCondBranch() const
Definition gpu_static_inst.hh:110

gem5::GPUStaticInst::isAtomicOr
bool isAtomicOr() const
Definition gpu_static_inst.hh:160

gem5::GPUStaticInst::nextInstAddr
int nextInstAddr() const
Definition gpu_static_inst.hh:68

gem5::GPUStaticInst::isFlatScratchRegister
virtual bool isFlatScratchRegister(int opIdx)=0

gem5::GPUStaticInst::dstOperands
const std::vector< OperandInfo > & dstOperands() const
Definition gpu_static_inst.hh:273

gem5::GPUStaticInst::isBranch
bool isBranch() const
Definition gpu_static_inst.hh:109

gem5::GPUStaticInst::isAtomicInc
bool isAtomicInc() const
Definition gpu_static_inst.hh:166

gem5::GPUStaticInst::isKernelLaunch
bool isKernelLaunch() const
Definition gpu_static_inst.hh:114

gem5::GPUStaticInst::instNum
void instNum(int num)
Definition gpu_static_inst.hh:70

gem5::GPUStaticInst::isAtomicMax
bool isAtomicMax() const
Definition gpu_static_inst.hh:168

gem5::GPUStaticInst::disassembly
std::string disassembly
Definition gpu_static_inst.hh:306

gem5::GPUStaticInst::instNum
int instNum()
Definition gpu_static_inst.hh:72

gem5::GPUStaticInst::numDstVecDWords
int numDstVecDWords()
Definition gpu_static_inst.cc:147

gem5::GPUStaticInst::isGroupSeg
bool isGroupSeg() const
Definition gpu_static_inst.hh:195

gem5::GPUStaticInst::isAtomicCAS
bool isAtomicCAS() const
Definition gpu_static_inst.hh:162

gem5::GPUStaticInst::isFlatGlobal
bool isFlatGlobal() const
Definition gpu_static_inst.hh:132

gem5::GPUStaticInst::isSystemCoherent
bool isSystemCoherent() const
Definition gpu_static_inst.hh:212

gem5::GPUStaticInst::initOperandInfo
virtual void initOperandInfo()=0

gem5::GPUStaticInst::numSrcVecOperands
int numSrcVecOperands()
Definition gpu_static_inst.cc:119

gem5::GPUStaticInst::execute
virtual void execute(GPUDynInstPtr gpuDynInst)=0

gem5::GPUStaticInst::srcVecRegOperands
const std::vector< OperandInfo > & srcVecRegOperands() const
Definition gpu_static_inst.hh:276

gem5::GPUStaticInst::srcScalarDWords
int srcScalarDWords
Definition gpu_static_inst.hh:315

gem5::GPUStaticInst::completeAcc
virtual void completeAcc(GPUDynInstPtr gpuDynInst)
Definition gpu_static_inst.hh:239

gem5::GPUStaticInst::srcVecRegOps
std::vector< OperandInfo > srcVecRegOps
Definition gpu_static_inst.hh:319

gem5::GPUStaticInst::isAtomicRet
bool isAtomicRet() const
Definition gpu_static_inst.hh:144

gem5::GPUStaticInst::isStore
bool isStore() const
Definition gpu_static_inst.hh:135

gem5::GPUStaticInst::isLocalMem
bool isLocalMem() const
Definition gpu_static_inst.hh:188

gem5::GPUStaticInst::numDstScalarOperands
int numDstScalarOperands()
Definition gpu_static_inst.cc:169

gem5::GPUStaticInst::isALU
bool isALU() const
Definition gpu_static_inst.hh:108

gem5::GPUStaticInst::_instAddr
int _instAddr
Definition gpu_static_inst.hh:308

gem5::GPUStaticInst::getNumOperands
virtual int getNumOperands()=0

gem5::GPUStaticInst::numSrcScalarOperands
int numSrcScalarOperands()
Definition gpu_static_inst.cc:163

gem5::GPUStaticInst::isAtomicAdd
bool isAtomicAdd() const
Definition gpu_static_inst.hh:164

gem5::GPUStaticInst::generateVirtToPhysMap
void generateVirtToPhysMap(Wavefront *wf, ComputeUnit *cu, OperandInfo &op, std::vector< OperandInfo > &opVec, OpType opType)
Definition gpu_static_inst.cc:59

gem5::GPUStaticInst::getTargetPc
virtual uint32_t getTargetPc()
Definition gpu_static_inst.hh:244

gem5::GPUStaticInst::instSize
virtual int instSize() const =0

gem5::GPUStaticInst::srcScalarRegOps
std::vector< OperandInfo > srcScalarRegOps
Definition gpu_static_inst.hh:321

gem5::GPUStaticInst::isWaitcnt
bool isWaitcnt() const
Definition gpu_static_inst.hh:125

gem5::GPUStaticInst::writesMode
bool writesMode() const
Definition gpu_static_inst.hh:156

gem5::GPUStaticInst::readsSCC
bool readsSCC() const
Definition gpu_static_inst.hh:147

gem5::GPUStaticInst::isLoad
bool isLoad() const
Definition gpu_static_inst.hh:134

gem5::GPUStaticInst::isFMA
bool isFMA() const
Definition gpu_static_inst.hh:221

gem5::GPUStaticInst::ignoreExec
bool ignoreExec() const
Definition gpu_static_inst.hh:157

gem5::GPUStaticInst::isBarrier
bool isBarrier() const
Definition gpu_static_inst.hh:128

gem5::GPUStaticInst::isAtomicExch
bool isAtomicExch() const
Definition gpu_static_inst.hh:163

gem5::GPUStaticInst::_opcode
const std::string _opcode
Definition gpu_static_inst.hh:305

gem5::GPUStaticInst::isAtomicNoRet
bool isAtomicNoRet() const
Definition gpu_static_inst.hh:143

gem5::GPUStaticInst::isMAC
bool isMAC() const
Definition gpu_static_inst.hh:222

gem5::GPUStaticInst::coalescerTokenCount
virtual int coalescerTokenCount() const
Definition gpu_static_inst.hh:106

gem5::GPUStaticInst::isUnconditionalJump
bool isUnconditionalJump() const
Definition gpu_static_inst.hh:119

gem5::GPUStaticInst::instAddr
void instAddr(int inst_addr)
Definition gpu_static_inst.hh:66

gem5::GPUStaticInst::isI8
bool isI8() const
Definition gpu_static_inst.hh:215

gem5::GPUStaticInst::initiateAcc
virtual void initiateAcc(GPUDynInstPtr gpuDynInst)
Definition gpu_static_inst.hh:232

gem5::GPUStaticInst::isReturn
bool isReturn() const
Definition gpu_static_inst.hh:112

gem5::GPUStaticInst::hasNoAddr
bool hasNoAddr() const
Definition gpu_static_inst.hh:226

gem5::GPUStaticInst::instAddr
int instAddr() const
Definition gpu_static_inst.hh:67

gem5::GPUStaticInst::isSleep
bool isSleep() const
Definition gpu_static_inst.hh:126

gem5::GPUStaticInst::initDynOperandInfo
void initDynOperandInfo(Wavefront *wf, ComputeUnit *cu)
Definition gpu_static_inst.cc:95

gem5::GPUStaticInst::numSrcRegOperands
virtual int numSrcRegOperands()=0

gem5::GPUStaticInst::dstScalarDWords
int dstScalarDWords
Definition gpu_static_inst.hh:316

gem5::GPUStaticInst::numSrcVecDWords
int numSrcVecDWords()
Definition gpu_static_inst.cc:131

gem5::GPUStaticInst::isSpillSeg
bool isSpillSeg() const
Definition gpu_static_inst.hh:199

gem5::GPUStaticInst::isAtomicXor
bool isAtomicXor() const
Definition gpu_static_inst.hh:161

gem5::GPUStaticInst::isAtomicAnd
bool isAtomicAnd() const
Definition gpu_static_inst.hh:159

gem5::GPUStaticInst::srcVecDWords
int srcVecDWords
Definition gpu_static_inst.hh:313

gem5::GPUStaticInst::MapRegFn
int(RegisterManager::* MapRegFn)(Wavefront *, int)
Definition gpu_static_inst.hh:301

gem5::GPUStaticInst::readsEXEC
bool readsEXEC() const
Definition gpu_static_inst.hh:153

gem5::GPUStaticInst::isFlatScratch
bool isFlatScratch() const
Definition gpu_static_inst.hh:133

gem5::GPUStaticInst::_instNum
int _instNum
Definition gpu_static_inst.hh:307

gem5::GPUStaticInst::isNop
bool isNop() const
Definition gpu_static_inst.hh:111

gem5::KernelLaunchStaticInst::isFlatScratchRegister
bool isFlatScratchRegister(int opIdx) override
Definition gpu_static_inst.hh:361

gem5::KernelLaunchStaticInst::generateDisassembly
void generateDisassembly() override
Definition gpu_static_inst.hh:354

gem5::KernelLaunchStaticInst::KernelLaunchStaticInst
KernelLaunchStaticInst()
Definition gpu_static_inst.hh:338

gem5::KernelLaunchStaticInst::numDstRegOperands
int numDstRegOperands() override
Definition gpu_static_inst.hh:367

gem5::KernelLaunchStaticInst::getOperandSize
int getOperandSize(int operandIndex) override
Definition gpu_static_inst.hh:365

gem5::KernelLaunchStaticInst::execute
void execute(GPUDynInstPtr gpuDynInst) override
Definition gpu_static_inst.hh:348

gem5::KernelLaunchStaticInst::getNumOperands
int getNumOperands() override
Definition gpu_static_inst.hh:360

gem5::KernelLaunchStaticInst::instSize
int instSize() const override
Definition gpu_static_inst.hh:369

gem5::KernelLaunchStaticInst::numSrcRegOperands
int numSrcRegOperands() override
Definition gpu_static_inst.hh:368

gem5::KernelLaunchStaticInst::isExecMaskRegister
bool isExecMaskRegister(int opIdx) override
Definition gpu_static_inst.hh:364

gem5::KernelLaunchStaticInst::initOperandInfo
void initOperandInfo() override
Definition gpu_static_inst.hh:359

gem5::OperandInfo
Definition operand_info.hh:43

gem5::RegisterManager
Definition register_manager.hh:58

gem5::RiscvISA::Load
Definition mem.hh:57

gem5::RiscvISA::Store
Definition mem.hh:66

gem5::SparcISA::Branch
Base class for branch operations.
Definition branch.hh:49

gem5::SparcISA::Nop
Nop class.
Definition nop.hh:49

gem5::Wavefront
Definition wavefront.hh:62

gem5::statistics::Scalar
This is a simple scalar statistic, like a counter.
Definition statistics.hh:1930

std::vector
STL vector class.
Definition stl.hh:37

misc.hh

gpu_dyn_inst.hh

fatal
#define fatal(...)
This implements a cprintf based fatal() function.
Definition logging.hh:232

gem5::X86ISA::op
Bitfield< 4 > op
Definition types.hh:83

gem5
Copyright (c) 2024 Arm Limited All rights reserved.
Definition binary32.hh:36

gem5::GPUDynInstPtr
std::shared_ptr< GPUDynInst > GPUDynInstPtr
Definition misc.hh:49

operand_info.hh

wavefront.hh