develop/flat_8cc_source.html

/*

 * Copyright (c) 2024 Advanced Micro Devices, Inc.

 * All rights reserved.

 *

 * Redistribution and use in source and binary forms, with or without

 * modification, are permitted provided that the following conditions are met:

 *

 * 1. Redistributions of source code must retain the above copyright notice,

 * this list of conditions and the following disclaimer.

 *

 * 2. Redistributions in binary form must reproduce the above copyright notice,

 * this list of conditions and the following disclaimer in the documentation

 * and/or other materials provided with the distribution.

 *

 * 3. Neither the name of the copyright holder nor the names of its

 * contributors may be used to endorse or promote products derived from this

 * software without specific prior written permission.

 *

 * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS"

 * AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE

 * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE

 * ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT HOLDER OR CONTRIBUTORS BE

 * LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR

 * CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF

 * SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS

 * INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN

 * CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)

 * ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE

 * POSSIBILITY OF SUCH DAMAGE.

 */


#include "arch/amdgpu/vega/insts/instructions.hh"


namespace gem5

{


namespace VegaISA

{

    // --- Inst_FLAT__FLAT_LOAD_UBYTE class methods ---


    Inst_FLAT__FLAT_LOAD_UBYTE::Inst_FLAT__FLAT_LOAD_UBYTE(InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_load_ubyte")

    {

        setFlag(MemoryRef);

        setFlag(Load);

    } // Inst_FLAT__FLAT_LOAD_UBYTE


    Inst_FLAT__FLAT_LOAD_UBYTE::~Inst_FLAT__FLAT_LOAD_UBYTE()

    {

    } // ~Inst_FLAT__FLAT_LOAD_UBYTE


    // --- description from .arch file ---

    // Untyped buffer load unsigned byte (zero extend to VGPR destination).

    void


    Inst_FLAT__FLAT_LOAD_UBYTE::execute(GPUDynInstPtr gpuDynInst)

    {

        Wavefront *wf = gpuDynInst->wavefront();


        if (gpuDynInst->exec_mask.none()) {

            wf->decVMemInstsIssued();

            wf->untrackVMemInst(gpuDynInst);

            if (isFlat()) {

                wf->decLGKMInstsIssued();

                wf->untrackLGKMInst(gpuDynInst);

            }

            return;

        }


        gpuDynInst->execUnitId = wf->execUnitId;

        gpuDynInst->latency.init(gpuDynInst->computeUnit());

        gpuDynInst->latency.set(gpuDynInst->computeUnit()->clockPeriod());


        calcAddr(gpuDynInst, extData.ADDR, extData.SADDR, instData.OFFSET);


        issueRequestHelper(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_LOAD_UBYTE::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initMemRead<VecElemU8>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_LOAD_UBYTE::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        VecOperandU32 vdst(gpuDynInst, extData.VDST);


        for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {

            if (gpuDynInst->exec_mask[lane]) {

                vdst[lane] = (VecElemU32)((reinterpret_cast<VecElemU8*>(

                    gpuDynInst->d_data))[lane]);

            }

        }

        vdst.write();

    } // execute


    // --- Inst_FLAT__FLAT_LOAD_SBYTE class methods ---


    Inst_FLAT__FLAT_LOAD_SBYTE::Inst_FLAT__FLAT_LOAD_SBYTE(InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_load_sbyte")

    {

        setFlag(MemoryRef);

        setFlag(Load);

    } // Inst_FLAT__FLAT_LOAD_SBYTE


    Inst_FLAT__FLAT_LOAD_SBYTE::~Inst_FLAT__FLAT_LOAD_SBYTE()

    {

    } // ~Inst_FLAT__FLAT_LOAD_SBYTE


    // --- description from .arch file ---

    // Untyped buffer load signed byte (sign extend to VGPR destination).

    void


    Inst_FLAT__FLAT_LOAD_SBYTE::execute(GPUDynInstPtr gpuDynInst)

    {

        Wavefront *wf = gpuDynInst->wavefront();


        if (gpuDynInst->exec_mask.none()) {

            wf->decVMemInstsIssued();

            wf->untrackVMemInst(gpuDynInst);

            if (isFlat()) {

                wf->decLGKMInstsIssued();

                wf->untrackLGKMInst(gpuDynInst);

            }

            return;

        }


        gpuDynInst->execUnitId = wf->execUnitId;

        gpuDynInst->latency.init(gpuDynInst->computeUnit());

        gpuDynInst->latency.set(gpuDynInst->computeUnit()->clockPeriod());


        calcAddr(gpuDynInst, extData.ADDR, extData.SADDR, instData.OFFSET);


        issueRequestHelper(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_LOAD_SBYTE::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initMemRead<VecElemI8>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_LOAD_SBYTE::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        VecOperandU32 vdst(gpuDynInst, extData.VDST);


        for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {

            if (gpuDynInst->exec_mask[lane]) {

                vdst[lane] = (VecElemI32)((reinterpret_cast<VecElemI8*>(

                    gpuDynInst->d_data))[lane]);

            }

        }

        vdst.write();

    } // execute


    // --- Inst_FLAT__FLAT_LOAD_USHORT class methods ---


    Inst_FLAT__FLAT_LOAD_USHORT::Inst_FLAT__FLAT_LOAD_USHORT(InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_load_ushort")

    {

        setFlag(MemoryRef);

        setFlag(Load);

    } // Inst_FLAT__FLAT_LOAD_USHORT


    Inst_FLAT__FLAT_LOAD_USHORT::~Inst_FLAT__FLAT_LOAD_USHORT()

    {

    } // ~Inst_FLAT__FLAT_LOAD_USHORT


    // --- description from .arch file ---

    // Untyped buffer load unsigned short (zero extend to VGPR destination).

    void


    Inst_FLAT__FLAT_LOAD_USHORT::execute(GPUDynInstPtr gpuDynInst)

    {

        Wavefront *wf = gpuDynInst->wavefront();


        if (gpuDynInst->exec_mask.none()) {

            wf->decVMemInstsIssued();

            wf->untrackVMemInst(gpuDynInst);

            if (isFlat()) {

                wf->decLGKMInstsIssued();

                wf->untrackLGKMInst(gpuDynInst);

            }

            return;

        }


        gpuDynInst->execUnitId = wf->execUnitId;

        gpuDynInst->latency.init(gpuDynInst->computeUnit());

        gpuDynInst->latency.set(gpuDynInst->computeUnit()->clockPeriod());


        calcAddr(gpuDynInst, extData.ADDR, extData.SADDR, instData.OFFSET);


        issueRequestHelper(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_LOAD_USHORT::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initMemRead<VecElemU16>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_LOAD_USHORT::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        VecOperandU32 vdst(gpuDynInst, extData.VDST);


        for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {

            if (gpuDynInst->exec_mask[lane]) {

                vdst[lane] = (VecElemU32)((reinterpret_cast<VecElemU16*>(

                    gpuDynInst->d_data))[lane]);

            }

        }

        vdst.write();

    } // execute


    // --- Inst_FLAT__FLAT_LOAD_SSHORT class methods ---


    Inst_FLAT__FLAT_LOAD_SSHORT::Inst_FLAT__FLAT_LOAD_SSHORT(InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_load_sshort")

    {

        setFlag(MemoryRef);

        setFlag(Load);

    } // Inst_FLAT__FLAT_LOAD_SSHORT


    Inst_FLAT__FLAT_LOAD_SSHORT::~Inst_FLAT__FLAT_LOAD_SSHORT()

    {

    } // ~Inst_FLAT__FLAT_LOAD_SSHORT


    // --- description from .arch file ---

    // Untyped buffer load signed short (sign extend to VGPR destination).

    void


    Inst_FLAT__FLAT_LOAD_SSHORT::execute(GPUDynInstPtr gpuDynInst)

    {

        panicUnimplemented();

    } // execute


    void


    Inst_FLAT__FLAT_LOAD_SSHORT::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

    } // initiateAcc


    void


    Inst_FLAT__FLAT_LOAD_SSHORT::completeAcc(GPUDynInstPtr gpuDynInst)

    {

    } // execute


    // --- Inst_FLAT__FLAT_LOAD_DWORD class methods ---


    Inst_FLAT__FLAT_LOAD_DWORD::Inst_FLAT__FLAT_LOAD_DWORD(InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_load_dword")

    {

        setFlag(MemoryRef);

        setFlag(Load);

    } // Inst_FLAT__FLAT_LOAD_DWORD


    Inst_FLAT__FLAT_LOAD_DWORD::~Inst_FLAT__FLAT_LOAD_DWORD()

    {

    } // ~Inst_FLAT__FLAT_LOAD_DWORD


    // --- description from .arch file ---

    // Untyped buffer load dword.

    void


    Inst_FLAT__FLAT_LOAD_DWORD::execute(GPUDynInstPtr gpuDynInst)

    {

        Wavefront *wf = gpuDynInst->wavefront();


        if (gpuDynInst->exec_mask.none()) {

            wf->decVMemInstsIssued();

            wf->untrackVMemInst(gpuDynInst);

            if (isFlat()) {

                wf->decLGKMInstsIssued();

                wf->untrackLGKMInst(gpuDynInst);

            }

            return;

        }


        gpuDynInst->execUnitId = wf->execUnitId;

        gpuDynInst->latency.init(gpuDynInst->computeUnit());

        gpuDynInst->latency.set(gpuDynInst->computeUnit()->clockPeriod());


        calcAddr(gpuDynInst, extData.ADDR, extData.SADDR, instData.OFFSET);


        issueRequestHelper(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_LOAD_DWORD::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initMemRead<VecElemU32>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_LOAD_DWORD::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        VecOperandU32 vdst(gpuDynInst, extData.VDST);


        for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {

            if (gpuDynInst->exec_mask[lane]) {

                vdst[lane] = (reinterpret_cast<VecElemU32*>(

                    gpuDynInst->d_data))[lane];

            }

        }

        vdst.write();

    } // completeAcc


    // --- Inst_FLAT__FLAT_LOAD_DWORDX2 class methods ---


    Inst_FLAT__FLAT_LOAD_DWORDX2::Inst_FLAT__FLAT_LOAD_DWORDX2(

          InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_load_dwordx2")

    {

        setFlag(MemoryRef);

        setFlag(Load);

    } // Inst_FLAT__FLAT_LOAD_DWORDX2


    Inst_FLAT__FLAT_LOAD_DWORDX2::~Inst_FLAT__FLAT_LOAD_DWORDX2()

    {

    } // ~Inst_FLAT__FLAT_LOAD_DWORDX2


    // --- description from .arch file ---

    // Untyped buffer load 2 dwords.

    void


    Inst_FLAT__FLAT_LOAD_DWORDX2::execute(GPUDynInstPtr gpuDynInst)

    {

        Wavefront *wf = gpuDynInst->wavefront();


        if (gpuDynInst->exec_mask.none()) {

            wf->decVMemInstsIssued();

            wf->untrackVMemInst(gpuDynInst);

            if (isFlat()) {

                wf->decLGKMInstsIssued();

                wf->untrackLGKMInst(gpuDynInst);

            }

            return;

        }


        gpuDynInst->execUnitId = wf->execUnitId;

        gpuDynInst->latency.init(gpuDynInst->computeUnit());

        gpuDynInst->latency.set(gpuDynInst->computeUnit()->clockPeriod());


        calcAddr(gpuDynInst, extData.ADDR, extData.SADDR, instData.OFFSET);


        issueRequestHelper(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_LOAD_DWORDX2::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initMemRead<2>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_LOAD_DWORDX2::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        VecOperandU32 vdst0(gpuDynInst, extData.VDST);

        VecOperandU32 vdst1(gpuDynInst, extData.VDST + 1);


        for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {

            if (gpuDynInst->exec_mask[lane] && !isFlatScratch()) {

                vdst0[lane] = (reinterpret_cast<VecElemU32*>(

                    gpuDynInst->d_data))[lane * 2];

                vdst1[lane] = (reinterpret_cast<VecElemU32*>(

                    gpuDynInst->d_data))[lane * 2 + 1];

            } else if (gpuDynInst->exec_mask[lane] && isFlatScratch()) {

                // Unswizzle the data opposite of swizzleData. See swizzleData

                // in src/arch/amdgpu/vega/insts/op_encodings.hh for details.

                vdst0[lane] = (reinterpret_cast<VecElemU32*>(

                    gpuDynInst->d_data))[lane];

                vdst1[lane] = (reinterpret_cast<VecElemU32*>(

                    gpuDynInst->d_data))[lane + NumVecElemPerVecReg];

            }

        }


        vdst0.write();

        vdst1.write();

    } // completeAcc


    // --- Inst_FLAT__FLAT_LOAD_DWORDX3 class methods ---


    Inst_FLAT__FLAT_LOAD_DWORDX3::Inst_FLAT__FLAT_LOAD_DWORDX3(

          InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_load_dwordx3")

    {

        setFlag(MemoryRef);

        setFlag(Load);

    } // Inst_FLAT__FLAT_LOAD_DWORDX3


    Inst_FLAT__FLAT_LOAD_DWORDX3::~Inst_FLAT__FLAT_LOAD_DWORDX3()

    {

    } // ~Inst_FLAT__FLAT_LOAD_DWORDX3


    // --- description from .arch file ---

    // Untyped buffer load 3 dwords.

    void


    Inst_FLAT__FLAT_LOAD_DWORDX3::execute(GPUDynInstPtr gpuDynInst)

    {

        Wavefront *wf = gpuDynInst->wavefront();


        if (gpuDynInst->exec_mask.none()) {

            wf->decVMemInstsIssued();

            wf->untrackVMemInst(gpuDynInst);

            if (isFlat()) {

                wf->decLGKMInstsIssued();

                wf->untrackLGKMInst(gpuDynInst);

            }

            return;

        }


        gpuDynInst->execUnitId = wf->execUnitId;

        gpuDynInst->latency.init(gpuDynInst->computeUnit());

        gpuDynInst->latency.set(gpuDynInst->computeUnit()->clockPeriod());


        calcAddr(gpuDynInst, extData.ADDR, extData.SADDR, instData.OFFSET);


        issueRequestHelper(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_LOAD_DWORDX3::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initMemRead<3>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_LOAD_DWORDX3::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        VecOperandU32 vdst0(gpuDynInst, extData.VDST);

        VecOperandU32 vdst1(gpuDynInst, extData.VDST + 1);

        VecOperandU32 vdst2(gpuDynInst, extData.VDST + 2);


        for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {

            if (gpuDynInst->exec_mask[lane] && !isFlatScratch()) {

                vdst0[lane] = (reinterpret_cast<VecElemU32*>(

                    gpuDynInst->d_data))[lane * 3];

                vdst1[lane] = (reinterpret_cast<VecElemU32*>(

                    gpuDynInst->d_data))[lane * 3 + 1];

                vdst2[lane] = (reinterpret_cast<VecElemU32*>(

                    gpuDynInst->d_data))[lane * 3 + 2];

            } else if (gpuDynInst->exec_mask[lane] && isFlatScratch()) {

                // Unswizzle the data opposite of swizzleData. See swizzleData

                // in src/arch/amdgpu/vega/insts/op_encodings.hh for details.

                vdst0[lane] = (reinterpret_cast<VecElemU32*>(

                    gpuDynInst->d_data))[lane];

                vdst1[lane] = (reinterpret_cast<VecElemU32*>(

                    gpuDynInst->d_data))[lane + NumVecElemPerVecReg];

                vdst2[lane] = (reinterpret_cast<VecElemU32*>(

                    gpuDynInst->d_data))[lane + 2*NumVecElemPerVecReg];

            }

        }


        vdst0.write();

        vdst1.write();

        vdst2.write();

    } // completeAcc


    // --- Inst_FLAT__FLAT_LOAD_DWORDX4 class methods ---


    Inst_FLAT__FLAT_LOAD_DWORDX4::Inst_FLAT__FLAT_LOAD_DWORDX4(

          InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_load_dwordx4")

    {

        setFlag(MemoryRef);

        setFlag(Load);

    } // Inst_FLAT__FLAT_LOAD_DWORDX4


    Inst_FLAT__FLAT_LOAD_DWORDX4::~Inst_FLAT__FLAT_LOAD_DWORDX4()

    {

    } // ~Inst_FLAT__FLAT_LOAD_DWORDX4


    // --- description from .arch file ---

    // Untyped buffer load 4 dwords.

    void


    Inst_FLAT__FLAT_LOAD_DWORDX4::execute(GPUDynInstPtr gpuDynInst)

    {

        Wavefront *wf = gpuDynInst->wavefront();


        if (gpuDynInst->exec_mask.none()) {

            wf->decVMemInstsIssued();

            wf->untrackVMemInst(gpuDynInst);

            if (isFlat()) {

                wf->decLGKMInstsIssued();

                wf->untrackLGKMInst(gpuDynInst);

            }

            return;

        }


        gpuDynInst->execUnitId = wf->execUnitId;

        gpuDynInst->latency.init(gpuDynInst->computeUnit());

        gpuDynInst->latency.set(gpuDynInst->computeUnit()->clockPeriod());


        calcAddr(gpuDynInst, extData.ADDR, extData.SADDR, instData.OFFSET);


        issueRequestHelper(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_LOAD_DWORDX4::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initMemRead<4>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_LOAD_DWORDX4::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        VecOperandU32 vdst0(gpuDynInst, extData.VDST);

        VecOperandU32 vdst1(gpuDynInst, extData.VDST + 1);

        VecOperandU32 vdst2(gpuDynInst, extData.VDST + 2);

        VecOperandU32 vdst3(gpuDynInst, extData.VDST + 3);


        for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {

            if (gpuDynInst->exec_mask[lane] && !isFlatScratch()) {

                vdst0[lane] = (reinterpret_cast<VecElemU32*>(

                    gpuDynInst->d_data))[lane * 4];

                vdst1[lane] = (reinterpret_cast<VecElemU32*>(

                    gpuDynInst->d_data))[lane * 4 + 1];

                vdst2[lane] = (reinterpret_cast<VecElemU32*>(

                    gpuDynInst->d_data))[lane * 4 + 2];

                vdst3[lane] = (reinterpret_cast<VecElemU32*>(

                    gpuDynInst->d_data))[lane * 4 + 3];

            } else if (gpuDynInst->exec_mask[lane] && isFlatScratch()) {

                // Unswizzle the data opposite of swizzleData. See swizzleData

                // in src/arch/amdgpu/vega/insts/op_encodings.hh for details.

                vdst0[lane] = (reinterpret_cast<VecElemU32*>(

                    gpuDynInst->d_data))[lane];

                vdst1[lane] = (reinterpret_cast<VecElemU32*>(

                    gpuDynInst->d_data))[lane + NumVecElemPerVecReg];

                vdst2[lane] = (reinterpret_cast<VecElemU32*>(

                    gpuDynInst->d_data))[lane + 2*NumVecElemPerVecReg];

                vdst3[lane] = (reinterpret_cast<VecElemU32*>(

                    gpuDynInst->d_data))[lane + 3*NumVecElemPerVecReg];

            }

        }


        vdst0.write();

        vdst1.write();

        vdst2.write();

        vdst3.write();

    } // completeAcc


    // --- Inst_FLAT__FLAT_STORE_BYTE class methods ---


    Inst_FLAT__FLAT_STORE_BYTE::Inst_FLAT__FLAT_STORE_BYTE(InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_store_byte")

    {

        setFlag(MemoryRef);

        setFlag(Store);

    } // Inst_FLAT__FLAT_STORE_BYTE


    Inst_FLAT__FLAT_STORE_BYTE::~Inst_FLAT__FLAT_STORE_BYTE()

    {

    } // ~Inst_FLAT__FLAT_STORE_BYTE


    // --- description from .arch file ---

    // Untyped buffer store byte.

    void


    Inst_FLAT__FLAT_STORE_BYTE::execute(GPUDynInstPtr gpuDynInst)

    {

        Wavefront *wf = gpuDynInst->wavefront();


        if (gpuDynInst->exec_mask.none()) {

            wf->decVMemInstsIssued();

            wf->untrackVMemInst(gpuDynInst);

            if (isFlat()) {

                wf->decLGKMInstsIssued();

                wf->untrackLGKMInst(gpuDynInst);

            }

            wf->decExpInstsIssued();

            wf->untrackExpInst(gpuDynInst);

            return;

        }


        gpuDynInst->execUnitId = wf->execUnitId;

        gpuDynInst->latency.init(gpuDynInst->computeUnit());

        gpuDynInst->latency.set(gpuDynInst->computeUnit()->clockPeriod());


        ConstVecOperandU8 data(gpuDynInst, extData.DATA);


        data.read();


        calcAddr(gpuDynInst, extData.ADDR, extData.SADDR, instData.OFFSET);


        for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {

            if (gpuDynInst->exec_mask[lane]) {

                (reinterpret_cast<VecElemU8*>(gpuDynInst->d_data))[lane]

                    = data[lane];

            }

        }


        issueRequestHelper(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_STORE_BYTE::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initMemWrite<VecElemU8>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_STORE_BYTE::completeAcc(GPUDynInstPtr gpuDynInst)

    {

    } // execute


    // --- Inst_FLAT__FLAT_STORE_SHORT class methods ---


    Inst_FLAT__FLAT_STORE_SHORT::Inst_FLAT__FLAT_STORE_SHORT(InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_store_short")

    {

        setFlag(MemoryRef);

        setFlag(Store);

    } // Inst_FLAT__FLAT_STORE_SHORT


    Inst_FLAT__FLAT_STORE_SHORT::~Inst_FLAT__FLAT_STORE_SHORT()

    {

    } // ~Inst_FLAT__FLAT_STORE_SHORT


    // --- description from .arch file ---

    // Untyped buffer store short.

    void


    Inst_FLAT__FLAT_STORE_SHORT::execute(GPUDynInstPtr gpuDynInst)

    {

        Wavefront *wf = gpuDynInst->wavefront();


        if (gpuDynInst->exec_mask.none()) {

            wf->decVMemInstsIssued();

            wf->untrackVMemInst(gpuDynInst);

            if (isFlat()) {

                wf->decLGKMInstsIssued();

                wf->untrackLGKMInst(gpuDynInst);

            }

            wf->decExpInstsIssued();

            wf->untrackExpInst(gpuDynInst);

            return;

        }


        gpuDynInst->execUnitId = wf->execUnitId;

        gpuDynInst->latency.init(gpuDynInst->computeUnit());

        gpuDynInst->latency.set(gpuDynInst->computeUnit()->clockPeriod());


        ConstVecOperandU16 data(gpuDynInst, extData.DATA);


        data.read();


        calcAddr(gpuDynInst, extData.ADDR, extData.SADDR, instData.OFFSET);


        for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {

            if (gpuDynInst->exec_mask[lane]) {

                (reinterpret_cast<VecElemU16*>(gpuDynInst->d_data))[lane]

                    = data[lane];

            }

        }


        issueRequestHelper(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_STORE_SHORT::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initMemWrite<VecElemU16>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_STORE_SHORT::completeAcc(GPUDynInstPtr gpuDynInst)

    {

    } // completeAcc


    // --- Inst_FLAT__FLAT_STORE_SHORT_D16_HI class methods ---


    Inst_FLAT__FLAT_STORE_SHORT_D16_HI::

        Inst_FLAT__FLAT_STORE_SHORT_D16_HI(InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_store_short_d16_hi")

    {

        setFlag(MemoryRef);

        setFlag(Store);

    } // Inst_FLAT__FLAT_STORE_SHORT_D16_HI


    Inst_FLAT__FLAT_STORE_SHORT_D16_HI::~Inst_FLAT__FLAT_STORE_SHORT_D16_HI()

    {

    } // ~Inst_FLAT__FLAT_STORE_SHORT_D16_HI


    // --- description from .arch file ---

    // Untyped buffer store short.

    void


    Inst_FLAT__FLAT_STORE_SHORT_D16_HI::execute(GPUDynInstPtr gpuDynInst)

    {

        Wavefront *wf = gpuDynInst->wavefront();


        if (gpuDynInst->exec_mask.none()) {

            wf->decVMemInstsIssued();

            wf->untrackVMemInst(gpuDynInst);

            if (isFlat()) {

                wf->decLGKMInstsIssued();

                wf->untrackLGKMInst(gpuDynInst);

            }

            wf->decExpInstsIssued();

            wf->untrackExpInst(gpuDynInst);

            return;

        }


        gpuDynInst->execUnitId = wf->execUnitId;

        gpuDynInst->latency.init(gpuDynInst->computeUnit());

        gpuDynInst->latency.set(gpuDynInst->computeUnit()->clockPeriod());


        ConstVecOperandU32 data(gpuDynInst, extData.DATA);


        data.read();


        calcAddr(gpuDynInst, extData.ADDR, extData.SADDR, instData.OFFSET);


        for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {

            if (gpuDynInst->exec_mask[lane]) {

                (reinterpret_cast<VecElemU16*>(gpuDynInst->d_data))[lane]

                    = (data[lane] >> 16);

            }

        }


        issueRequestHelper(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_STORE_SHORT_D16_HI::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initMemWrite<VecElemU16>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_STORE_SHORT_D16_HI::completeAcc(GPUDynInstPtr gpuDynInst)

    {

    } // completeAcc


    // --- Inst_FLAT__FLAT_STORE_DWORD class methods ---


    Inst_FLAT__FLAT_STORE_DWORD::Inst_FLAT__FLAT_STORE_DWORD(InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_store_dword")

    {

        setFlag(MemoryRef);

        setFlag(Store);

    } // Inst_FLAT__FLAT_STORE_DWORD


    Inst_FLAT__FLAT_STORE_DWORD::~Inst_FLAT__FLAT_STORE_DWORD()

    {

    } // ~Inst_FLAT__FLAT_STORE_DWORD


    // --- description from .arch file ---

    // Untyped buffer store dword.

    void


    Inst_FLAT__FLAT_STORE_DWORD::execute(GPUDynInstPtr gpuDynInst)

    {

        Wavefront *wf = gpuDynInst->wavefront();


        if (gpuDynInst->exec_mask.none()) {

            wf->decVMemInstsIssued();

            wf->untrackVMemInst(gpuDynInst);

            if (isFlat()) {

                wf->decLGKMInstsIssued();

                wf->untrackLGKMInst(gpuDynInst);

            }

            wf->decExpInstsIssued();

            wf->untrackExpInst(gpuDynInst);

            return;

        }


        gpuDynInst->execUnitId = wf->execUnitId;

        gpuDynInst->latency.init(gpuDynInst->computeUnit());

        gpuDynInst->latency.set(gpuDynInst->computeUnit()->clockPeriod());


        ConstVecOperandU32 data(gpuDynInst, extData.DATA);


        data.read();


        calcAddr(gpuDynInst, extData.ADDR, extData.SADDR, instData.OFFSET);


        for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {

            if (gpuDynInst->exec_mask[lane]) {

                (reinterpret_cast<VecElemU32*>(gpuDynInst->d_data))[lane]

                    = data[lane];

            }

        }


        issueRequestHelper(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_STORE_DWORD::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initMemWrite<VecElemU32>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_STORE_DWORD::completeAcc(GPUDynInstPtr gpuDynInst)

    {

    } // completeAcc


    // --- Inst_FLAT__FLAT_STORE_DWORDX2 class methods ---


    Inst_FLAT__FLAT_STORE_DWORDX2::Inst_FLAT__FLAT_STORE_DWORDX2(

          InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_store_dwordx2")

    {

        setFlag(MemoryRef);

        setFlag(Store);

    } // Inst_FLAT__FLAT_STORE_DWORDX2


    Inst_FLAT__FLAT_STORE_DWORDX2::~Inst_FLAT__FLAT_STORE_DWORDX2()

    {

    } // ~Inst_FLAT__FLAT_STORE_DWORDX2


    // --- description from .arch file ---

    // Untyped buffer store 2 dwords.

    void


    Inst_FLAT__FLAT_STORE_DWORDX2::execute(GPUDynInstPtr gpuDynInst)

    {

        Wavefront *wf = gpuDynInst->wavefront();


        if (gpuDynInst->exec_mask.none()) {

            wf->decVMemInstsIssued();

            wf->untrackVMemInst(gpuDynInst);

            if (isFlat()) {

                wf->decLGKMInstsIssued();

                wf->untrackLGKMInst(gpuDynInst);

            }

            wf->decExpInstsIssued();

            wf->untrackExpInst(gpuDynInst);

            return;

        }


        gpuDynInst->execUnitId = wf->execUnitId;

        gpuDynInst->latency.init(gpuDynInst->computeUnit());

        gpuDynInst->latency.set(gpuDynInst->computeUnit()->clockPeriod());


        ConstVecOperandU64 data(gpuDynInst, extData.DATA);


        data.read();


        calcAddr(gpuDynInst, extData.ADDR, extData.SADDR, instData.OFFSET);


        for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {

            if (gpuDynInst->exec_mask[lane]) {

                (reinterpret_cast<VecElemU64*>(gpuDynInst->d_data))[lane]

                    = data[lane];

            }

        }


        issueRequestHelper(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_STORE_DWORDX2::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initMemWrite<2>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_STORE_DWORDX2::completeAcc(GPUDynInstPtr gpuDynInst)

    {

    } // completeAcc


    // --- Inst_FLAT__FLAT_STORE_DWORDX3 class methods ---


    Inst_FLAT__FLAT_STORE_DWORDX3::Inst_FLAT__FLAT_STORE_DWORDX3(

          InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_store_dwordx3")

    {

        setFlag(MemoryRef);

        setFlag(Store);

    } // Inst_FLAT__FLAT_STORE_DWORDX3


    Inst_FLAT__FLAT_STORE_DWORDX3::~Inst_FLAT__FLAT_STORE_DWORDX3()

    {

    } // ~Inst_FLAT__FLAT_STORE_DWORDX3


    // --- description from .arch file ---

    // Untyped buffer store 3 dwords.

    void


    Inst_FLAT__FLAT_STORE_DWORDX3::execute(GPUDynInstPtr gpuDynInst)

    {

        Wavefront *wf = gpuDynInst->wavefront();


        if (gpuDynInst->exec_mask.none()) {

            wf->decVMemInstsIssued();

            wf->untrackVMemInst(gpuDynInst);

            if (isFlat()) {

                wf->decLGKMInstsIssued();

                wf->untrackLGKMInst(gpuDynInst);

            }

            wf->decExpInstsIssued();

            wf->untrackExpInst(gpuDynInst);

            return;

        }


        gpuDynInst->execUnitId = wf->execUnitId;

        gpuDynInst->latency.init(gpuDynInst->computeUnit());

        gpuDynInst->latency.set(gpuDynInst->computeUnit()->clockPeriod());


        ConstVecOperandU32 data0(gpuDynInst, extData.DATA);

        ConstVecOperandU32 data1(gpuDynInst, extData.DATA + 1);

        ConstVecOperandU32 data2(gpuDynInst, extData.DATA + 2);


        data0.read();

        data1.read();

        data2.read();


        calcAddr(gpuDynInst, extData.ADDR, extData.SADDR, instData.OFFSET);


        for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {

            if (gpuDynInst->exec_mask[lane]) {

                (reinterpret_cast<VecElemU32*>(

                    gpuDynInst->d_data))[lane * 3] = data0[lane];

                (reinterpret_cast<VecElemU32*>(

                    gpuDynInst->d_data))[lane * 3 + 1] = data1[lane];

                (reinterpret_cast<VecElemU32*>(

                    gpuDynInst->d_data))[lane * 3 + 2] = data2[lane];

            }

        }


        issueRequestHelper(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_STORE_DWORDX3::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initMemWrite<3>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_STORE_DWORDX3::completeAcc(GPUDynInstPtr gpuDynInst)

    {

    } // completeAcc


    // --- Inst_FLAT__FLAT_STORE_DWORDX4 class methods ---


    Inst_FLAT__FLAT_STORE_DWORDX4::Inst_FLAT__FLAT_STORE_DWORDX4(

          InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_store_dwordx4")

    {

        setFlag(MemoryRef);

        setFlag(Store);

    } // Inst_FLAT__FLAT_STORE_DWORDX4


    Inst_FLAT__FLAT_STORE_DWORDX4::~Inst_FLAT__FLAT_STORE_DWORDX4()

    {

    } // ~Inst_FLAT__FLAT_STORE_DWORDX4


    // --- description from .arch file ---

    // Untyped buffer store 4 dwords.

    void


    Inst_FLAT__FLAT_STORE_DWORDX4::execute(GPUDynInstPtr gpuDynInst)

    {

        Wavefront *wf = gpuDynInst->wavefront();


        if (gpuDynInst->exec_mask.none()) {

            wf->decVMemInstsIssued();

            wf->untrackVMemInst(gpuDynInst);

            if (isFlat()) {

                wf->decLGKMInstsIssued();

                wf->untrackLGKMInst(gpuDynInst);

            }

            wf->decExpInstsIssued();

            wf->untrackExpInst(gpuDynInst);

            return;

        }


        gpuDynInst->execUnitId = wf->execUnitId;

        gpuDynInst->latency.init(gpuDynInst->computeUnit());

        gpuDynInst->latency.set(gpuDynInst->computeUnit()->clockPeriod());


        ConstVecOperandU32 data0(gpuDynInst, extData.DATA);

        ConstVecOperandU32 data1(gpuDynInst, extData.DATA + 1);

        ConstVecOperandU32 data2(gpuDynInst, extData.DATA + 2);

        ConstVecOperandU32 data3(gpuDynInst, extData.DATA + 3);


        data0.read();

        data1.read();

        data2.read();

        data3.read();


        calcAddr(gpuDynInst, extData.ADDR, extData.SADDR, instData.OFFSET);


        for (int lane = 0; lane < NumVecElemPerVecReg; ++lane) {

            if (gpuDynInst->exec_mask[lane]) {

                (reinterpret_cast<VecElemU32*>(

                    gpuDynInst->d_data))[lane * 4] = data0[lane];

                (reinterpret_cast<VecElemU32*>(

                    gpuDynInst->d_data))[lane * 4 + 1] = data1[lane];

                (reinterpret_cast<VecElemU32*>(

                    gpuDynInst->d_data))[lane * 4 + 2] = data2[lane];

                (reinterpret_cast<VecElemU32*>(

                    gpuDynInst->d_data))[lane * 4 + 3] = data3[lane];

            }

        }


        issueRequestHelper(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_STORE_DWORDX4::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initMemWrite<4>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_STORE_DWORDX4::completeAcc(GPUDynInstPtr gpuDynInst)

    {

    } // completeAcc


    // --- Inst_FLAT__FLAT_LOAD_LDS_UBYTE class methods ---


    Inst_FLAT__FLAT_LOAD_LDS_UBYTE::

        Inst_FLAT__FLAT_LOAD_LDS_UBYTE(InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_load_lds_ubyte")

    {

        setFlag(Load);


        assert(isFlatGlobal() || isFlatScratch());

    } // Inst_FLAT__FLAT_LOAD_LDS_UBYTE


    Inst_FLAT__FLAT_LOAD_LDS_UBYTE::~Inst_FLAT__FLAT_LOAD_LDS_UBYTE()

    {

    } // ~Inst_FLAT__FLAT_LOAD_LDS_UBYTE


    // --- description from .arch file ---

    // Untyped buffer load unsigned byte (zero extend to VGPR destination).

    void


    Inst_FLAT__FLAT_LOAD_LDS_UBYTE::execute(GPUDynInstPtr gpuDynInst)

    {

        Wavefront *wf = gpuDynInst->wavefront();


        if (gpuDynInst->exec_mask.none()) {

            wf->decVMemInstsIssued();

            return;

        }


        gpuDynInst->execUnitId = wf->execUnitId;

        gpuDynInst->latency.init(gpuDynInst->computeUnit());

        gpuDynInst->latency.set(gpuDynInst->computeUnit()->clockPeriod());


        calcAddr(gpuDynInst, extData.ADDR, extData.SADDR, instData.OFFSET);


        issueRequestHelper(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_LOAD_LDS_UBYTE::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initMemRead<VecElemU8>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_LOAD_LDS_UBYTE::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        // Align to dword.

        ldsComplete<1>(gpuDynInst);

    } // execute


    // --- Inst_FLAT__FLAT_LOAD_LDS_SBYTE class methods ---


    Inst_FLAT__FLAT_LOAD_LDS_SBYTE::

        Inst_FLAT__FLAT_LOAD_LDS_SBYTE(InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_load_lds_sbyte")

    {

        setFlag(Load);


        assert(isFlatGlobal() || isFlatScratch());

    } // Inst_FLAT__FLAT_LOAD_LDS_SBYTE


    Inst_FLAT__FLAT_LOAD_LDS_SBYTE::~Inst_FLAT__FLAT_LOAD_LDS_SBYTE()

    {

    } // ~Inst_FLAT__FLAT_LOAD_LDS_SBYTE


    // --- description from .arch file ---

    // Untyped buffer load signed byte (sign extend to VGPR destination).

    void


    Inst_FLAT__FLAT_LOAD_LDS_SBYTE::execute(GPUDynInstPtr gpuDynInst)

    {

        Wavefront *wf = gpuDynInst->wavefront();


        if (gpuDynInst->exec_mask.none()) {

            wf->decVMemInstsIssued();

            return;

        }


        gpuDynInst->execUnitId = wf->execUnitId;

        gpuDynInst->latency.init(gpuDynInst->computeUnit());

        gpuDynInst->latency.set(gpuDynInst->computeUnit()->clockPeriod());


        calcAddr(gpuDynInst, extData.ADDR, extData.SADDR, instData.OFFSET);


        issueRequestHelper(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_LOAD_LDS_SBYTE::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initMemRead<VecElemI8>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_LOAD_LDS_SBYTE::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        // Align to dword.

        ldsComplete<1, 8>(gpuDynInst);

    } // execute


    // --- Inst_FLAT__FLAT_LOAD_LDS_USHORT class methods ---


    Inst_FLAT__FLAT_LOAD_LDS_USHORT::

        Inst_FLAT__FLAT_LOAD_LDS_USHORT(InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_load_lds_ushort")

    {

        setFlag(Load);


        assert(isFlatGlobal() || isFlatScratch());

    } // Inst_FLAT__FLAT_LOAD_LDS_USHORT


    Inst_FLAT__FLAT_LOAD_LDS_USHORT::~Inst_FLAT__FLAT_LOAD_LDS_USHORT()

    {

    } // ~Inst_FLAT__FLAT_LOAD_LDS_USHORT


    // --- description from .arch file ---

    // Untyped buffer load unsigned short (zero extend to VGPR destination).

    void


    Inst_FLAT__FLAT_LOAD_LDS_USHORT::execute(GPUDynInstPtr gpuDynInst)

    {

        Wavefront *wf = gpuDynInst->wavefront();


        if (gpuDynInst->exec_mask.none()) {

            wf->decVMemInstsIssued();

            return;

        }


        gpuDynInst->execUnitId = wf->execUnitId;

        gpuDynInst->latency.init(gpuDynInst->computeUnit());

        gpuDynInst->latency.set(gpuDynInst->computeUnit()->clockPeriod());


        calcAddr(gpuDynInst, extData.ADDR, extData.SADDR, instData.OFFSET);


        issueRequestHelper(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_LOAD_LDS_USHORT::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initMemRead<VecElemU16>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_LOAD_LDS_USHORT::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        // Align to dword.

        ldsComplete<1>(gpuDynInst);

    } // execute


    // --- Inst_FLAT__FLAT_LOAD_LDS_SSHORT class methods ---


    Inst_FLAT__FLAT_LOAD_LDS_SSHORT::

        Inst_FLAT__FLAT_LOAD_LDS_SSHORT(InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_load_lds_sshort")

    {

        setFlag(Load);


        assert(isFlatGlobal() || isFlatScratch());

    } // Inst_FLAT__FLAT_LOAD_LDS_SSHORT


    Inst_FLAT__FLAT_LOAD_LDS_SSHORT::~Inst_FLAT__FLAT_LOAD_LDS_SSHORT()

    {

    } // ~Inst_FLAT__FLAT_LOAD_LDS_SSHORT


    // --- description from .arch file ---

    // Untyped buffer load signed short (sign extend to VGPR destination).

    void


    Inst_FLAT__FLAT_LOAD_LDS_SSHORT::execute(GPUDynInstPtr gpuDynInst)

    {

        Wavefront *wf = gpuDynInst->wavefront();


        if (gpuDynInst->exec_mask.none()) {

            wf->decVMemInstsIssued();

            return;

        }


        gpuDynInst->execUnitId = wf->execUnitId;

        gpuDynInst->latency.init(gpuDynInst->computeUnit());

        gpuDynInst->latency.set(gpuDynInst->computeUnit()->clockPeriod());


        calcAddr(gpuDynInst, extData.ADDR, extData.SADDR, instData.OFFSET);


        issueRequestHelper(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_LOAD_LDS_SSHORT::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initMemRead<VecElemI16>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_LOAD_LDS_SSHORT::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        // Align to dword.

        ldsComplete<1, 16>(gpuDynInst);

    } // execute


    // --- Inst_FLAT__FLAT_LOAD_LDS_DWORD class methods ---


    Inst_FLAT__FLAT_LOAD_LDS_DWORD::

        Inst_FLAT__FLAT_LOAD_LDS_DWORD(InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_load_lds_dword")

    {

        setFlag(Load);


        assert(isFlatGlobal() || isFlatScratch());

    } // Inst_FLAT__FLAT_LOAD_LDS_DWORD


    Inst_FLAT__FLAT_LOAD_LDS_DWORD::~Inst_FLAT__FLAT_LOAD_LDS_DWORD()

    {

    } // ~Inst_FLAT__FLAT_LOAD_LDS_DWORD


    // --- description from .arch file ---

    // Untyped buffer load dword.

    void


    Inst_FLAT__FLAT_LOAD_LDS_DWORD::execute(GPUDynInstPtr gpuDynInst)

    {

        Wavefront *wf = gpuDynInst->wavefront();


        if (gpuDynInst->exec_mask.none()) {

            wf->decVMemInstsIssued();

            return;

        }


        gpuDynInst->execUnitId = wf->execUnitId;

        gpuDynInst->latency.init(gpuDynInst->computeUnit());

        gpuDynInst->latency.set(gpuDynInst->computeUnit()->clockPeriod());


        calcAddr(gpuDynInst, extData.ADDR, extData.SADDR, instData.OFFSET);


        issueRequestHelper(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_LOAD_LDS_DWORD::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initMemRead<VecElemU32>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_LOAD_LDS_DWORD::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        ldsComplete<1>(gpuDynInst);

    } // completeAcc


    // --- Inst_FLAT__FLAT_ATOMIC_SWAP class methods ---


    Inst_FLAT__FLAT_ATOMIC_SWAP::Inst_FLAT__FLAT_ATOMIC_SWAP(InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_atomic_swap")

    {

        setFlag(AtomicExch);

        if (instData.GLC) {

            setFlag(AtomicReturn);

        } else {

            setFlag(AtomicNoReturn);

        }

        setFlag(MemoryRef);

    } // Inst_FLAT__FLAT_ATOMIC_SWAP


    Inst_FLAT__FLAT_ATOMIC_SWAP::~Inst_FLAT__FLAT_ATOMIC_SWAP()

    {

    } // ~Inst_FLAT__FLAT_ATOMIC_SWAP


    // --- description from .arch file ---

    // 32b:

    // tmp = MEM[ADDR];

    // MEM[ADDR] = DATA;

    // RETURN_DATA = tmp.

    void


    Inst_FLAT__FLAT_ATOMIC_SWAP::execute(GPUDynInstPtr gpuDynInst)

    {

        atomicExecute<ConstVecOperandU32, VecElemU32>(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_ATOMIC_SWAP::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initAtomicAccess<VecElemU32>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_ATOMIC_SWAP::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        atomicComplete<VecOperandU32, VecElemU32>(gpuDynInst);

    } // completeAcc


    // --- Inst_FLAT__FLAT_ATOMIC_CMPSWAP class methods ---


    Inst_FLAT__FLAT_ATOMIC_CMPSWAP

        ::Inst_FLAT__FLAT_ATOMIC_CMPSWAP(InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_atomic_cmpswap")

    {

        setFlag(AtomicCAS);

        if (instData.GLC) {

            setFlag(AtomicReturn);

        } else {

            setFlag(AtomicNoReturn);

        }

        setFlag(MemoryRef);

    } // Inst_FLAT__FLAT_ATOMIC_CMPSWAP


    Inst_FLAT__FLAT_ATOMIC_CMPSWAP::~Inst_FLAT__FLAT_ATOMIC_CMPSWAP()

    {

    } // ~Inst_FLAT__FLAT_ATOMIC_CMPSWAP


    // --- description from .arch file ---

    // 32b:

    // tmp = MEM[ADDR];

    // src = DATA[0];

    // cmp = DATA[1];

    // MEM[ADDR] = (tmp == cmp) ? src : tmp;

    // RETURN_DATA[0] = tmp.

    void


    Inst_FLAT__FLAT_ATOMIC_CMPSWAP::execute(GPUDynInstPtr gpuDynInst)

    {

        atomicExecute<ConstVecOperandU32, VecElemU32, 1>(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_ATOMIC_CMPSWAP::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initAtomicAccess<VecElemU32>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_ATOMIC_CMPSWAP::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        atomicComplete<VecOperandU32, VecElemU32>(gpuDynInst);

    } // completeAcc


    // --- Inst_FLAT__FLAT_ATOMIC_ADD class methods ---


    Inst_FLAT__FLAT_ATOMIC_ADD::Inst_FLAT__FLAT_ATOMIC_ADD(InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_atomic_add")

    {

        setFlag(AtomicAdd);

        if (instData.GLC) {

            setFlag(AtomicReturn);

        } else {

            setFlag(AtomicNoReturn);

        }

        setFlag(MemoryRef);

    } // Inst_FLAT__FLAT_ATOMIC_ADD


    Inst_FLAT__FLAT_ATOMIC_ADD::~Inst_FLAT__FLAT_ATOMIC_ADD()

    {

    } // ~Inst_FLAT__FLAT_ATOMIC_ADD


    // --- description from .arch file ---

    // 32b:

    // tmp = MEM[ADDR];

    // MEM[ADDR] += DATA;

    // RETURN_DATA = tmp.

    void


    Inst_FLAT__FLAT_ATOMIC_ADD::execute(GPUDynInstPtr gpuDynInst)

    {

        atomicExecute<ConstVecOperandU32, VecElemU32>(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_ATOMIC_ADD::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initAtomicAccess<VecElemU32>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_ATOMIC_ADD::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        atomicComplete<VecOperandU32, VecElemU32>(gpuDynInst);

    } // completeAcc


    // --- Inst_FLAT__FLAT_ATOMIC_SUB class methods ---


    Inst_FLAT__FLAT_ATOMIC_SUB::Inst_FLAT__FLAT_ATOMIC_SUB(InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_atomic_sub")

    {

        setFlag(AtomicSub);

        if (instData.GLC) {

            setFlag(AtomicReturn);

        } else {

            setFlag(AtomicNoReturn);

        }

        setFlag(MemoryRef);

    } // Inst_FLAT__FLAT_ATOMIC_SUB


    Inst_FLAT__FLAT_ATOMIC_SUB::~Inst_FLAT__FLAT_ATOMIC_SUB()

    {

    } // ~Inst_FLAT__FLAT_ATOMIC_SUB


    // --- description from .arch file ---

    // 32b:

    // tmp = MEM[ADDR];

    // MEM[ADDR] -= DATA;

    // RETURN_DATA = tmp.

    void


    Inst_FLAT__FLAT_ATOMIC_SUB::execute(GPUDynInstPtr gpuDynInst)

    {

        atomicExecute<ConstVecOperandU32, VecElemU32>(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_ATOMIC_SUB::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initAtomicAccess<VecElemU32>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_ATOMIC_SUB::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        atomicComplete<VecOperandU32, VecElemU32>(gpuDynInst);

    } // completeAcc


    // --- Inst_FLAT__FLAT_ATOMIC_SMIN class methods ---


    Inst_FLAT__FLAT_ATOMIC_SMIN::Inst_FLAT__FLAT_ATOMIC_SMIN(InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_atomic_smin")

    {

        setFlag(AtomicMin);

        if (instData.GLC) {

            setFlag(AtomicReturn);

        } else {

            setFlag(AtomicNoReturn);

        }

        setFlag(MemoryRef);

    } // Inst_FLAT__FLAT_ATOMIC_SMIN


    Inst_FLAT__FLAT_ATOMIC_SMIN::~Inst_FLAT__FLAT_ATOMIC_SMIN()

    {

    } // ~Inst_FLAT__FLAT_ATOMIC_SMIN


    // --- description from .arch file ---

    // 32b:

    // tmp = MEM[ADDR];

    // MEM[ADDR] = (DATA < tmp) ? DATA : tmp (signed compare);

    // RETURN_DATA = tmp.

    void


    Inst_FLAT__FLAT_ATOMIC_SMIN::execute(GPUDynInstPtr gpuDynInst)

    {

        atomicExecute<ConstVecOperandI32, VecElemI32>(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_ATOMIC_SMIN::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initAtomicAccess<VecElemI32>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_ATOMIC_SMIN::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        atomicComplete<VecOperandI32, VecElemI32>(gpuDynInst);

    } // completeAcc


    // --- Inst_FLAT__FLAT_ATOMIC_UMIN class methods ---


    Inst_FLAT__FLAT_ATOMIC_UMIN::Inst_FLAT__FLAT_ATOMIC_UMIN(InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_atomic_umin")

    {

        setFlag(AtomicMin);

        if (instData.GLC) {

            setFlag(AtomicReturn);

        } else {

            setFlag(AtomicNoReturn);

        }

        setFlag(MemoryRef);

    } // Inst_FLAT__FLAT_ATOMIC_UMIN


    Inst_FLAT__FLAT_ATOMIC_UMIN::~Inst_FLAT__FLAT_ATOMIC_UMIN()

    {

    } // ~Inst_FLAT__FLAT_ATOMIC_UMIN


    // --- description from .arch file ---

    // 32b:

    // tmp = MEM[ADDR];

    // MEM[ADDR] = (DATA < tmp) ? DATA : tmp (unsigned compare);

    // RETURN_DATA = tmp.

    void


    Inst_FLAT__FLAT_ATOMIC_UMIN::execute(GPUDynInstPtr gpuDynInst)

    {

        atomicExecute<ConstVecOperandU32, VecElemU32>(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_ATOMIC_UMIN::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initAtomicAccess<VecElemU32>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_ATOMIC_UMIN::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        atomicComplete<VecOperandU32, VecElemU32>(gpuDynInst);

    } // completeAcc


    // --- Inst_FLAT__FLAT_ATOMIC_SMAX class methods ---


    Inst_FLAT__FLAT_ATOMIC_SMAX::Inst_FLAT__FLAT_ATOMIC_SMAX(InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_atomic_smax")

    {

        setFlag(AtomicMax);

        if (instData.GLC) {

            setFlag(AtomicReturn);

        } else {

            setFlag(AtomicNoReturn);

        }

        setFlag(MemoryRef);

    } // Inst_FLAT__FLAT_ATOMIC_SMAX


    Inst_FLAT__FLAT_ATOMIC_SMAX::~Inst_FLAT__FLAT_ATOMIC_SMAX()

    {

    } // ~Inst_FLAT__FLAT_ATOMIC_SMAX


    // --- description from .arch file ---

    // 32b:

    // tmp = MEM[ADDR];

    // MEM[ADDR] = (DATA > tmp) ? DATA : tmp (signed compare);

    // RETURN_DATA = tmp.

    void


    Inst_FLAT__FLAT_ATOMIC_SMAX::execute(GPUDynInstPtr gpuDynInst)

    {

        atomicExecute<ConstVecOperandI32, VecElemI32>(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_ATOMIC_SMAX::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initAtomicAccess<VecElemI32>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_ATOMIC_SMAX::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        atomicComplete<VecOperandI32, VecElemI32>(gpuDynInst);

    } // completeAcc


    // --- Inst_FLAT__FLAT_ATOMIC_UMAX class methods ---


    Inst_FLAT__FLAT_ATOMIC_UMAX::Inst_FLAT__FLAT_ATOMIC_UMAX(InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_atomic_umax")

    {

        setFlag(AtomicMax);

        if (instData.GLC) {

            setFlag(AtomicReturn);

        } else {

            setFlag(AtomicNoReturn);

        }

        setFlag(MemoryRef);

    } // Inst_FLAT__FLAT_ATOMIC_UMAX


    Inst_FLAT__FLAT_ATOMIC_UMAX::~Inst_FLAT__FLAT_ATOMIC_UMAX()

    {

    } // ~Inst_FLAT__FLAT_ATOMIC_UMAX


    // --- description from .arch file ---

    // 32b:

    // tmp = MEM[ADDR];

    // MEM[ADDR] = (DATA > tmp) ? DATA : tmp (unsigned compare);

    // RETURN_DATA = tmp.

    void


    Inst_FLAT__FLAT_ATOMIC_UMAX::execute(GPUDynInstPtr gpuDynInst)

    {

        atomicExecute<ConstVecOperandU32, VecElemU32>(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_ATOMIC_UMAX::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initAtomicAccess<VecElemU32>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_ATOMIC_UMAX::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        atomicComplete<VecOperandU32, VecElemU32>(gpuDynInst);

    } // completeAcc


    // --- Inst_FLAT__FLAT_ATOMIC_AND class methods ---


    Inst_FLAT__FLAT_ATOMIC_AND::Inst_FLAT__FLAT_ATOMIC_AND(InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_atomic_and")

    {

        setFlag(AtomicAnd);

        if (instData.GLC) {

            setFlag(AtomicReturn);

        } else {

            setFlag(AtomicNoReturn);

        }

        setFlag(MemoryRef);

    } // Inst_FLAT__FLAT_ATOMIC_AND


    Inst_FLAT__FLAT_ATOMIC_AND::~Inst_FLAT__FLAT_ATOMIC_AND()

    {

    } // ~Inst_FLAT__FLAT_ATOMIC_AND


    // --- description from .arch file ---

    // 32b:

    // tmp = MEM[ADDR];

    // MEM[ADDR] &= DATA;

    // RETURN_DATA = tmp.

    void


    Inst_FLAT__FLAT_ATOMIC_AND::execute(GPUDynInstPtr gpuDynInst)

    {

        atomicExecute<ConstVecOperandU32, VecElemU32>(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_ATOMIC_AND::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initAtomicAccess<VecElemU32>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_ATOMIC_AND::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        atomicComplete<VecOperandU32, VecElemU32>(gpuDynInst);

    } // completeAcc


    // --- Inst_FLAT__FLAT_ATOMIC_OR class methods ---


    Inst_FLAT__FLAT_ATOMIC_OR::Inst_FLAT__FLAT_ATOMIC_OR(InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_atomic_or")

    {

        setFlag(AtomicOr);

        if (instData.GLC) {

            setFlag(AtomicReturn);

        } else {

            setFlag(AtomicNoReturn);

        }

        setFlag(MemoryRef);

    } // Inst_FLAT__FLAT_ATOMIC_OR


    Inst_FLAT__FLAT_ATOMIC_OR::~Inst_FLAT__FLAT_ATOMIC_OR()

    {

    } // ~Inst_FLAT__FLAT_ATOMIC_OR


    // --- description from .arch file ---

    // 32b:

    // tmp = MEM[ADDR];

    // MEM[ADDR] |= DATA;

    // RETURN_DATA = tmp.

    void


    Inst_FLAT__FLAT_ATOMIC_OR::execute(GPUDynInstPtr gpuDynInst)

    {

        atomicExecute<ConstVecOperandU32, VecElemU32>(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_ATOMIC_OR::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initAtomicAccess<VecElemU32>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_ATOMIC_OR::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        atomicComplete<VecOperandU32, VecElemU32>(gpuDynInst);

    } // completeAcc


    // --- Inst_FLAT__FLAT_ATOMIC_XOR class methods ---


    Inst_FLAT__FLAT_ATOMIC_XOR::Inst_FLAT__FLAT_ATOMIC_XOR(InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_atomic_xor")

    {

        setFlag(AtomicXor);

        if (instData.GLC) {

            setFlag(AtomicReturn);

        } else {

            setFlag(AtomicNoReturn);

        }

        setFlag(MemoryRef);

    } // Inst_FLAT__FLAT_ATOMIC_XOR


    Inst_FLAT__FLAT_ATOMIC_XOR::~Inst_FLAT__FLAT_ATOMIC_XOR()

    {

    } // ~Inst_FLAT__FLAT_ATOMIC_XOR


    // --- description from .arch file ---

    // 32b:

    // tmp = MEM[ADDR];

    // MEM[ADDR] ^= DATA;

    // RETURN_DATA = tmp.

    void


    Inst_FLAT__FLAT_ATOMIC_XOR::execute(GPUDynInstPtr gpuDynInst)

    {

        atomicExecute<ConstVecOperandU32, VecElemU32>(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_ATOMIC_XOR::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initAtomicAccess<VecElemU32>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_ATOMIC_XOR::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        atomicComplete<VecOperandU32, VecElemU32>(gpuDynInst);

    } // completeAcc


    // --- Inst_FLAT__FLAT_ATOMIC_INC class methods ---


    Inst_FLAT__FLAT_ATOMIC_INC::Inst_FLAT__FLAT_ATOMIC_INC(InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_atomic_inc")

    {

        setFlag(AtomicInc);

        if (instData.GLC) {

            setFlag(AtomicReturn);

        } else {

            setFlag(AtomicNoReturn);

        }

        setFlag(MemoryRef);

    } // Inst_FLAT__FLAT_ATOMIC_INC


    Inst_FLAT__FLAT_ATOMIC_INC::~Inst_FLAT__FLAT_ATOMIC_INC()

    {

    } // ~Inst_FLAT__FLAT_ATOMIC_INC


    // --- description from .arch file ---

    // 32b:

    // tmp = MEM[ADDR];

    // MEM[ADDR] = (tmp >= DATA) ? 0 : tmp + 1 (unsigned compare);

    // RETURN_DATA = tmp.

    void


    Inst_FLAT__FLAT_ATOMIC_INC::execute(GPUDynInstPtr gpuDynInst)

    {

        atomicExecute<ConstVecOperandU32, VecElemU32>(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_ATOMIC_INC::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initAtomicAccess<VecElemU32>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_ATOMIC_INC::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        atomicComplete<VecOperandU32, VecElemU32>(gpuDynInst);

    } // completeAcc


    // --- Inst_FLAT__FLAT_ATOMIC_DEC class methods ---


    Inst_FLAT__FLAT_ATOMIC_DEC::Inst_FLAT__FLAT_ATOMIC_DEC(InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_atomic_dec")

    {

        setFlag(AtomicDec);

        if (instData.GLC) {

            setFlag(AtomicReturn);

        } else {

            setFlag(AtomicNoReturn);

        }

        setFlag(MemoryRef);

    } // Inst_FLAT__FLAT_ATOMIC_DEC


    Inst_FLAT__FLAT_ATOMIC_DEC::~Inst_FLAT__FLAT_ATOMIC_DEC()

    {

    } // ~Inst_FLAT__FLAT_ATOMIC_DEC


    // --- description from .arch file ---

    // 32b:

    // tmp = MEM[ADDR];

    // MEM[ADDR] = (tmp == 0 || tmp > DATA) ? DATA : tmp - 1

    // (unsigned compare); RETURN_DATA = tmp.

    void


    Inst_FLAT__FLAT_ATOMIC_DEC::execute(GPUDynInstPtr gpuDynInst)

    {

        atomicExecute<ConstVecOperandU32, VecElemU32>(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_ATOMIC_DEC::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initAtomicAccess<VecElemU32>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_ATOMIC_DEC::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        atomicComplete<VecOperandU32, VecElemU32>(gpuDynInst);

    } // completeAcc


    // --- Inst_FLAT__FLAT_ATOMIC_SWAP_X2 class methods ---


    Inst_FLAT__FLAT_ATOMIC_SWAP_X2::Inst_FLAT__FLAT_ATOMIC_SWAP_X2(

          InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_atomic_swap_x2")

    {

        setFlag(AtomicExch);

        if (instData.GLC) {

            setFlag(AtomicReturn);

        } else {

            setFlag(AtomicNoReturn);

        }

        setFlag(MemoryRef);

    } // Inst_FLAT__FLAT_ATOMIC_SWAP_X2


    Inst_FLAT__FLAT_ATOMIC_SWAP_X2::~Inst_FLAT__FLAT_ATOMIC_SWAP_X2()

    {

    } // ~Inst_FLAT__FLAT_ATOMIC_SWAP_X2


    // --- description from .arch file ---

    // 64b:

    // tmp = MEM[ADDR];

    // MEM[ADDR] = DATA[0:1];

    // RETURN_DATA[0:1] = tmp.

    void


    Inst_FLAT__FLAT_ATOMIC_SWAP_X2::execute(GPUDynInstPtr gpuDynInst)

    {

        atomicExecute<ConstVecOperandU64, VecElemU64>(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_ATOMIC_SWAP_X2::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initAtomicAccess<VecElemU64>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_ATOMIC_SWAP_X2::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        atomicComplete<VecOperandU64, VecElemU64>(gpuDynInst);

    } // completeAcc


    // --- Inst_FLAT__FLAT_ATOMIC_CMPSWAP_X2 class methods ---


    Inst_FLAT__FLAT_ATOMIC_CMPSWAP_X2::Inst_FLAT__FLAT_ATOMIC_CMPSWAP_X2(

          InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_atomic_cmpswap_x2")

    {

        setFlag(AtomicCAS);

        if (instData.GLC) {

            setFlag(AtomicReturn);

        } else {

            setFlag(AtomicNoReturn);

        }

        setFlag(MemoryRef);

    } // Inst_FLAT__FLAT_ATOMIC_CMPSWAP_X2


    Inst_FLAT__FLAT_ATOMIC_CMPSWAP_X2::~Inst_FLAT__FLAT_ATOMIC_CMPSWAP_X2()

    {

    } // ~Inst_FLAT__FLAT_ATOMIC_CMPSWAP_X2


    // --- description from .arch file ---

    // 64b:

    // tmp = MEM[ADDR];

    // src = DATA[0:1];

    // cmp = DATA[2:3];

    // MEM[ADDR] = (tmp == cmp) ? src : tmp;

    // RETURN_DATA[0:1] = tmp.

    void


    Inst_FLAT__FLAT_ATOMIC_CMPSWAP_X2::execute(GPUDynInstPtr gpuDynInst)

    {

        atomicExecute<ConstVecOperandU64, VecElemU64, 2>(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_ATOMIC_CMPSWAP_X2::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initAtomicAccess<VecElemU64>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_ATOMIC_CMPSWAP_X2::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        atomicComplete<VecOperandU64, VecElemU64>(gpuDynInst);

    } // completeAcc


    // --- Inst_FLAT__FLAT_ATOMIC_ADD_X2 class methods ---


    Inst_FLAT__FLAT_ATOMIC_ADD_X2::Inst_FLAT__FLAT_ATOMIC_ADD_X2(

          InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_atomic_add_x2")

    {

        setFlag(AtomicAdd);

        if (instData.GLC) {

            setFlag(AtomicReturn);

        } else {

            setFlag(AtomicNoReturn);

        }

        setFlag(MemoryRef);

    } // Inst_FLAT__FLAT_ATOMIC_ADD_X2


    Inst_FLAT__FLAT_ATOMIC_ADD_X2::~Inst_FLAT__FLAT_ATOMIC_ADD_X2()

    {

    } // ~Inst_FLAT__FLAT_ATOMIC_ADD_X2


    // --- description from .arch file ---

    // 64b:

    // tmp = MEM[ADDR];

    // MEM[ADDR] += DATA[0:1];

    // RETURN_DATA[0:1] = tmp.

    void


    Inst_FLAT__FLAT_ATOMIC_ADD_X2::execute(GPUDynInstPtr gpuDynInst)

    {

        atomicExecute<ConstVecOperandU64, VecElemU64>(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_ATOMIC_ADD_X2::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initAtomicAccess<VecElemU64>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_ATOMIC_ADD_X2::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        atomicComplete<VecOperandU64, VecElemU64>(gpuDynInst);

    } // completeAcc


    // --- Inst_FLAT__FLAT_ATOMIC_SUB_X2 class methods ---


    Inst_FLAT__FLAT_ATOMIC_SUB_X2::Inst_FLAT__FLAT_ATOMIC_SUB_X2(

          InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_atomic_sub_x2")

    {

        setFlag(AtomicSub);

        if (instData.GLC) {

            setFlag(AtomicReturn);

        } else {

            setFlag(AtomicNoReturn);

        }

        setFlag(MemoryRef);

    } // Inst_FLAT__FLAT_ATOMIC_SUB_X2


    Inst_FLAT__FLAT_ATOMIC_SUB_X2::~Inst_FLAT__FLAT_ATOMIC_SUB_X2()

    {

    } // ~Inst_FLAT__FLAT_ATOMIC_SUB_X2


    // --- description from .arch file ---

    // 64b:

    // tmp = MEM[ADDR];

    // MEM[ADDR] -= DATA[0:1];

    // RETURN_DATA[0:1] = tmp.

    void


    Inst_FLAT__FLAT_ATOMIC_SUB_X2::execute(GPUDynInstPtr gpuDynInst)

    {

        atomicExecute<ConstVecOperandU64, VecElemU64>(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_ATOMIC_SUB_X2::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initAtomicAccess<VecElemU64>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_ATOMIC_SUB_X2::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        atomicComplete<VecOperandU64, VecElemU64>(gpuDynInst);

    } // completeAcc


    // --- Inst_FLAT__FLAT_ATOMIC_SMIN_X2 class methods ---


    Inst_FLAT__FLAT_ATOMIC_SMIN_X2::Inst_FLAT__FLAT_ATOMIC_SMIN_X2(

          InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_atomic_smin_x2")

    {

        setFlag(AtomicMin);

        if (instData.GLC) {

            setFlag(AtomicReturn);

        } else {

            setFlag(AtomicNoReturn);

        }

        setFlag(MemoryRef);

    } // Inst_FLAT__FLAT_ATOMIC_SMIN_X2


    Inst_FLAT__FLAT_ATOMIC_SMIN_X2::~Inst_FLAT__FLAT_ATOMIC_SMIN_X2()

    {

    } // ~Inst_FLAT__FLAT_ATOMIC_SMIN_X2


    // --- description from .arch file ---

    // 64b:

    // tmp = MEM[ADDR];

    // MEM[ADDR] -= (DATA[0:1] < tmp) ? DATA[0:1] : tmp (signed compare);

    // RETURN_DATA[0:1] = tmp.

    void


    Inst_FLAT__FLAT_ATOMIC_SMIN_X2::execute(GPUDynInstPtr gpuDynInst)

    {

        atomicExecute<ConstVecOperandI64, VecElemI64>(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_ATOMIC_SMIN_X2::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initAtomicAccess<VecElemI64>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_ATOMIC_SMIN_X2::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        atomicComplete<VecOperandI64, VecElemI64>(gpuDynInst);

    } // completeAcc


    // --- Inst_FLAT__FLAT_ATOMIC_UMIN_X2 class methods ---


    Inst_FLAT__FLAT_ATOMIC_UMIN_X2::Inst_FLAT__FLAT_ATOMIC_UMIN_X2(

          InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_atomic_umin_x2")

    {

        setFlag(AtomicMin);

        if (instData.GLC) {

            setFlag(AtomicReturn);

        } else {

            setFlag(AtomicNoReturn);

        }

        setFlag(MemoryRef);

    } // Inst_FLAT__FLAT_ATOMIC_UMIN_X2


    Inst_FLAT__FLAT_ATOMIC_UMIN_X2::~Inst_FLAT__FLAT_ATOMIC_UMIN_X2()

    {

    } // ~Inst_FLAT__FLAT_ATOMIC_UMIN_X2


    // --- description from .arch file ---

    // 64b:

    // tmp = MEM[ADDR];

    // MEM[ADDR] -= (DATA[0:1] < tmp) ? DATA[0:1] : tmp (unsigned compare);

    // RETURN_DATA[0:1] = tmp.

    void


    Inst_FLAT__FLAT_ATOMIC_UMIN_X2::execute(GPUDynInstPtr gpuDynInst)

    {

        atomicExecute<ConstVecOperandU64, VecElemU64>(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_ATOMIC_UMIN_X2::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initAtomicAccess<VecElemU64>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_ATOMIC_UMIN_X2::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        atomicComplete<VecOperandU64, VecElemU64>(gpuDynInst);

    } // completeAcc


    // --- Inst_FLAT__FLAT_ATOMIC_SMAX_X2 class methods ---


    Inst_FLAT__FLAT_ATOMIC_SMAX_X2::Inst_FLAT__FLAT_ATOMIC_SMAX_X2(

          InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_atomic_smax_x2")

    {

        setFlag(AtomicMax);

        if (instData.GLC) {

            setFlag(AtomicReturn);

        } else {

            setFlag(AtomicNoReturn);

        }

        setFlag(MemoryRef);

    } // Inst_FLAT__FLAT_ATOMIC_SMAX_X2


    Inst_FLAT__FLAT_ATOMIC_SMAX_X2::~Inst_FLAT__FLAT_ATOMIC_SMAX_X2()

    {

    } // ~Inst_FLAT__FLAT_ATOMIC_SMAX_X2


    // --- description from .arch file ---

    // 64b:

    // tmp = MEM[ADDR];

    // MEM[ADDR] -= (DATA[0:1] > tmp) ? DATA[0:1] : tmp (signed compare);

    // RETURN_DATA[0:1] = tmp.

    void


    Inst_FLAT__FLAT_ATOMIC_SMAX_X2::execute(GPUDynInstPtr gpuDynInst)

    {

        atomicExecute<ConstVecOperandI64, VecElemI64>(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_ATOMIC_SMAX_X2::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initAtomicAccess<VecElemI64>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_ATOMIC_SMAX_X2::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        atomicComplete<VecOperandI64, VecElemI64>(gpuDynInst);

    } // completeAcc


    // --- Inst_FLAT__FLAT_ATOMIC_UMAX_X2 class methods ---


    Inst_FLAT__FLAT_ATOMIC_UMAX_X2::Inst_FLAT__FLAT_ATOMIC_UMAX_X2(

          InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_atomic_umax_x2")

    {

        setFlag(AtomicMax);

        if (instData.GLC) {

            setFlag(AtomicReturn);

        } else {

            setFlag(AtomicNoReturn);

        }

        setFlag(MemoryRef);

    } // Inst_FLAT__FLAT_ATOMIC_UMAX_X2


    Inst_FLAT__FLAT_ATOMIC_UMAX_X2::~Inst_FLAT__FLAT_ATOMIC_UMAX_X2()

    {

    } // ~Inst_FLAT__FLAT_ATOMIC_UMAX_X2


    // --- description from .arch file ---

    // 64b:

    // tmp = MEM[ADDR];

    // MEM[ADDR] -= (DATA[0:1] > tmp) ? DATA[0:1] : tmp (unsigned compare);

    // RETURN_DATA[0:1] = tmp.

    void


    Inst_FLAT__FLAT_ATOMIC_UMAX_X2::execute(GPUDynInstPtr gpuDynInst)

    {

        atomicExecute<ConstVecOperandU64, VecElemU64>(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_ATOMIC_UMAX_X2::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initAtomicAccess<VecElemU64>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_ATOMIC_UMAX_X2::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        atomicComplete<VecOperandU64, VecElemU64>(gpuDynInst);

    } // completeAcc


    // --- Inst_FLAT__FLAT_ATOMIC_AND_X2 class methods ---


    Inst_FLAT__FLAT_ATOMIC_AND_X2::Inst_FLAT__FLAT_ATOMIC_AND_X2(

          InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_atomic_and_x2")

    {

        setFlag(AtomicAnd);

        if (instData.GLC) {

            setFlag(AtomicReturn);

        } else {

            setFlag(AtomicNoReturn);

        }

        setFlag(MemoryRef);

    } // Inst_FLAT__FLAT_ATOMIC_AND_X2


    Inst_FLAT__FLAT_ATOMIC_AND_X2::~Inst_FLAT__FLAT_ATOMIC_AND_X2()

    {

    } // ~Inst_FLAT__FLAT_ATOMIC_AND_X2


    // --- description from .arch file ---

    // 64b:

    // tmp = MEM[ADDR];

    // MEM[ADDR] &= DATA[0:1];

    // RETURN_DATA[0:1] = tmp.

    void


    Inst_FLAT__FLAT_ATOMIC_AND_X2::execute(GPUDynInstPtr gpuDynInst)

    {

        atomicExecute<ConstVecOperandU64, VecElemU64>(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_ATOMIC_AND_X2::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initAtomicAccess<VecElemU64>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_ATOMIC_AND_X2::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        atomicComplete<VecOperandU64, VecElemU64>(gpuDynInst);

    } // completeAcc


    // --- Inst_FLAT__FLAT_ATOMIC_OR_X2 class methods ---


    Inst_FLAT__FLAT_ATOMIC_OR_X2::Inst_FLAT__FLAT_ATOMIC_OR_X2(

          InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_atomic_or_x2")

    {

        setFlag(AtomicOr);

        if (instData.GLC) {

            setFlag(AtomicReturn);

        } else {

            setFlag(AtomicNoReturn);

        }

        setFlag(MemoryRef);

    } // Inst_FLAT__FLAT_ATOMIC_OR_X2


    Inst_FLAT__FLAT_ATOMIC_OR_X2::~Inst_FLAT__FLAT_ATOMIC_OR_X2()

    {

    } // ~Inst_FLAT__FLAT_ATOMIC_OR_X2


    // --- description from .arch file ---

    // 64b:

    // tmp = MEM[ADDR];

    // MEM[ADDR] |= DATA[0:1];

    // RETURN_DATA[0:1] = tmp.

    void


    Inst_FLAT__FLAT_ATOMIC_OR_X2::execute(GPUDynInstPtr gpuDynInst)

    {

        atomicExecute<ConstVecOperandU64, VecElemU64>(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_ATOMIC_OR_X2::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initAtomicAccess<VecElemU64>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_ATOMIC_OR_X2::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        atomicComplete<VecOperandU64, VecElemU64>(gpuDynInst);

    } // completeAcc


    // --- Inst_FLAT__FLAT_ATOMIC_XOR_X2 class methods ---


    Inst_FLAT__FLAT_ATOMIC_XOR_X2::Inst_FLAT__FLAT_ATOMIC_XOR_X2(

          InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_atomic_xor_x2")

    {

        setFlag(AtomicXor);

        if (instData.GLC) {

            setFlag(AtomicReturn);

        } else {

            setFlag(AtomicNoReturn);

        }

        setFlag(MemoryRef);

    } // Inst_FLAT__FLAT_ATOMIC_XOR_X2


    Inst_FLAT__FLAT_ATOMIC_XOR_X2::~Inst_FLAT__FLAT_ATOMIC_XOR_X2()

    {

    } // ~Inst_FLAT__FLAT_ATOMIC_XOR_X2


    // --- description from .arch file ---

    // 64b:

    // tmp = MEM[ADDR];

    // MEM[ADDR] ^= DATA[0:1];

    // RETURN_DATA[0:1] = tmp.

    void


    Inst_FLAT__FLAT_ATOMIC_XOR_X2::execute(GPUDynInstPtr gpuDynInst)

    {

        atomicExecute<ConstVecOperandU64, VecElemU64>(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_ATOMIC_XOR_X2::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initAtomicAccess<VecElemU64>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_ATOMIC_XOR_X2::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        atomicComplete<VecOperandU64, VecElemU64>(gpuDynInst);

    } // completeAcc


    // --- Inst_FLAT__FLAT_ATOMIC_INC_X2 class methods ---


    Inst_FLAT__FLAT_ATOMIC_INC_X2::Inst_FLAT__FLAT_ATOMIC_INC_X2(

          InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_atomic_inc_x2")

    {

        setFlag(AtomicInc);

        if (instData.GLC) {

            setFlag(AtomicReturn);

        } else {

            setFlag(AtomicNoReturn);

        }

        setFlag(MemoryRef);

    } // Inst_FLAT__FLAT_ATOMIC_INC_X2


    Inst_FLAT__FLAT_ATOMIC_INC_X2::~Inst_FLAT__FLAT_ATOMIC_INC_X2()

    {

    } // ~Inst_FLAT__FLAT_ATOMIC_INC_X2


    // --- description from .arch file ---

    // 64b:

    // tmp = MEM[ADDR];

    // MEM[ADDR] = (tmp >= DATA[0:1]) ? 0 : tmp + 1 (unsigned compare);

    // RETURN_DATA[0:1] = tmp.

    void


    Inst_FLAT__FLAT_ATOMIC_INC_X2::execute(GPUDynInstPtr gpuDynInst)

    {

        atomicExecute<ConstVecOperandU64, VecElemU64>(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_ATOMIC_INC_X2::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initAtomicAccess<VecElemU64>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_ATOMIC_INC_X2::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        atomicComplete<VecOperandU64, VecElemU64>(gpuDynInst);

    } // completeAcc


    // --- Inst_FLAT__FLAT_ATOMIC_DEC_X2 class methods ---


    Inst_FLAT__FLAT_ATOMIC_DEC_X2::Inst_FLAT__FLAT_ATOMIC_DEC_X2(

        InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_atomic_dec_x2")

    {

        setFlag(AtomicDec);

        if (instData.GLC) {

            setFlag(AtomicReturn);

        } else {

            setFlag(AtomicNoReturn);

        }

        setFlag(MemoryRef);

    } // Inst_FLAT__FLAT_ATOMIC_DEC_X2


    Inst_FLAT__FLAT_ATOMIC_DEC_X2::~Inst_FLAT__FLAT_ATOMIC_DEC_X2()

    {

    } // ~Inst_FLAT__FLAT_ATOMIC_DEC_X2


    // --- description from .arch file ---

    // 64b:

    // tmp = MEM[ADDR];

    // MEM[ADDR] = (tmp == 0 || tmp > DATA[0:1]) ? DATA[0:1] : tmp - 1

    // (unsigned compare);

    // RETURN_DATA[0:1] = tmp.

    void


    Inst_FLAT__FLAT_ATOMIC_DEC_X2::execute(GPUDynInstPtr gpuDynInst)

    {

        atomicExecute<ConstVecOperandU64, VecElemU64>(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_ATOMIC_DEC_X2::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initAtomicAccess<VecElemU64>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_ATOMIC_DEC_X2::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        atomicComplete<VecOperandU64, VecElemU64>(gpuDynInst);

    } // completeAcc


    // --- Inst_FLAT__FLAT_ATOMIC_ADD_F32 class methods ---


    Inst_FLAT__FLAT_ATOMIC_ADD_F32::Inst_FLAT__FLAT_ATOMIC_ADD_F32(

        InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_atomic_add_f32")

    {

        setFlag(AtomicAdd);

        if (instData.GLC) {

            setFlag(AtomicReturn);

        } else {

            setFlag(AtomicNoReturn);

        }

        setFlag(MemoryRef);

    } // Inst_FLAT__FLAT_ATOMIC_ADD_F32


    Inst_FLAT__FLAT_ATOMIC_ADD_F32::~Inst_FLAT__FLAT_ATOMIC_ADD_F32()

    {

    } // ~Inst_FLAT__FLAT_ATOMIC_ADD_F32


    void


    Inst_FLAT__FLAT_ATOMIC_ADD_F32::execute(GPUDynInstPtr gpuDynInst)

    {

        atomicExecute<ConstVecOperandF32, VecElemF32>(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_ATOMIC_ADD_F32::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initAtomicAccess<VecElemF32>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_ATOMIC_ADD_F32::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        atomicComplete<VecOperandF32, VecElemF32>(gpuDynInst);

    } // completeAcc


    // --- Inst_FLAT__FLAT_ATOMIC_PK_ADD_F16 class methods ---


    Inst_FLAT__FLAT_ATOMIC_PK_ADD_F16::Inst_FLAT__FLAT_ATOMIC_PK_ADD_F16(

        InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_atomic_pk_add_f16")

    {

        setFlag(AtomicAdd);

        if (instData.GLC) {

            setFlag(AtomicReturn);

        } else {

            setFlag(AtomicNoReturn);

        }

        setFlag(MemoryRef);

    } // Inst_FLAT__FLAT_ATOMIC_PK_ADD_F16


    Inst_FLAT__FLAT_ATOMIC_PK_ADD_F16::~Inst_FLAT__FLAT_ATOMIC_PK_ADD_F16()

    {

    } // ~Inst_FLAT__FLAT_ATOMIC_PK_ADD_F16


    void


    Inst_FLAT__FLAT_ATOMIC_PK_ADD_F16::execute(GPUDynInstPtr gpuDynInst)

    {

        panicUnimplemented();

    } // execute


    void


    Inst_FLAT__FLAT_ATOMIC_PK_ADD_F16::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

    } // initiateAcc


    void


    Inst_FLAT__FLAT_ATOMIC_PK_ADD_F16::completeAcc(GPUDynInstPtr gpuDynInst)

    {

    } // completeAcc


    // --- Inst_FLAT__FLAT_ATOMIC_ADD_F64 class methods ---


    Inst_FLAT__FLAT_ATOMIC_ADD_F64::Inst_FLAT__FLAT_ATOMIC_ADD_F64(

        InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_atomic_add_f64")

    {

        setFlag(AtomicAdd);

        if (instData.GLC) {

            setFlag(AtomicReturn);

        } else {

            setFlag(AtomicNoReturn);

        }

        setFlag(MemoryRef);

    } // Inst_FLAT__FLAT_ATOMIC_ADD_F64


    Inst_FLAT__FLAT_ATOMIC_ADD_F64::~Inst_FLAT__FLAT_ATOMIC_ADD_F64()

    {

    } // ~Inst_FLAT__FLAT_ATOMIC_ADD_F64


    void


    Inst_FLAT__FLAT_ATOMIC_ADD_F64::execute(GPUDynInstPtr gpuDynInst)

    {

        atomicExecute<ConstVecOperandF64, VecElemF64>(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_ATOMIC_ADD_F64::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initAtomicAccess<VecElemF64>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_ATOMIC_ADD_F64::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        atomicComplete<VecOperandF64, VecElemF64>(gpuDynInst);

    } // completeAcc


    // --- Inst_FLAT__FLAT_ATOMIC_MIN_F64 class methods ---


    Inst_FLAT__FLAT_ATOMIC_MIN_F64::Inst_FLAT__FLAT_ATOMIC_MIN_F64(

        InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_atomic_min_f64")

    {

        setFlag(AtomicMin);

        if (instData.GLC) {

            setFlag(AtomicReturn);

        } else {

            setFlag(AtomicNoReturn);

        }

        setFlag(MemoryRef);

    } // Inst_FLAT__FLAT_ATOMIC_MIN_F64


    Inst_FLAT__FLAT_ATOMIC_MIN_F64::~Inst_FLAT__FLAT_ATOMIC_MIN_F64()

    {

    } // ~Inst_FLAT__FLAT_ATOMIC_MIN_F64


    void


    Inst_FLAT__FLAT_ATOMIC_MIN_F64::execute(GPUDynInstPtr gpuDynInst)

    {

        atomicExecute<ConstVecOperandF64, VecElemF64>(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_ATOMIC_MIN_F64::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initAtomicAccess<VecElemF64>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_ATOMIC_MIN_F64::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        atomicComplete<VecOperandF64, VecElemF64>(gpuDynInst);

    } // completeAcc


    // --- Inst_FLAT__FLAT_ATOMIC_MAX_F64 class methods ---


    Inst_FLAT__FLAT_ATOMIC_MAX_F64::Inst_FLAT__FLAT_ATOMIC_MAX_F64(

        InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_atomic_max_f64")

    {

        setFlag(AtomicMax);

        if (instData.GLC) {

            setFlag(AtomicReturn);

        } else {

            setFlag(AtomicNoReturn);

        }

        setFlag(MemoryRef);

    } // Inst_FLAT__FLAT_ATOMIC_MAX_F64


    Inst_FLAT__FLAT_ATOMIC_MAX_F64::~Inst_FLAT__FLAT_ATOMIC_MAX_F64()

    {

    } // ~Inst_FLAT__FLAT_ATOMIC_MAX_F64


    void


    Inst_FLAT__FLAT_ATOMIC_MAX_F64::execute(GPUDynInstPtr gpuDynInst)

    {

        atomicExecute<ConstVecOperandF64, VecElemF64>(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_ATOMIC_MAX_F64::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initAtomicAccess<VecElemF64>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_ATOMIC_MAX_F64::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        atomicComplete<VecOperandF64, VecElemF64>(gpuDynInst);

    } // completeAcc


    // --- Inst_FLAT__FLAT_ATOMIC_PK_ADD_BF16 class methods ---


    Inst_FLAT__FLAT_ATOMIC_PK_ADD_BF16::Inst_FLAT__FLAT_ATOMIC_PK_ADD_BF16(

        InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_atomic_pk_add_bf16")

    {

        setFlag(AtomicPkAddBF16);


        // MI300 spec: "Float atomics must set SC[0]=0 (no return value)."

        panic_if(instData.GLC, "Saw float atomic with return set!");


        setFlag(AtomicNoReturn);

    } // Inst_FLAT__FLAT_ATOMIC_PK_ADD_BF16


    Inst_FLAT__FLAT_ATOMIC_PK_ADD_BF16::~Inst_FLAT__FLAT_ATOMIC_PK_ADD_BF16()

    {

    } // ~Inst_FLAT__FLAT_ATOMIC_PK_ADD_BF16


    void


    Inst_FLAT__FLAT_ATOMIC_PK_ADD_BF16::execute(GPUDynInstPtr gpuDynInst)

    {

        atomicExecute<ConstVecOperandU32, VecElemU32>(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_ATOMIC_PK_ADD_BF16::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initAtomicAccess<VecElemU32>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_ATOMIC_PK_ADD_BF16::completeAcc(GPUDynInstPtr gpuDynInst)

    {

    } // completeAcc


    // --- Inst_FLAT__FLAT_LOAD_LDS_DWORDX3 class methods ---


    Inst_FLAT__FLAT_LOAD_LDS_DWORDX3::Inst_FLAT__FLAT_LOAD_LDS_DWORDX3(

          InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_load_lds_dwordx3")

    {

        setFlag(Load);


        assert(isFlatGlobal());

    } // Inst_FLAT__FLAT_LOAD_LDS_DWORDX3


    Inst_FLAT__FLAT_LOAD_LDS_DWORDX3::~Inst_FLAT__FLAT_LOAD_LDS_DWORDX3()

    {

    } // ~Inst_FLAT__FLAT_LOAD_LDS_DWORDX3


    // --- description from .arch file ---

    // Untyped buffer load 3 dwords.

    void


    Inst_FLAT__FLAT_LOAD_LDS_DWORDX3::execute(GPUDynInstPtr gpuDynInst)

    {

        Wavefront *wf = gpuDynInst->wavefront();


        if (gpuDynInst->exec_mask.none()) {

            wf->decVMemInstsIssued();

            return;

        }


        gpuDynInst->execUnitId = wf->execUnitId;

        gpuDynInst->latency.init(gpuDynInst->computeUnit());

        gpuDynInst->latency.set(gpuDynInst->computeUnit()->clockPeriod());


        calcAddr(gpuDynInst, extData.ADDR, extData.SADDR, instData.OFFSET);


        issueRequestHelper(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_LOAD_LDS_DWORDX3::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initMemRead<3>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_LOAD_LDS_DWORDX3::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        ldsComplete<3>(gpuDynInst);

    } // completeAcc


    // --- Inst_FLAT__FLAT_LOAD_LDS_DWORDX4 class methods ---


    Inst_FLAT__FLAT_LOAD_LDS_DWORDX4::Inst_FLAT__FLAT_LOAD_LDS_DWORDX4(

          InFmt_FLAT *iFmt)

        : Inst_FLAT(iFmt, "flat_load_lds_dwordx4")

    {

        setFlag(Load);


        assert(isFlatGlobal());

    } // Inst_FLAT__FLAT_LOAD_LDS_DWORDX4


    Inst_FLAT__FLAT_LOAD_LDS_DWORDX4::~Inst_FLAT__FLAT_LOAD_LDS_DWORDX4()

    {

    } // ~Inst_FLAT__FLAT_LOAD_LDS_DWORDX4


    // --- description from .arch file ---

    // Untyped buffer load 4 dwords.

    void


    Inst_FLAT__FLAT_LOAD_LDS_DWORDX4::execute(GPUDynInstPtr gpuDynInst)

    {

        Wavefront *wf = gpuDynInst->wavefront();


        if (gpuDynInst->exec_mask.none()) {

            wf->decVMemInstsIssued();

            return;

        }


        gpuDynInst->execUnitId = wf->execUnitId;

        gpuDynInst->latency.init(gpuDynInst->computeUnit());

        gpuDynInst->latency.set(gpuDynInst->computeUnit()->clockPeriod());


        calcAddr(gpuDynInst, extData.ADDR, extData.SADDR, instData.OFFSET);


        issueRequestHelper(gpuDynInst);

    } // execute


    void


    Inst_FLAT__FLAT_LOAD_LDS_DWORDX4::initiateAcc(GPUDynInstPtr gpuDynInst)

    {

        initMemRead<4>(gpuDynInst);

    } // initiateAcc


    void


    Inst_FLAT__FLAT_LOAD_LDS_DWORDX4::completeAcc(GPUDynInstPtr gpuDynInst)

    {

        ldsComplete<4>(gpuDynInst);

    } // completeAcc


} // namespace VegaISA

} // namespace gem5

data
const char data[]
Definition circlebuf.test.cc:48

gem5::GPUStaticInst::setFlag
void setFlag(Flags flag)
Definition gpu_static_inst.hh:251

gem5::GPUStaticInst::isFlat
bool isFlat() const
Definition gpu_static_inst.hh:131

gem5::GPUStaticInst::isFlatGlobal
bool isFlatGlobal() const
Definition gpu_static_inst.hh:132

gem5::GPUStaticInst::isFlatScratch
bool isFlatScratch() const
Definition gpu_static_inst.hh:133

gem5::RiscvISA::Load
Definition mem.hh:57

gem5::RiscvISA::Store
Definition mem.hh:66

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_ADD_F32::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:2324

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_ADD_F32::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:2318

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_ADD_F32::~Inst_FLAT__FLAT_ATOMIC_ADD_F32
~Inst_FLAT__FLAT_ATOMIC_ADD_F32()
Definition flat.cc:2307

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_ADD_F32::Inst_FLAT__FLAT_ATOMIC_ADD_F32
Inst_FLAT__FLAT_ATOMIC_ADD_F32(InFmt_FLAT *)
Definition flat.cc:2294

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_ADD_F32::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:2312

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_ADD_F64::~Inst_FLAT__FLAT_ATOMIC_ADD_F64
~Inst_FLAT__FLAT_ATOMIC_ADD_F64()
Definition flat.cc:2377

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_ADD_F64::Inst_FLAT__FLAT_ATOMIC_ADD_F64
Inst_FLAT__FLAT_ATOMIC_ADD_F64(InFmt_FLAT *)
Definition flat.cc:2364

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_ADD_F64::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:2394

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_ADD_F64::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:2388

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_ADD_F64::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:2382

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_ADD_X2::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:1877

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_ADD_X2::~Inst_FLAT__FLAT_ATOMIC_ADD_X2
~Inst_FLAT__FLAT_ATOMIC_ADD_X2()
Definition flat.cc:1855

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_ADD_X2::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:1865

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_ADD_X2::Inst_FLAT__FLAT_ATOMIC_ADD_X2
Inst_FLAT__FLAT_ATOMIC_ADD_X2(InFmt_FLAT *)
Definition flat.cc:1842

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_ADD_X2::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:1871

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_ADD::Inst_FLAT__FLAT_ATOMIC_ADD
Inst_FLAT__FLAT_ATOMIC_ADD(InFmt_FLAT *)
Definition flat.cc:1317

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_ADD::~Inst_FLAT__FLAT_ATOMIC_ADD
~Inst_FLAT__FLAT_ATOMIC_ADD()
Definition flat.cc:1329

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_ADD::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:1339

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_ADD::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:1351

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_ADD::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:1345

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_AND_X2::~Inst_FLAT__FLAT_ATOMIC_AND_X2
~Inst_FLAT__FLAT_ATOMIC_AND_X2()
Definition flat.cc:2101

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_AND_X2::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:2117

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_AND_X2::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:2123

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_AND_X2::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:2111

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_AND_X2::Inst_FLAT__FLAT_ATOMIC_AND_X2
Inst_FLAT__FLAT_ATOMIC_AND_X2(InFmt_FLAT *)
Definition flat.cc:2088

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_AND::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:1579

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_AND::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:1585

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_AND::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:1591

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_AND::~Inst_FLAT__FLAT_ATOMIC_AND
~Inst_FLAT__FLAT_ATOMIC_AND()
Definition flat.cc:1569

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_AND::Inst_FLAT__FLAT_ATOMIC_AND
Inst_FLAT__FLAT_ATOMIC_AND(InFmt_FLAT *)
Definition flat.cc:1557

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_CMPSWAP_X2::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:1824

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_CMPSWAP_X2::~Inst_FLAT__FLAT_ATOMIC_CMPSWAP_X2
~Inst_FLAT__FLAT_ATOMIC_CMPSWAP_X2()
Definition flat.cc:1812

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_CMPSWAP_X2::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:1830

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_CMPSWAP_X2::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:1836

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_CMPSWAP_X2::Inst_FLAT__FLAT_ATOMIC_CMPSWAP_X2
Inst_FLAT__FLAT_ATOMIC_CMPSWAP_X2(InFmt_FLAT *)
Definition flat.cc:1799

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_CMPSWAP::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:1311

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_CMPSWAP::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:1299

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_CMPSWAP::~Inst_FLAT__FLAT_ATOMIC_CMPSWAP
~Inst_FLAT__FLAT_ATOMIC_CMPSWAP()
Definition flat.cc:1287

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_CMPSWAP::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:1305

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_DEC_X2::~Inst_FLAT__FLAT_ATOMIC_DEC_X2
~Inst_FLAT__FLAT_ATOMIC_DEC_X2()
Definition flat.cc:2265

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_DEC_X2::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:2288

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_DEC_X2::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:2276

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_DEC_X2::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:2282

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_DEC_X2::Inst_FLAT__FLAT_ATOMIC_DEC_X2
Inst_FLAT__FLAT_ATOMIC_DEC_X2(InFmt_FLAT *)
Definition flat.cc:2252

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_DEC::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:1746

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_DEC::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:1740

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_DEC::Inst_FLAT__FLAT_ATOMIC_DEC
Inst_FLAT__FLAT_ATOMIC_DEC(InFmt_FLAT *)
Definition flat.cc:1718

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_DEC::~Inst_FLAT__FLAT_ATOMIC_DEC
~Inst_FLAT__FLAT_ATOMIC_DEC()
Definition flat.cc:1730

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_DEC::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:1752

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_INC_X2::~Inst_FLAT__FLAT_ATOMIC_INC_X2
~Inst_FLAT__FLAT_ATOMIC_INC_X2()
Definition flat.cc:2224

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_INC_X2::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:2246

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_INC_X2::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:2240

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_INC_X2::Inst_FLAT__FLAT_ATOMIC_INC_X2
Inst_FLAT__FLAT_ATOMIC_INC_X2(InFmt_FLAT *)
Definition flat.cc:2211

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_INC_X2::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:2234

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_INC::Inst_FLAT__FLAT_ATOMIC_INC
Inst_FLAT__FLAT_ATOMIC_INC(InFmt_FLAT *)
Definition flat.cc:1678

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_INC::~Inst_FLAT__FLAT_ATOMIC_INC
~Inst_FLAT__FLAT_ATOMIC_INC()
Definition flat.cc:1690

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_INC::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:1700

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_INC::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:1706

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_INC::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:1712

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_MAX_F64::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:2460

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_MAX_F64::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:2454

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_MAX_F64::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:2466

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_MAX_F64::Inst_FLAT__FLAT_ATOMIC_MAX_F64
Inst_FLAT__FLAT_ATOMIC_MAX_F64(InFmt_FLAT *)
Definition flat.cc:2436

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_MAX_F64::~Inst_FLAT__FLAT_ATOMIC_MAX_F64
~Inst_FLAT__FLAT_ATOMIC_MAX_F64()
Definition flat.cc:2449

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_MIN_F64::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:2418

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_MIN_F64::~Inst_FLAT__FLAT_ATOMIC_MIN_F64
~Inst_FLAT__FLAT_ATOMIC_MIN_F64()
Definition flat.cc:2413

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_MIN_F64::Inst_FLAT__FLAT_ATOMIC_MIN_F64
Inst_FLAT__FLAT_ATOMIC_MIN_F64(InFmt_FLAT *)
Definition flat.cc:2400

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_MIN_F64::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:2424

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_MIN_F64::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:2430

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_OR_X2::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:2152

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_OR_X2::Inst_FLAT__FLAT_ATOMIC_OR_X2
Inst_FLAT__FLAT_ATOMIC_OR_X2(InFmt_FLAT *)
Definition flat.cc:2129

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_OR_X2::~Inst_FLAT__FLAT_ATOMIC_OR_X2
~Inst_FLAT__FLAT_ATOMIC_OR_X2()
Definition flat.cc:2142

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_OR_X2::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:2164

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_OR_X2::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:2158

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_OR::~Inst_FLAT__FLAT_ATOMIC_OR
~Inst_FLAT__FLAT_ATOMIC_OR()
Definition flat.cc:1609

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_OR::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:1631

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_OR::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:1619

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_OR::Inst_FLAT__FLAT_ATOMIC_OR
Inst_FLAT__FLAT_ATOMIC_OR(InFmt_FLAT *)
Definition flat.cc:1597

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_OR::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:1625

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_PK_ADD_BF16::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:2501

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_PK_ADD_BF16::~Inst_FLAT__FLAT_ATOMIC_PK_ADD_BF16
~Inst_FLAT__FLAT_ATOMIC_PK_ADD_BF16()
Definition flat.cc:2484

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_PK_ADD_BF16::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:2495

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_PK_ADD_BF16::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:2489

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_PK_ADD_BF16::Inst_FLAT__FLAT_ATOMIC_PK_ADD_BF16
Inst_FLAT__FLAT_ATOMIC_PK_ADD_BF16(InFmt_FLAT *)
Definition flat.cc:2472

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_PK_ADD_F16::~Inst_FLAT__FLAT_ATOMIC_PK_ADD_F16
~Inst_FLAT__FLAT_ATOMIC_PK_ADD_F16()
Definition flat.cc:2343

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_PK_ADD_F16::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:2354

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_PK_ADD_F16::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:2359

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_PK_ADD_F16::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:2348

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_PK_ADD_F16::Inst_FLAT__FLAT_ATOMIC_PK_ADD_F16
Inst_FLAT__FLAT_ATOMIC_PK_ADD_F16(InFmt_FLAT *)
Definition flat.cc:2330

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SMAX_X2::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:2035

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SMAX_X2::~Inst_FLAT__FLAT_ATOMIC_SMAX_X2
~Inst_FLAT__FLAT_ATOMIC_SMAX_X2()
Definition flat.cc:2019

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SMAX_X2::Inst_FLAT__FLAT_ATOMIC_SMAX_X2
Inst_FLAT__FLAT_ATOMIC_SMAX_X2(InFmt_FLAT *)
Definition flat.cc:2006

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SMAX_X2::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:2041

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SMAX_X2::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:2029

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SMAX::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:1499

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SMAX::Inst_FLAT__FLAT_ATOMIC_SMAX
Inst_FLAT__FLAT_ATOMIC_SMAX(InFmt_FLAT *)
Definition flat.cc:1477

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SMAX::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:1511

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SMAX::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:1505

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SMAX::~Inst_FLAT__FLAT_ATOMIC_SMAX
~Inst_FLAT__FLAT_ATOMIC_SMAX()
Definition flat.cc:1489

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SMIN_X2::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:1947

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SMIN_X2::Inst_FLAT__FLAT_ATOMIC_SMIN_X2
Inst_FLAT__FLAT_ATOMIC_SMIN_X2(InFmt_FLAT *)
Definition flat.cc:1924

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SMIN_X2::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:1959

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SMIN_X2::~Inst_FLAT__FLAT_ATOMIC_SMIN_X2
~Inst_FLAT__FLAT_ATOMIC_SMIN_X2()
Definition flat.cc:1937

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SMIN_X2::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:1953

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SMIN::Inst_FLAT__FLAT_ATOMIC_SMIN
Inst_FLAT__FLAT_ATOMIC_SMIN(InFmt_FLAT *)
Definition flat.cc:1397

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SMIN::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:1431

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SMIN::~Inst_FLAT__FLAT_ATOMIC_SMIN
~Inst_FLAT__FLAT_ATOMIC_SMIN()
Definition flat.cc:1409

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SMIN::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:1425

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SMIN::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:1419

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SUB_X2::Inst_FLAT__FLAT_ATOMIC_SUB_X2
Inst_FLAT__FLAT_ATOMIC_SUB_X2(InFmt_FLAT *)
Definition flat.cc:1883

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SUB_X2::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:1912

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SUB_X2::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:1918

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SUB_X2::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:1906

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SUB_X2::~Inst_FLAT__FLAT_ATOMIC_SUB_X2
~Inst_FLAT__FLAT_ATOMIC_SUB_X2()
Definition flat.cc:1896

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SUB::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:1391

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SUB::~Inst_FLAT__FLAT_ATOMIC_SUB
~Inst_FLAT__FLAT_ATOMIC_SUB()
Definition flat.cc:1369

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SUB::Inst_FLAT__FLAT_ATOMIC_SUB
Inst_FLAT__FLAT_ATOMIC_SUB(InFmt_FLAT *)
Definition flat.cc:1357

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SUB::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:1385

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SUB::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:1379

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SWAP_X2::Inst_FLAT__FLAT_ATOMIC_SWAP_X2
Inst_FLAT__FLAT_ATOMIC_SWAP_X2(InFmt_FLAT *)
Definition flat.cc:1758

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SWAP_X2::~Inst_FLAT__FLAT_ATOMIC_SWAP_X2
~Inst_FLAT__FLAT_ATOMIC_SWAP_X2()
Definition flat.cc:1771

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SWAP_X2::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:1781

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SWAP_X2::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:1793

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SWAP_X2::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:1787

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SWAP::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:1255

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SWAP::~Inst_FLAT__FLAT_ATOMIC_SWAP
~Inst_FLAT__FLAT_ATOMIC_SWAP()
Definition flat.cc:1245

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SWAP::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:1261

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SWAP::Inst_FLAT__FLAT_ATOMIC_SWAP
Inst_FLAT__FLAT_ATOMIC_SWAP(InFmt_FLAT *)
Definition flat.cc:1233

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_SWAP::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:1267

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_UMAX_X2::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:2070

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_UMAX_X2::~Inst_FLAT__FLAT_ATOMIC_UMAX_X2
~Inst_FLAT__FLAT_ATOMIC_UMAX_X2()
Definition flat.cc:2060

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_UMAX_X2::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:2076

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_UMAX_X2::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:2082

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_UMAX_X2::Inst_FLAT__FLAT_ATOMIC_UMAX_X2
Inst_FLAT__FLAT_ATOMIC_UMAX_X2(InFmt_FLAT *)
Definition flat.cc:2047

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_UMAX::~Inst_FLAT__FLAT_ATOMIC_UMAX
~Inst_FLAT__FLAT_ATOMIC_UMAX()
Definition flat.cc:1529

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_UMAX::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:1545

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_UMAX::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:1539

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_UMAX::Inst_FLAT__FLAT_ATOMIC_UMAX
Inst_FLAT__FLAT_ATOMIC_UMAX(InFmt_FLAT *)
Definition flat.cc:1517

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_UMAX::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:1551

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_UMIN_X2::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:1988

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_UMIN_X2::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:1994

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_UMIN_X2::Inst_FLAT__FLAT_ATOMIC_UMIN_X2
Inst_FLAT__FLAT_ATOMIC_UMIN_X2(InFmt_FLAT *)
Definition flat.cc:1965

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_UMIN_X2::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:2000

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_UMIN_X2::~Inst_FLAT__FLAT_ATOMIC_UMIN_X2
~Inst_FLAT__FLAT_ATOMIC_UMIN_X2()
Definition flat.cc:1978

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_UMIN::~Inst_FLAT__FLAT_ATOMIC_UMIN
~Inst_FLAT__FLAT_ATOMIC_UMIN()
Definition flat.cc:1449

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_UMIN::Inst_FLAT__FLAT_ATOMIC_UMIN
Inst_FLAT__FLAT_ATOMIC_UMIN(InFmt_FLAT *)
Definition flat.cc:1437

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_UMIN::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:1465

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_UMIN::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:1459

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_UMIN::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:1471

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_XOR_X2::Inst_FLAT__FLAT_ATOMIC_XOR_X2
Inst_FLAT__FLAT_ATOMIC_XOR_X2(InFmt_FLAT *)
Definition flat.cc:2170

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_XOR_X2::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:2205

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_XOR_X2::~Inst_FLAT__FLAT_ATOMIC_XOR_X2
~Inst_FLAT__FLAT_ATOMIC_XOR_X2()
Definition flat.cc:2183

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_XOR_X2::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:2199

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_XOR_X2::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:2193

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_XOR::~Inst_FLAT__FLAT_ATOMIC_XOR
~Inst_FLAT__FLAT_ATOMIC_XOR()
Definition flat.cc:1650

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_XOR::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:1672

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_XOR::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:1660

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_XOR::Inst_FLAT__FLAT_ATOMIC_XOR
Inst_FLAT__FLAT_ATOMIC_XOR(InFmt_FLAT *)
Definition flat.cc:1638

gem5::VegaISA::Inst_FLAT__FLAT_ATOMIC_XOR::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:1666

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_DWORDX2::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:349

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_DWORDX2::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:319

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_DWORDX2::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:343

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_DWORDX2::~Inst_FLAT__FLAT_LOAD_DWORDX2
~Inst_FLAT__FLAT_LOAD_DWORDX2()
Definition flat.cc:312

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_DWORDX2::Inst_FLAT__FLAT_LOAD_DWORDX2
Inst_FLAT__FLAT_LOAD_DWORDX2(InFmt_FLAT *)
Definition flat.cc:304

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_DWORDX3::Inst_FLAT__FLAT_LOAD_DWORDX3
Inst_FLAT__FLAT_LOAD_DWORDX3(InFmt_FLAT *)
Definition flat.cc:375

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_DWORDX3::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:414

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_DWORDX3::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:390

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_DWORDX3::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:420

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_DWORDX3::~Inst_FLAT__FLAT_LOAD_DWORDX3
~Inst_FLAT__FLAT_LOAD_DWORDX3()
Definition flat.cc:383

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_DWORDX4::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:467

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_DWORDX4::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:491

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_DWORDX4::~Inst_FLAT__FLAT_LOAD_DWORDX4
~Inst_FLAT__FLAT_LOAD_DWORDX4()
Definition flat.cc:460

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_DWORDX4::Inst_FLAT__FLAT_LOAD_DWORDX4
Inst_FLAT__FLAT_LOAD_DWORDX4(InFmt_FLAT *)
Definition flat.cc:452

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_DWORDX4::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:497

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_DWORD::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:284

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_DWORD::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:290

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_DWORD::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:260

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_DWORD::Inst_FLAT__FLAT_LOAD_DWORD
Inst_FLAT__FLAT_LOAD_DWORD(InFmt_FLAT *)
Definition flat.cc:246

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_DWORD::~Inst_FLAT__FLAT_LOAD_DWORD
~Inst_FLAT__FLAT_LOAD_DWORD()
Definition flat.cc:253

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_LDS_DWORDX3::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:2541

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_LDS_DWORDX3::Inst_FLAT__FLAT_LOAD_LDS_DWORDX3
Inst_FLAT__FLAT_LOAD_LDS_DWORDX3(InFmt_FLAT *)
Definition flat.cc:2506

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_LDS_DWORDX3::~Inst_FLAT__FLAT_LOAD_LDS_DWORDX3
~Inst_FLAT__FLAT_LOAD_LDS_DWORDX3()
Definition flat.cc:2515

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_LDS_DWORDX3::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:2547

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_LDS_DWORDX3::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:2522

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_LDS_DWORDX4::~Inst_FLAT__FLAT_LOAD_LDS_DWORDX4
~Inst_FLAT__FLAT_LOAD_LDS_DWORDX4()
Definition flat.cc:2562

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_LDS_DWORDX4::Inst_FLAT__FLAT_LOAD_LDS_DWORDX4
Inst_FLAT__FLAT_LOAD_LDS_DWORDX4(InFmt_FLAT *)
Definition flat.cc:2553

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_LDS_DWORDX4::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:2569

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_LDS_DWORDX4::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:2588

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_LDS_DWORDX4::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:2594

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_LDS_DWORD::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:1202

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_LDS_DWORD::Inst_FLAT__FLAT_LOAD_LDS_DWORD
Inst_FLAT__FLAT_LOAD_LDS_DWORD(InFmt_FLAT *)
Definition flat.cc:1187

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_LDS_DWORD::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:1221

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_LDS_DWORD::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:1227

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_LDS_DWORD::~Inst_FLAT__FLAT_LOAD_LDS_DWORD
~Inst_FLAT__FLAT_LOAD_LDS_DWORD()
Definition flat.cc:1195

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_LDS_SBYTE::~Inst_FLAT__FLAT_LOAD_LDS_SBYTE
~Inst_FLAT__FLAT_LOAD_LDS_SBYTE()
Definition flat.cc:1050

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_LDS_SBYTE::Inst_FLAT__FLAT_LOAD_LDS_SBYTE
Inst_FLAT__FLAT_LOAD_LDS_SBYTE(InFmt_FLAT *)
Definition flat.cc:1042

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_LDS_SBYTE::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:1057

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_LDS_SBYTE::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:1082

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_LDS_SBYTE::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:1076

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_LDS_SSHORT::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:1179

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_LDS_SSHORT::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:1173

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_LDS_SSHORT::Inst_FLAT__FLAT_LOAD_LDS_SSHORT
Inst_FLAT__FLAT_LOAD_LDS_SSHORT(InFmt_FLAT *)
Definition flat.cc:1139

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_LDS_SSHORT::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:1154

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_LDS_SSHORT::~Inst_FLAT__FLAT_LOAD_LDS_SSHORT
~Inst_FLAT__FLAT_LOAD_LDS_SSHORT()
Definition flat.cc:1147

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_LDS_UBYTE::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:1009

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_LDS_UBYTE::~Inst_FLAT__FLAT_LOAD_LDS_UBYTE
~Inst_FLAT__FLAT_LOAD_LDS_UBYTE()
Definition flat.cc:1002

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_LDS_UBYTE::Inst_FLAT__FLAT_LOAD_LDS_UBYTE
Inst_FLAT__FLAT_LOAD_LDS_UBYTE(InFmt_FLAT *)
Definition flat.cc:994

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_LDS_UBYTE::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:1034

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_LDS_UBYTE::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:1028

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_LDS_USHORT::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:1105

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_LDS_USHORT::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:1124

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_LDS_USHORT::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:1130

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_LDS_USHORT::~Inst_FLAT__FLAT_LOAD_LDS_USHORT
~Inst_FLAT__FLAT_LOAD_LDS_USHORT()
Definition flat.cc:1098

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_LDS_USHORT::Inst_FLAT__FLAT_LOAD_LDS_USHORT
Inst_FLAT__FLAT_LOAD_LDS_USHORT(InFmt_FLAT *)
Definition flat.cc:1090

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_SBYTE::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:113

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_SBYTE::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:137

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_SBYTE::Inst_FLAT__FLAT_LOAD_SBYTE
Inst_FLAT__FLAT_LOAD_SBYTE(InFmt_FLAT *)
Definition flat.cc:99

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_SBYTE::~Inst_FLAT__FLAT_LOAD_SBYTE
~Inst_FLAT__FLAT_LOAD_SBYTE()
Definition flat.cc:106

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_SBYTE::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:143

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_SSHORT::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:241

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_SSHORT::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:236

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_SSHORT::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:230

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_SSHORT::Inst_FLAT__FLAT_LOAD_SSHORT
Inst_FLAT__FLAT_LOAD_SSHORT(InFmt_FLAT *)
Definition flat.cc:216

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_SSHORT::~Inst_FLAT__FLAT_LOAD_SSHORT
~Inst_FLAT__FLAT_LOAD_SSHORT()
Definition flat.cc:223

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_UBYTE::Inst_FLAT__FLAT_LOAD_UBYTE
Inst_FLAT__FLAT_LOAD_UBYTE(InFmt_FLAT *)
Definition flat.cc:41

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_UBYTE::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:79

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_UBYTE::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:85

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_UBYTE::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:55

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_UBYTE::~Inst_FLAT__FLAT_LOAD_UBYTE
~Inst_FLAT__FLAT_LOAD_UBYTE()
Definition flat.cc:48

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_USHORT::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:195

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_USHORT::~Inst_FLAT__FLAT_LOAD_USHORT
~Inst_FLAT__FLAT_LOAD_USHORT()
Definition flat.cc:164

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_USHORT::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:171

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_USHORT::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:201

gem5::VegaISA::Inst_FLAT__FLAT_LOAD_USHORT::Inst_FLAT__FLAT_LOAD_USHORT
Inst_FLAT__FLAT_LOAD_USHORT(InFmt_FLAT *)
Definition flat.cc:157

gem5::VegaISA::Inst_FLAT__FLAT_STORE_BYTE::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:592

gem5::VegaISA::Inst_FLAT__FLAT_STORE_BYTE::Inst_FLAT__FLAT_STORE_BYTE
Inst_FLAT__FLAT_STORE_BYTE(InFmt_FLAT *)
Definition flat.cc:535

gem5::VegaISA::Inst_FLAT__FLAT_STORE_BYTE::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:549

gem5::VegaISA::Inst_FLAT__FLAT_STORE_BYTE::~Inst_FLAT__FLAT_STORE_BYTE
~Inst_FLAT__FLAT_STORE_BYTE()
Definition flat.cc:542

gem5::VegaISA::Inst_FLAT__FLAT_STORE_BYTE::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:586

gem5::VegaISA::Inst_FLAT__FLAT_STORE_DWORDX2::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:842

gem5::VegaISA::Inst_FLAT__FLAT_STORE_DWORDX2::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:836

gem5::VegaISA::Inst_FLAT__FLAT_STORE_DWORDX2::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:799

gem5::VegaISA::Inst_FLAT__FLAT_STORE_DWORDX2::~Inst_FLAT__FLAT_STORE_DWORDX2
~Inst_FLAT__FLAT_STORE_DWORDX2()
Definition flat.cc:792

gem5::VegaISA::Inst_FLAT__FLAT_STORE_DWORDX2::Inst_FLAT__FLAT_STORE_DWORDX2
Inst_FLAT__FLAT_STORE_DWORDX2(InFmt_FLAT *)
Definition flat.cc:784

gem5::VegaISA::Inst_FLAT__FLAT_STORE_DWORDX3::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:913

gem5::VegaISA::Inst_FLAT__FLAT_STORE_DWORDX3::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:907

gem5::VegaISA::Inst_FLAT__FLAT_STORE_DWORDX3::Inst_FLAT__FLAT_STORE_DWORDX3
Inst_FLAT__FLAT_STORE_DWORDX3(InFmt_FLAT *)
Definition flat.cc:847

gem5::VegaISA::Inst_FLAT__FLAT_STORE_DWORDX3::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:862

gem5::VegaISA::Inst_FLAT__FLAT_STORE_DWORDX3::~Inst_FLAT__FLAT_STORE_DWORDX3
~Inst_FLAT__FLAT_STORE_DWORDX3()
Definition flat.cc:855

gem5::VegaISA::Inst_FLAT__FLAT_STORE_DWORDX4::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:988

gem5::VegaISA::Inst_FLAT__FLAT_STORE_DWORDX4::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:982

gem5::VegaISA::Inst_FLAT__FLAT_STORE_DWORDX4::~Inst_FLAT__FLAT_STORE_DWORDX4
~Inst_FLAT__FLAT_STORE_DWORDX4()
Definition flat.cc:926

gem5::VegaISA::Inst_FLAT__FLAT_STORE_DWORDX4::Inst_FLAT__FLAT_STORE_DWORDX4
Inst_FLAT__FLAT_STORE_DWORDX4(InFmt_FLAT *)
Definition flat.cc:918

gem5::VegaISA::Inst_FLAT__FLAT_STORE_DWORDX4::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:933

gem5::VegaISA::Inst_FLAT__FLAT_STORE_DWORD::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:773

gem5::VegaISA::Inst_FLAT__FLAT_STORE_DWORD::Inst_FLAT__FLAT_STORE_DWORD
Inst_FLAT__FLAT_STORE_DWORD(InFmt_FLAT *)
Definition flat.cc:722

gem5::VegaISA::Inst_FLAT__FLAT_STORE_DWORD::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:736

gem5::VegaISA::Inst_FLAT__FLAT_STORE_DWORD::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:779

gem5::VegaISA::Inst_FLAT__FLAT_STORE_DWORD::~Inst_FLAT__FLAT_STORE_DWORD
~Inst_FLAT__FLAT_STORE_DWORD()
Definition flat.cc:729

gem5::VegaISA::Inst_FLAT__FLAT_STORE_SHORT_D16_HI::~Inst_FLAT__FLAT_STORE_SHORT_D16_HI
~Inst_FLAT__FLAT_STORE_SHORT_D16_HI()
Definition flat.cc:667

gem5::VegaISA::Inst_FLAT__FLAT_STORE_SHORT_D16_HI::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:717

gem5::VegaISA::Inst_FLAT__FLAT_STORE_SHORT_D16_HI::Inst_FLAT__FLAT_STORE_SHORT_D16_HI
Inst_FLAT__FLAT_STORE_SHORT_D16_HI(InFmt_FLAT *)
Definition flat.cc:660

gem5::VegaISA::Inst_FLAT__FLAT_STORE_SHORT_D16_HI::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:674

gem5::VegaISA::Inst_FLAT__FLAT_STORE_SHORT_D16_HI::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:711

gem5::VegaISA::Inst_FLAT__FLAT_STORE_SHORT::execute
void execute(GPUDynInstPtr) override
Definition flat.cc:611

gem5::VegaISA::Inst_FLAT__FLAT_STORE_SHORT::~Inst_FLAT__FLAT_STORE_SHORT
~Inst_FLAT__FLAT_STORE_SHORT()
Definition flat.cc:604

gem5::VegaISA::Inst_FLAT__FLAT_STORE_SHORT::Inst_FLAT__FLAT_STORE_SHORT
Inst_FLAT__FLAT_STORE_SHORT(InFmt_FLAT *)
Definition flat.cc:597

gem5::VegaISA::Inst_FLAT__FLAT_STORE_SHORT::completeAcc
void completeAcc(GPUDynInstPtr) override
Definition flat.cc:654

gem5::VegaISA::Inst_FLAT__FLAT_STORE_SHORT::initiateAcc
void initiateAcc(GPUDynInstPtr) override
Definition flat.cc:648

gem5::VegaISA::Inst_FLAT::atomicComplete
void atomicComplete(GPUDynInstPtr gpuDynInst)
Definition op_encodings.hh:1660

gem5::VegaISA::Inst_FLAT::instData
InFmt_FLAT instData
Definition op_encodings.hh:1745

gem5::VegaISA::Inst_FLAT::calcAddr
void calcAddr(GPUDynInstPtr gpuDynInst, ScalarRegU32 vaddr, ScalarRegU32 saddr, ScalarRegI32 offset)
Definition op_encodings.hh:1470

gem5::VegaISA::Inst_FLAT::Inst_FLAT
Inst_FLAT(InFmt_FLAT *, const std::string &opcode)
Definition op_encodings.cc:1699

gem5::VegaISA::Inst_FLAT::extData
InFmt_FLAT_1 extData
Definition op_encodings.hh:1747

gem5::VegaISA::Inst_FLAT::initMemRead
void initMemRead(GPUDynInstPtr gpuDynInst)
Definition op_encodings.hh:1345

gem5::VegaISA::Inst_FLAT::atomicExecute
void atomicExecute(GPUDynInstPtr gpuDynInst)
Definition op_encodings.hh:1611

gem5::VegaISA::Inst_FLAT::ldsComplete
void ldsComplete(GPUDynInstPtr gpuDynInst)
Definition op_encodings.hh:1706

gem5::VegaISA::Inst_FLAT::issueRequestHelper
void issueRequestHelper(GPUDynInstPtr gpuDynInst)
Definition op_encodings.hh:1586

gem5::VegaISA::Inst_FLAT::initAtomicAccess
void initAtomicAccess(GPUDynInstPtr gpuDynInst)
Definition op_encodings.hh:1440

gem5::VegaISA::Inst_FLAT::initMemWrite
void initMemWrite(GPUDynInstPtr gpuDynInst)
Definition op_encodings.hh:1392

gem5::VegaISA::VEGAGPUStaticInst::panicUnimplemented
void panicUnimplemented() const
Definition gpu_static_inst.cc:54

gem5::VegaISA::VecOperand::read
void read() override
read from the vrf.
Definition operand.hh:148

gem5::VegaISA::VecOperand::write
void write() override
write to the vrf.
Definition operand.hh:203

gem5::Wavefront
Definition wavefront.hh:62

gem5::Wavefront::decExpInstsIssued
void decExpInstsIssued()
Definition wavefront.cc:1458

gem5::Wavefront::execUnitId
int execUnitId
Definition wavefront.hh:105

gem5::Wavefront::untrackExpInst
void untrackExpInst(GPUDynInstPtr gpu_dyn_inst)
Definition wavefront.cc:1542

gem5::Wavefront::decVMemInstsIssued
void decVMemInstsIssued()
Definition wavefront.cc:1452

gem5::Wavefront::untrackLGKMInst
void untrackLGKMInst(GPUDynInstPtr gpu_dyn_inst)
Definition wavefront.cc:1529

gem5::Wavefront::decLGKMInstsIssued
void decLGKMInstsIssued()
Definition wavefront.cc:1464

gem5::Wavefront::untrackVMemInst
void untrackVMemInst(GPUDynInstPtr gpu_dyn_inst)
Definition wavefront.cc:1516

panic_if
#define panic_if(cond,...)
Conditional panic macro that checks the supplied condition and only panics if the condition is true a...
Definition logging.hh:246

instructions.hh

gem5::VegaISA
classes that represnt vector/scalar operands in VEGA ISA.
Definition faults.cc:39

gem5::VegaISA::VecElemI32
int32_t VecElemI32
Definition gpu_registers.hh:166

gem5::VegaISA::VecOperandU32
VecOperand< VecElemU32, false > VecOperandU32
Definition operand.hh:829

gem5::VegaISA::ConstVecOperandU8
VecOperand< VecElemU8, true, 1 > ConstVecOperandU8
Definition operand.hh:840

gem5::VegaISA::ConstVecOperandU32
VecOperand< VecElemU32, true > ConstVecOperandU32
Definition operand.hh:844

gem5::VegaISA::VecElemU16
uint16_t VecElemU16
Definition gpu_registers.hh:163

gem5::VegaISA::VecElemU32
uint32_t VecElemU32
Definition gpu_registers.hh:165

gem5::VegaISA::VecElemI8
int8_t VecElemI8
Definition gpu_registers.hh:162

gem5::VegaISA::ConstVecOperandU16
VecOperand< VecElemU16, true, 1 > ConstVecOperandU16
Definition operand.hh:842

gem5::VegaISA::NumVecElemPerVecReg
const int NumVecElemPerVecReg(64)

gem5::VegaISA::VecElemU8
uint8_t VecElemU8
Definition gpu_registers.hh:161

gem5::VegaISA::VecElemU64
uint64_t VecElemU64
Definition gpu_registers.hh:168

gem5::VegaISA::ConstVecOperandU64
VecOperand< VecElemU64, true > ConstVecOperandU64
Definition operand.hh:847

gem5
Copyright (c) 2024 Arm Limited All rights reserved.
Definition binary32.hh:36

gem5::GPUDynInstPtr
std::shared_ptr< GPUDynInst > GPUDynInstPtr
Definition misc.hh:49

gem5::VegaISA::InFmt_FLAT
Definition gpu_decoder.hh:1813