release/current/memory__manager_8cc_source.html

/*

 * Copyright (c) 2021 Advanced Micro Devices, Inc.

 * All rights reserved.

 *

 * Redistribution and use in source and binary forms, with or without

 * modification, are permitted provided that the following conditions are met:

 *

 * 1. Redistributions of source code must retain the above copyright notice,

 * this list of conditions and the following disclaimer.

 *

 * 2. Redistributions in binary form must reproduce the above copyright notice,

 * this list of conditions and the following disclaimer in the documentation

 * and/or other materials provided with the distribution.

 *

 * 3. Neither the name of the copyright holder nor the names of its

 * contributors may be used to endorse or promote products derived from this

 * software without specific prior written permission.

 *

 * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS"

 * AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE

 * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE

 * ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT HOLDER OR CONTRIBUTORS BE

 * LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR

 * CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF

 * SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS

 * INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN

 * CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)

 * ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE

 * POSSIBILITY OF SUCH DAMAGE.

 *

 */


#include "dev/amdgpu/memory_manager.hh"


#include <memory>


#include "base/chunk_generator.hh"

#include "debug/AMDGPUMem.hh"

#include "params/AMDGPUMemoryManager.hh"

#include "sim/system.hh"


namespace gem5

{


AMDGPUMemoryManager::AMDGPUMemoryManager(const AMDGPUMemoryManagerParams &p)

    : ClockedObject(p), _gpuMemPort(csprintf("%s-port", name()), *this),

      cacheLineSize(p.cache_line_size),

      _requestorId(p.system->getRequestorId(this))

{

}

AMDGPUMemoryManager::AMDGPUMemoryManager(const AMDGPUMemoryManagerParams &p) {…}


void


AMDGPUMemoryManager::writeRequest(Addr addr, uint8_t *data, int size,

                               Request::Flags flag, Event *callback)

{

    assert(data);


    // Requests may return out of order, so we should track how many chunks

    // are outstanding and if the last chunk was sent. Give each status struct

    // a unique ID so that DMAs to the same address may occur at the same time

    requestStatus.emplace(std::piecewise_construct,

                          std::forward_as_tuple(requestId), std::tuple<>{});


    DPRINTF(AMDGPUMem, "Created status for write request %ld\n", requestId);


    ChunkGenerator gen(addr, size, cacheLineSize);

    for (; !gen.done(); gen.next()) {

        RequestPtr req = std::make_shared<Request>(gen.addr(), gen.size(),

                                                   flag, _requestorId);


        PacketPtr pkt = Packet::createWrite(req);

        uint8_t *dataPtr = new uint8_t[gen.size()];

        std::memcpy(dataPtr, data + (gen.complete()/sizeof(uint8_t)),

                    gen.size());

        pkt->dataDynamic<uint8_t>(dataPtr);


        pkt->pushSenderState(

                new GPUMemPort::SenderState(callback, addr, requestId));

        requestStatus.at(requestId).outstandingChunks++;

        if (gen.last()) {

            requestStatus.at(requestId).sentLastChunk = true;

        }


        if (!_gpuMemPort.sendTimingReq(pkt)) {

            DPRINTF(AMDGPUMem, "Request to %#lx needs retry\n", gen.addr());

            _gpuMemPort.retries.push_back(pkt);

        } else {

            DPRINTF(AMDGPUMem, "Write request to %#lx sent\n", gen.addr());

        }

    }


    requestId++;

}

AMDGPUMemoryManager::writeRequest(Addr addr, uint8_t *data, int size, {…}


void


AMDGPUMemoryManager::readRequest(Addr addr, uint8_t *data, int size,

                                 Request::Flags flag, Event *callback)

{

    assert(data);

    uint8_t *dataPtr = data;


    // Requests may return out of order, so we should track how many chunks

    // are outstanding and if the last chunk was sent. Give each status struct

    // a unique ID so that DMAs to the same address may occur at the same time

    requestStatus.emplace(std::piecewise_construct,

                          std::forward_as_tuple(requestId), std::tuple<>{});


    DPRINTF(AMDGPUMem, "Created status for read request %ld\n", requestId);


    ChunkGenerator gen(addr, size, cacheLineSize);

    for (; !gen.done(); gen.next()) {

        RequestPtr req = std::make_shared<Request>(gen.addr(), gen.size(),

                                                   flag, _requestorId);


        PacketPtr pkt = Packet::createRead(req);

        pkt->dataStatic<uint8_t>(dataPtr);

        dataPtr += gen.size();


        pkt->pushSenderState(

                new GPUMemPort::SenderState(callback, addr, requestId));

        requestStatus.at(requestId).outstandingChunks++;

        if (gen.last()) {

            requestStatus.at(requestId).sentLastChunk = true;

        }


        if (!_gpuMemPort.sendTimingReq(pkt)) {

            DPRINTF(AMDGPUMem, "Request to %#lx needs retry\n", gen.addr());

            _gpuMemPort.retries.push_back(pkt);

        } else {

            DPRINTF(AMDGPUMem, "Read request to %#lx sent\n", gen.addr());

        }

    }


    requestId++;

}

AMDGPUMemoryManager::readRequest(Addr addr, uint8_t *data, int size, {…}


bool


AMDGPUMemoryManager::GPUMemPort::recvTimingResp(PacketPtr pkt)

{

    // Retrieve sender state

    [[maybe_unused]] SenderState *sender_state =

        safe_cast<SenderState*>(pkt->senderState);


    // Check if all chunks have completed, the last chunk was sent, and there

    // is a callback, call the callback now.

    assert(gpu_mem.requestStatus.count(sender_state->_requestId));

    auto& status = gpu_mem.requestStatus.at(sender_state->_requestId);


    assert(status.outstandingChunks != 0);

    status.outstandingChunks--;

    DPRINTF(AMDGPUMem, "Received Response for %#x. %d chunks remain, sent "

            "last = %d, requestId = %ld\n", sender_state->_addr,

            status.outstandingChunks, status.sentLastChunk,

            sender_state->_requestId);


    if (!status.outstandingChunks && status.sentLastChunk) {

        // Call and free the callback if there is one

        if (sender_state->_callback) {

            DPRINTF(AMDGPUMem, "Calling callback for request %ld\n",

                    sender_state->_requestId);

            sender_state->_callback->process();

            delete sender_state->_callback;

        }

        DPRINTF(AMDGPUMem, "Deleting status for request %ld\n",

                sender_state->_requestId);

        gpu_mem.requestStatus.erase(sender_state->_requestId);

    }


    delete pkt->senderState;

    delete pkt;

    return true;

}

AMDGPUMemoryManager::GPUMemPort::recvTimingResp(PacketPtr pkt) {…}


void


AMDGPUMemoryManager::GPUMemPort::recvReqRetry()

{

    for (const auto &pkt : retries) {

        if (!sendTimingReq(pkt)) {

            break;

        } else {

            DPRINTF(AMDGPUMem, "Retry for %#lx sent\n", pkt->getAddr());

            retries.pop_front();

        }

    }

}

AMDGPUMemoryManager::GPUMemPort::recvReqRetry() {…}


} // namespace gem5

DPRINTF
#define DPRINTF(x,...)
Definition trace.hh:209

chunk_generator.hh
Declaration and inline definition of ChunkGenerator object.

data
const char data[]
Definition circlebuf.test.cc:48

gem5::AMDGPUMemoryManager::GPUMemPort::retries
std::deque< PacketPtr > retries
Definition memory_manager.hh:70

gem5::AMDGPUMemoryManager::GPUMemPort::recvTimingResp
bool recvTimingResp(PacketPtr pkt) override
Receive a timing response from the peer.
Definition memory_manager.cc:138

gem5::AMDGPUMemoryManager::GPUMemPort::gpu_mem
AMDGPUMemoryManager & gpu_mem
Definition memory_manager.hh:71

gem5::AMDGPUMemoryManager::GPUMemPort::recvReqRetry
void recvReqRetry() override
Called by the peer if sendTimingReq was called on this peer (causing recvTimingReq to be called on th...
Definition memory_manager.cc:175

gem5::AMDGPUMemoryManager::requestStatus
std::unordered_map< uint64_t, RequestStatus > requestStatus
Definition memory_manager.hh:88

gem5::AMDGPUMemoryManager::requestId
uint64_t requestId
Definition memory_manager.hh:87

gem5::AMDGPUMemoryManager::AMDGPUMemoryManager
AMDGPUMemoryManager(const AMDGPUMemoryManagerParams &p)
Definition memory_manager.cc:45

gem5::AMDGPUMemoryManager::cacheLineSize
const int cacheLineSize
Definition memory_manager.hh:75

gem5::AMDGPUMemoryManager::_requestorId
const RequestorID _requestorId
Definition memory_manager.hh:76

gem5::AMDGPUMemoryManager::_gpuMemPort
GPUMemPort _gpuMemPort
Definition memory_manager.hh:74

gem5::AMDGPUMemoryManager::writeRequest
void writeRequest(Addr addr, uint8_t *data, int size, Request::Flags flag, Event *callback)
Write size amount of data to device memory at addr using flags and callback.
Definition memory_manager.cc:53

gem5::AMDGPUMemoryManager::readRequest
void readRequest(Addr addr, uint8_t *data, int size, Request::Flags flag, Event *callback)
Read size amount of data from device memory at addr using flags and callback.
Definition memory_manager.cc:96

gem5::ChunkGenerator
This class takes an arbitrary memory region (address/length pair) and generates a series of appropria...
Definition chunk_generator.hh:60

gem5::ClockedObject
The ClockedObject class extends the SimObject with a clock and accessor functions to relate ticks to ...
Definition clocked_object.hh:235

gem5::Event
Definition eventq.hh:255

gem5::Event::process
virtual void process()=0

gem5::Flags< FlagsType >

gem5::Packet
A Packet is used to encapsulate a transfer between two objects in the memory system (e....
Definition packet.hh:295

gem5::Packet::createWrite
static PacketPtr createWrite(const RequestPtr &req)
Definition packet.hh:1044

gem5::Packet::dataStatic
void dataStatic(T *p)
Set the data pointer to the following value that should not be freed.
Definition packet.hh:1175

gem5::Packet::senderState
SenderState * senderState
This packet's sender state.
Definition packet.hh:545

gem5::Packet::pushSenderState
void pushSenderState(SenderState *sender_state)
Push a new sender state to the packet and make the current sender state the predecessor of the new on...
Definition packet.cc:334

gem5::Packet::createRead
static PacketPtr createRead(const RequestPtr &req)
Constructor-like methods that return Packets based on Request objects.
Definition packet.hh:1038

gem5::Packet::dataDynamic
void dataDynamic(T *p)
Set the data pointer to a value that should have delete [] called on it.
Definition packet.hh:1213

gem5::RequestPort::sendTimingReq
bool sendTimingReq(PacketPtr pkt)
Attempt to send a timing request to the responder port by calling its corresponding receive function.
Definition port.hh:603

gem5::ChunkGenerator::last
bool last() const
Is this the last chunk?
Definition chunk_generator.hh:149

gem5::ChunkGenerator::addr
Addr addr() const
Return starting address of current chunk.
Definition chunk_generator.hh:119

gem5::ChunkGenerator::complete
Addr complete() const
Number of bytes we have already chunked up.
Definition chunk_generator.hh:132

gem5::ChunkGenerator::done
bool done() const
Are we done? That is, did the last call to next() advance past the end of the region?
Definition chunk_generator.hh:141

gem5::ChunkGenerator::size
Addr size() const
Return size in bytes of current chunk.
Definition chunk_generator.hh:125

gem5::ChunkGenerator::next
bool next()
Advance generator to next chunk.
Definition chunk_generator.hh:185

memory_manager.hh

gem5::ArmISA::status
Bitfield< 5, 0 > status
Definition misc_types.hh:508

gem5::MipsISA::p
Bitfield< 0 > p
Definition pra_constants.hh:326

gem5::X86ISA::system
Bitfield< 15 > system
Definition misc.hh:1032

gem5::X86ISA::addr
Bitfield< 3 > addr
Definition types.hh:84

gem5
Copyright (c) 2024 Arm Limited All rights reserved.
Definition binary32.hh:36

gem5::RequestPtr
std::shared_ptr< Request > RequestPtr
Definition request.hh:94

gem5::Addr
uint64_t Addr
Address type This will probably be moved somewhere else in the near future.
Definition types.hh:147

gem5::csprintf
std::string csprintf(const char *format, const Args &...args)
Definition cprintf.hh:161

system.hh

gem5::AMDGPUMemoryManager::GPUMemPort::SenderState
Definition memory_manager.hh:60

gem5::AMDGPUMemoryManager::GPUMemPort::SenderState::_addr
Addr _addr
Definition memory_manager.hh:66

gem5::AMDGPUMemoryManager::GPUMemPort::SenderState::_requestId
uint64_t _requestId
Definition memory_manager.hh:67

gem5::AMDGPUMemoryManager::GPUMemPort::SenderState::_callback
Event * _callback
Definition memory_manager.hh:65

name
const std::string & name()
Definition trace.cc:48