Mario Drumond

Orcid: 0000-0002-1981-3525

According to our database¹, Mario Drumond authored at least 16 papers between 2015 and 2023.

Collaborative distances:

Dijkstra number² of four.
Erdős number³ of four.

Timeline

Legend:

Book In proceedings Article PhD thesis Dataset Other

Bibliography

2023

Scale-out Systolic Arrays.

[BibT_eX]

[DOI]

Ahmet Caner Yüzügüler

ACM Trans. Archit. Code Optim., June, 2023

2021

Efficient Nearest-Neighbor Data Sharing in GPUs.

[BibT_eX]

[DOI]

ACM Trans. Archit. Code Optim., 2021

Equinox: Training (for Free) on a Custom Inference Accelerator.

[BibT_eX]

[DOI]

Mario Drumond

Louis Coulon

Arash Pourhabibi Zarandi

Ahmet Caner Yüzügüler

Babak Falsafi

Martin Jaggi

Proceedings of the MICRO '21: 54th Annual IEEE/ACM International Symposium on Microarchitecture, 2021

2020

ColTraIn: Co-located DNN training and inference.

[BibT_eX]

[DOI]

Mario Drumond

PhD thesis, 2020

Enabling High-Capacity, Latency-Tolerant, and Highly-Concurrent GPU Register Files via Software/Hardware Cooperation.

[BibT_eX]

[DOI]

Mohammad Sadrosadati

Amirhossein Mirhosseini

Rachata Ausavarungnirun

Onur Mutlu

CoRR, 2020

Optimus Prime: Accelerating Data Transformation in Servers.

[BibT_eX]

[DOI]

Arash Pourhabibi Zarandi

Proceedings of the ASPLOS '20: Architectural Support for Programming Languages and Operating Systems, 2020

2019

Highly Concurrent Latency-tolerant Register Files for GPUs.

[BibT_eX]

[DOI]

Mohammad Sadrosadati

Amirhossein Mirhosseini

Rachata Ausavarungnirun

Onur Mutlu

ACM Trans. Comput. Syst., 2019

Analog Neural Networks With Deep-Submicrometer Nonlinear Synapses.

[BibT_eX]

[DOI]

Ahmet Caner Yuzuguler

IEEE Micro, 2019

2018

Algorithm/Architecture Co-Design for Near-Memory Processing.

[BibT_eX]

[DOI]

Mario Drumond

Alexandros Daglis

Nooshin Sadat Mirzadeh

Dionisios N. Pnevmatikatos

ACM SIGOPS Oper. Syst. Rev., 2018

End-to-End DNN Training with Block Floating Point Arithmetic.

[BibT_eX]

[DOI]

CoRR, 2018

Training DNNs with Hybrid Block Floating Point.

[BibT_eX]

[DOI]

Proceedings of the Advances in Neural Information Processing Systems 31: Annual Conference on Neural Information Processing Systems 2018, 2018

LTRF: Enabling High-Capacity Register Files for GPUs via Hardware/Software Cooperative Register Prefetching.

[BibT_eX]

[DOI]

Mohammad Sadrosadati

Amirhossein Mirhosseini

Rachata Ausavarungnirun

Onur Mutlu

Proceedings of the Twenty-Third International Conference on Architectural Support for Programming Languages and Operating Systems, 2018

2017

The Mondrian Data Engine.

[BibT_eX]

[DOI]

Mario Drumond

Alexandros Daglis

Nooshin Sadat Mirzadeh

Dionisios N. Pnevmatikatos

Proceedings of the 44th Annual International Symposium on Computer Architecture, 2017

2015

Enabling GPGPU Low-Level Hardware Explorations with MIAOW: An Open-Source RTL Implementation of a GPGPU.

[BibT_eX]

[DOI]

Raghuraman Balasubramanian

Karthikeyan Sankaralingam

ACM Trans. Archit. Code Optim., 2015

MIAOW: An open source GPGPU.

[BibT_eX]

[DOI]

Vinay Gangadhar

Raghuraman Balasubramanian

Proceedings of the 2015 IEEE Hot Chips 27 Symposium (HCS), 2015

MIAOW - An open source RTL implementation of a GPGPU.

[BibT_eX]

[DOI]

Raghuraman Balasubramanian

Karthikeyan Sankaralingam

Proceedings of the 2015 IEEE Symposium in Low-Power and High-Speed Chips, 2015

Mario Drumond

Timeline

Legend:

Links

Online presence:

On csauthors.net:

Bibliography

Loading...