Guanghui He

Signal Image Video Process., September, 2025

OFQ-LLM: Outlier-Flexing Quantization for Efficient Low-Bit Large Language Model Acceleration.

[BibT_eX]

[DOI]

IEEE Trans. Circuits Syst. I Regul. Pap., August, 2025

An Efficient Multi-View Cross-Attention Accelerator for Vision-Centric 3D Perception in Autonomous Driving.

[BibT_eX]

[DOI]

IEEE Trans. Circuits Syst. I Regul. Pap., July, 2025

Neural Rendering Acceleration With Deferred Neural Decoding and Voxel-Centric Data Flow.

[BibT_eX]

[DOI]

IEEE Trans. Comput. Aided Des. Integr. Circuits Syst., July, 2025

Lightweight image super-resolution based on mixer-based focal modulation network.

[BibT_eX]

[DOI]

Signal Image Video Process., July, 2025

SD-Acc: Accelerating Stable Diffusion through Phase-aware Sampling and Hardware Co-Optimizations.

[BibT_eX]

[DOI]

Zhican Wang

Hongxiang Fan

CoRR, July, 2025

DESA: Dataflow Efficient Systolic Array for Acceleration of Transformers.

[BibT_eX]

[DOI]

Zhican Wang

Hongxiang Fan

IEEE Trans. Computers, June, 2025

Efficient Hardware Architecture Design for Rotary Position Embedding of Large Language Models.

[BibT_eX]

[DOI]

IEEE J. Emerg. Sel. Topics Circuits Syst., June, 2025

Adaptive Two-Range Quantization and Hardware Co-Design for Large Language Model Acceleration.

[BibT_eX]

[DOI]

IEEE J. Emerg. Sel. Topics Circuits Syst., June, 2025

Accelerating 3D Gaussian Splatting with Neural Sorting and Axis-Oriented Rasterization.

[BibT_eX]

[DOI]

CoRR, June, 2025

HyCTor: A Hybrid CNN-Transformer Network Accelerator With Flexible Weight/Output Stationary Dataflow and Multicore Extension.

[BibT_eX]

[DOI]

IEEE Trans. Comput. Aided Des. Integr. Circuits Syst., May, 2025

Phydiisp: a physics-guided differentiable pipeline for low-light machine vision.

[BibT_eX]

[DOI]

Jingchao Hou

Signal Image Video Process., May, 2025

Lightweight image super-resolution network based on graph-based deep learning.

[BibT_eX]

[DOI]

Signal Image Video Process., March, 2025

COSA Plus: Enhanced Co-Operative Systolic Arrays for Attention Mechanism in Transformers.

[BibT_eX]

[DOI]

Zhican Wang

Gang Wang

IEEE Trans. Comput. Aided Des. Integr. Circuits Syst., February, 2025

Diffusion models for image super-resolution: State-of-the-art and future directions.

[BibT_eX]

[DOI]

Neurocomputing, 2025

Lightweight image super-resolution network based on dynamic graph message passing and convolution mixer.

[BibT_eX]

[DOI]

Expert Syst. Appl., 2025

VEDA: Efficient LLM Generation Through Voting-based KV Cache Eviction and Dataflow-flexible Accelerator.

[BibT_eX]

[DOI]

Proceedings of the 62nd ACM/IEEE Design Automation Conference, 2025

BitPattern: Enabling Efficient Bit-Serial Acceleration of Deep Neural Networks through Bit-Pattern Pruning.

[BibT_eX]

[DOI]

Proceedings of the 62nd ACM/IEEE Design Automation Conference, 2025

KVO-LLM: Boosting Long-Context Generation Throughput for Batched LLM Inference.

[BibT_eX]

[DOI]

Proceedings of the 62nd ACM/IEEE Design Automation Conference, 2025

SparseTrim: A Neural Network Accelerator Featuring On-Chip Decompression of Fine-Grained Sparse Model with 10.1TOPS/W System Energy Efficiency.

[BibT_eX]

[DOI]

Proceedings of the IEEE Custom Integrated Circuits Conference, 2025

2024

M2M: A Fine-Grained Mapping Framework to Accelerate Multiple DNNs on a Multi-Chiplet Architecture.

[BibT_eX]

[DOI]

IEEE Trans. Very Large Scale Integr. Syst., October, 2024

BSViT: A Bit-Serial Vision Transformer Accelerator Exploiting Dynamic Patch and Weight Bit-Group Quantization.

[BibT_eX]

[DOI]

IEEE Trans. Circuits Syst. I Regul. Pap., September, 2024

CoDA: A Co-Design Framework for Versatile and Efficient Attention Accelerators.

[BibT_eX]

[DOI]

IEEE Trans. Computers, August, 2024

A Broad-Spectrum and High-Throughput Compression Engine for Neural Network Processors.

[BibT_eX]

[DOI]

IEEE Trans. Circuits Syst. II Express Briefs, July, 2024

Quantization and Hardware Architecture Co-Design for Matrix-Vector Multiplications of Large Language Models.

[BibT_eX]

[DOI]

IEEE Trans. Circuits Syst. I Regul. Pap., June, 2024

INDM: Chiplet-Based Interconnect Network and Dataflow Mapping for DNN Accelerators.

[BibT_eX]

[DOI]

IEEE Trans. Comput. Aided Des. Integr. Circuits Syst., April, 2024

TICA: Timing Slack Inference and Clock Frequency Adaption Technique for a Deeply Pipelined Near-Threshold-Voltage Bitcoin Mining Core.

[BibT_eX]

[DOI]

IEEE J. Solid State Circuits, February, 2024

A Precision-Scalable Deep Neural Network Accelerator With Activation Sparsity Exploitation.

[BibT_eX]

[DOI]

IEEE Trans. Comput. Aided Des. Integr. Circuits Syst., January, 2024

DTDeMo: A Deep Learning-Based Two-Stage Image Demosaicing Model With Interpolation and Enhancement.

[BibT_eX]

[DOI]

IEEE Trans. Computational Imaging, 2024

Lightweight image super-resolution network based on extended convolution mixer.

[BibT_eX]

[DOI]

Eng. Appl. Artif. Intell., 2024

Hardware-oriented algorithms for softmax and layer normalization of large language models.

[BibT_eX]

[DOI]

Sci. China Inf. Sci., 2024

Efficient image super-resolution based on transformer with bidirectional interaction.

[BibT_eX]

[DOI]

Appl. Soft Comput., 2024

VEGA: Implementing a Versatile and Efficient Deep Learning Processor with Graph-Based ALU.

[BibT_eX]

[DOI]

Proceedings of the 42nd IEEE International Conference on Computer Design, 2024

DEFA: Efficient Deformable Attention Acceleration via Pruning-Assisted Grid-Sampling and Multi-Scale Parallel Processing.

[BibT_eX]

[DOI]

Proceedings of the 61st ACM/IEEE Design Automation Conference, 2024

2023

Lightweight image super-resolution based multi-order gated aggregation network.

[BibT_eX]

[DOI]

Neural Networks, September, 2023

Lightweight image super-resolution based on deep learning: State-of-the-art and future directions.

[BibT_eX]

[DOI]

Kasidis Arunruangsirilert

Inf. Fusion, June, 2023

Low-Complexity Precision-Scalable Multiply-Accumulate Unit Architectures for Deep Neural Network Accelerators.

[BibT_eX]

[DOI]

IEEE Trans. Circuits Syst. II Express Briefs, April, 2023

GEM: A Generalized Memristor Device Modeling Framework Based on Neural Network for Transient Circuit Simulation.

[BibT_eX]

[DOI]

IEEE Trans. Comput. Aided Des. Integr. Circuits Syst., March, 2023

CCSA: A 394TOPS/W Mixed-Signal GPS Accelerator with Charge-Based Correlation Computing for Signal Acquisition.

[BibT_eX]

[DOI]

Proceedings of the IEEE International Solid- State Circuits Conference, 2023

SpOctA: A 3D Sparse Convolution Accelerator with Octree-Encoding-Based Map Search and Inherent Sparsity-Aware Processing.

[BibT_eX]

[DOI]

Proceedings of the IEEE/ACM International Conference on Computer Aided Design, 2023

COSA:Co-Operative Systolic Arrays for Multi-head Attention Mechanism in Neural Network using Hybrid Data Reuse and Fusion Methodologies.

[BibT_eX]

[DOI]

Proceedings of the 60th ACM/IEEE Design Automation Conference, 2023

FLNA: An Energy-Efficient Point Cloud Feature Learning Accelerator with Dataflow Decoupling.

[BibT_eX]

[DOI]

Proceedings of the 60th ACM/IEEE Design Automation Conference, 2023

NTIRE 2023 Challenge on Image Super-Resolution (×4): Methods and Results.

[BibT_eX]

[DOI]

Raghavendra Ramachandra

Christoph Busch

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2023

NTIRE 2023 Challenge on Stereo Image Super-Resolution: Methods and Results.

[BibT_eX]

[DOI]

Fredrik K. Gustafsson

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2023

Mixer-based Local Residual Network for Lightweight Image Super-resolution.

[BibT_eX]

[DOI]

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2023

A Simple Transformer-style Network for Lightweight Image Super-resolution.

[BibT_eX]

[DOI]

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2023

MUG5: Modeling of Universal Chiplet Interconnect Express (UCIe) Standard Based on gem5.

[BibT_eX]

[DOI]

Proceedings of the 15th IEEE International Conference on ASIC, 2023

2022

Efficient Compression Methods for Wire-Spread-Based Stochastic Computing Deep Neural Networks.

[BibT_eX]

[DOI]

IEEE Trans. Circuits Syst. II Express Briefs, 2022

XBarNet: Computationally Efficient Memristor Crossbar Model Using Convolutional Autoencoder.

[BibT_eX]

[DOI]

IEEE Trans. Comput. Aided Des. Integr. Circuits Syst., 2022

Balanced Spatial Feature Distillation and Pyramid Attention Network for Lightweight Image Super-resolution.

[BibT_eX]

[DOI]

Neurocomputing, 2022

An Efficient Stochastic Convolution Accelerator based on Pseudo-Sobol Sequences.

[BibT_eX]

[DOI]

Proceedings of the 17th ACM International Symposium on Nanoscale Architectures, 2022

Efficient and Accurate Quantized Image Super-Resolution on Mobile NPUs, Mobile AI & AIM 2022 Challenge: Report.

[BibT_eX]

[DOI]

Bahri Batuhan Bilecen

Shota Hirose

Proceedings of the Computer Vision - ECCV 2022 Workshops, 2022

Real-Time Channel Mixing Net for Mobile Image Super-Resolution.

[BibT_eX]

[DOI]

Proceedings of the Computer Vision - ECCV 2022 Workshops, 2022

TICA: A 0.3V, Variation-Resilient 64-Stage Deeply-Pipelined Bitcoin Mining Core with Timing Slack Inference and Clock Frequency Adaption.

[BibT_eX]

[DOI]

Proceedings of the IEEE Custom Integrated Circuits Conference, 2022

2021

A 3.85-Gb/s 8 × 8 Soft-Output MIMO Detector With Lattice-Reduction-Aided Channel Preprocessing.

[BibT_eX]

[DOI]

IEEE Trans. Very Large Scale Integr. Syst., 2021

Efficient and Robust RRAM-Based Convolutional Weight Mapping With Shifted and Duplicated Kernel.

[BibT_eX]

[DOI]

IEEE Trans. Comput. Aided Des. Integr. Circuits Syst., 2021

TEANS: A Target Enhancement and Attenuated Nonmaximum Suppression Object Detector for Remote Sensing Images.

[BibT_eX]

[DOI]

IEEE Geosci. Remote. Sens. Lett., 2021

A Low-Latency FPGA Implementation for Real-Time Object Detection.

[BibT_eX]

[DOI]

Proceedings of the IEEE International Symposium on Circuits and Systems, 2021

Fast FPGA-Based Emulation for ReRAM-Enabled Deep Neural Network Accelerator.

[BibT_eX]

[DOI]

Proceedings of the IEEE International Symposium on Circuits and Systems, 2021

Subgraph Decoupling and Rescheduling for Increased Utilization in CGRA Architecture.

[BibT_eX]

[DOI]

Proceedings of the Design, Automation & Test in Europe Conference & Exhibition, 2021

Reducing Memory Access Conflicts with Loop Transformation and Data Reuse on Coarse-grained Reconfigurable Architecture.

[BibT_eX]

[DOI]

Proceedings of the Design, Automation & Test in Europe Conference & Exhibition, 2021

CCASM: A Computation- and Communication-Aware Scheduling and Mapping Algorithm for NoC-Based DNN Accelerators.

[BibT_eX]

[DOI]

Proceedings of the 14th IEEE International Conference on ASIC, 2021

2020

Algorithm and Architecture of an Efficient MIMO Detector With Cross-Level Parallel Tree-Search.

[BibT_eX]

[DOI]

Xiaoyu Zhang

Zhuojun Liang

IEEE Trans. Very Large Scale Integr. Syst., 2020

A Hierarchical Scrubbing Technique for SEU Mitigation on SRAM-Based FPGAs.

[BibT_eX]

[DOI]

Sijie Zheng

Naifeng Jing

IEEE Trans. Very Large Scale Integr. Syst., 2020

Hardware Implementation of an Improved Stochastic Computing Based Deep Neural Network Using Short Sequence Length.

[BibT_eX]

[DOI]

Haifei Xiong

Muhammad Abu Bakar