Yakun Zhang

Orcid: 0000-0001-5829-1371

Affiliations:

Academy of Military Sciences, Defense Innovation Institute, Beijing, China
Tianjin Artificial Intelligence Innovation Center, Tianjin, China
Chinese Academy of Sciences, Laboratory of Artificial Neural Networks and High-speed Circuits, Institute of Semiconductors, Beijing, China
University of Chinese Academy of Sciences, School of Microelectronics, Beijing, China

According to our database¹, Yakun Zhang authored at least 21 papers between 2019 and 2026.

Collaborative distances:

Dijkstra number² of five.
Erdős number³ of four.

Timeline

Legend:

Book In proceedings Article PhD thesis Dataset Other

Bibliography

2026

DBMIF: a deep balanced multimodal iterative fusion framework for air- and bone-conduction speech enhancement.

[BibT_eX]

[DOI]

Appl. Intell., April, 2026

Purification Before Fusion: Toward Mask-Free Speech Enhancement for Robust Audio-Visual Speech Recognition.

[BibT_eX]

[DOI]

CoRR, January, 2026

Sequential viseme-driven visual speech recognition through dual-stream interactive neural architecture.

[BibT_eX]

[DOI]

Neural Networks, 2026

VSMatch-Lip: a visual-semantic matching framework for zero-shot lip reading.

[BibT_eX]

[DOI]

J. King Saud Univ. Comput. Inf. Sci., 2026

DAP-Whisper: A robust audio-visual speech recognition system via distribution-aware prompting and consistency-gated modulation.

[BibT_eX]

[DOI]

Expert Syst. Appl., 2026

2025

AVE Speech: A Comprehensive Multimodal Dataset for Speech Recognition Integrating Audio, Visual, and Electromyographic Signals.

[BibT_eX]

[DOI]

IEEE Trans. Hum. Mach. Syst., August, 2025

DuAGNet: an unrestricted multimodal speech recognition framework using dual adaptive gating fusion.

[BibT_eX]

[DOI]

Appl. Intell., February, 2025

AVE Speech Dataset: A Comprehensive Benchmark for Multi-Modal Speech Recognition Integrating Audio, Visual, and Electromyographic Signals.

[BibT_eX]

[DOI]

CoRR, January, 2025

Lipvis: A Novel Transient Viseme Extraction Framework for Lip Reading.

[BibT_eX]

[DOI]

IEEE Signal Process. Lett., 2025

Neural Chinese silent speech recognition with facial electromyography.

[BibT_eX]

[DOI]

Speech Commun., 2025

MsDUNE: A multi-scale masked temporal fusion framework for speaker-independent lipreading via Dirichlet uncertainty estimation.

[BibT_eX]

[DOI]

Neural Networks, 2025

Bridging semantics across modalities: Decoupled representation learning for audio-visual speech recognition.

[BibT_eX]

[DOI]

Knowl. Based Syst., 2025

2024

Landmark-Guided Cross-Speaker Lip Reading with Mutual Information Regularization.

[BibT_eX]

[DOI]

Proceedings of the 2024 Joint International Conference on Computational Linguistics, 2024

2023

EMG-Based Cross-Subject Silent Speech Recognition Using Conditional Domain Adversarial Network.

[BibT_eX]

[DOI]

IEEE Trans. Cogn. Dev. Syst., December, 2023

Auxiliary Fine-grained Alignment Constraints for Vision-and-Language Navigation.

[BibT_eX]

[DOI]

Proceedings of the IEEE International Conference on Multimedia and Expo, 2023

Grounded Entity-Landmark Adaptive Pre-training for Vision-and-Language Navigation.

[BibT_eX]

[DOI]

Proceedings of the IEEE/CVF International Conference on Computer Vision, 2023

2022

A novel silent speech recognition approach based on parallel inception convolutional neural network and Mel frequency spectral coefficient.

[BibT_eX]

[DOI]

Frontiers Neurorobotics, September, 2022

AGCNN: Adaptive Gabor Convolutional Neural Networks with Receptive Fields for Vein Biometric Recognition.

[BibT_eX]

[DOI]

Concurr. Comput. Pract. Exp., 2022

Improved Word-level Lipreading with Temporal Shrinkage Network and NetVLAD.

[BibT_eX]

[DOI]

Proceedings of the International Conference on Multimodal Interaction, 2022

2021

Parallel-Inception CNN Approach for Facial sEMG based Silent Speech Recognition.

[BibT_eX]

[DOI]

Proceedings of the 43rd Annual International Conference of the IEEE Engineering in Medicine & Biology Society, 2021

2019

Adaptive Learning Gabor Filter for Finger-Vein Recognition.

[BibT_eX]

[DOI]

IEEE Access, 2019

Yakun Zhang

Timeline

Legend:

Links

Online presence:

On csauthors.net:

Bibliography

Loading...