Kaishen Yuan

Orcid: 0009-0008-2353-2436

According to our database¹, Kaishen Yuan authored at least 20 papers between 2024 and 2026.

Collaborative distances:

Dijkstra number² of four.
Erdős number³ of four.

Timeline

Legend:

Book In proceedings Article PhD thesis Dataset Other

Links

On csauthors.net:

Bibliography

2026

Z<sup>2</sup>-Sampling: Zero-Cost Zigzag Trajectories for Semantic Alignment in Diffusion Models.

[BibT_eX]

[DOI]

CoRR, April, 2026

TurboEvolve: Towards Fast and Robust LLM-Driven Program Evolution.

[BibT_eX]

[DOI]

CoRR, April, 2026

AULLM++: Structural Reasoning with Large Language Models for Micro-Expression Recognition.

[BibT_eX]

[DOI]

CoRR, March, 2026

ΔVLA: Prior-Guided Vision-Language-Action Models via World Knowledge Variation.

[BibT_eX]

[DOI]

CoRR, March, 2026

Multi-Granularity Facial Emotional Representation With Unlabeled Data and Textual Supervision.

[BibT_eX]

[DOI]

IEEE Trans. Image Process., 2026

2025

POLARIS: Projection-Orthogonal Least Squares for Robust and Adaptive Inversion in Diffusion Models.

[BibT_eX]

[DOI]

CoRR, December, 2025

CoEmoGen: Towards Semantically-Coherent and Scalable Emotional Image Content Generation.

[BibT_eX]

[DOI]

CoRR, August, 2025

MedTVT-R1: A Multimodal LLM Empowering Medical Reasoning and Diagnosis.

[BibT_eX]

[DOI]

CoRR, June, 2025

ANT: Adaptive Neural Temporal-Aware Text-to-Motion Model.

[BibT_eX]

[DOI]

CoRR, June, 2025

FEALLM: Advancing Facial Emotion Analysis in Multimodal Large Language Models with Emotional Synergy and Reasoning.

[BibT_eX]

[DOI]

CoRR, May, 2025

scMMAE: masked cross-attention network for single-cell multimodal omics fusion to enhance unimodal omics.

[BibT_eX]

[DOI]

Briefings Bioinform., January, 2025

Multi-Scale Promoted Self-Adjusting Correlation Learning for Facial Action Unit Detection.

[BibT_eX]

[DOI]

IEEE Trans. Affect. Comput., 2025

FEALLM: Advancing Facial Emotion Analysis in Multimodal Large Language Models with Emotional Synergy and Reasoning.

[BibT_eX]

[DOI]

Proceedings of the 33rd ACM International Conference on Multimedia, 2025

ANT: Adaptive Neural Temporal-Aware Text-to-Motion Model.

[BibT_eX]

[DOI]

Proceedings of the 33rd ACM International Conference on Multimedia, 2025

AU-TTT: Vision Test-Time Training model for Facial Action Unit Detection.

[BibT_eX]

[DOI]

Proceedings of the IEEE International Conference on Multimedia and Expo, 2025

Period-LLM: Extending the Periodic Capability of Multimodal Large Language Model.

[BibT_eX]

[DOI]

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2025

AU-LLM: Micro-Expression Action Unit Detection via Enhanced LLM-Based Feature Fusion.

[BibT_eX]

[DOI]

Proceedings of the Biometric Recognition - 19th Chinese Conference, 2025

2024

EMO-LLaMA: Enhancing Facial Emotion Understanding with Instruction Tuning.

[BibT_eX]

[DOI]

CoRR, 2024

AUFormer: Vision Transformers Are Parameter-Efficient Facial Action Unit Detectors.

[BibT_eX]

[DOI]

Proceedings of the Computer Vision - ECCV 2024, 2024

GPT as Psychologist? Preliminary Evaluations for GPT-4V on Visual Affective Computing.

[BibT_eX]

[DOI]

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2024

Kaishen Yuan

Timeline

Legend:

Links

On csauthors.net:

Bibliography

Loading...