Kaiyan Zhao

Orcid: 0009-0004-7112-4163

According to our database¹, Kaiyan Zhao authored at least 32 papers between 2022 and 2026.

Collaborative distances:

Dijkstra number² of four.
Erdős number³ of four.

Timeline

Legend:

Book In proceedings Article PhD thesis Dataset Other

Links

On csauthors.net:

Bibliography

2026

ANO: A Principled Approach to Robust Policy Optimization.

[BibT_eX]

[DOI]

CoRR, May, 2026

Anon: Extrapolating Adaptivity Beyond SGD and Adam.

[BibT_eX]

[DOI]

CoRR, May, 2026

E<sup>2</sup>DT: Efficient and Effective Decision Transformer with Experience-Aware Sampling for Robotic Manipulation.

[BibT_eX]

[DOI]

CoRR, May, 2026

C<sup>2</sup>T: Captioning-Structure and LLM-Aligned Common-Sense Reward Learning for Traffic-Vehicle Coordination.

[BibT_eX]

[DOI]

CoRR, April, 2026

Heuristic Self-Paced Learning for Domain Adaptive Semantic Segmentation under Adverse Conditions.

[BibT_eX]

[DOI]

CoRR, March, 2026

When Attention Betrays: Erasing Backdoor Attacks in Robotic Policies by Reconstructing Visual Tokens.

[BibT_eX]

[DOI]

CoRR, February, 2026

Decouple Searching from Training: Scaling Data Mixing via Model Merging for Large Language Model Pre-training.

[BibT_eX]

[DOI]

CoRR, February, 2026

Benchmarking Machine Translation on Chinese Social Media Texts.

[BibT_eX]

[DOI]

CoRR, January, 2026

NeoAMT: Neologism-Aware Agentic Machine Translation with Reinforcement Learning.

[BibT_eX]

[DOI]

CoRR, January, 2026

EComStage: Stage-wise and Orientation-specific Benchmarking for Large Language Models in E-commerce.

[BibT_eX]

[DOI]

CoRR, January, 2026

FedPAD: Aggregation-free federated learning with prototype-based adaptive distillation.

[BibT_eX]

[DOI]

Knowl. Based Syst., 2026

Latent State-Predictive Exploration for Deep Reinforcement Learning.

[BibT_eX]

[DOI]

Proceedings of the Fortieth AAAI Conference on Artificial Intelligence, 2026

DSAP: Enhancing Generalization in Goal-Conditioned Reinforcement Learning.

[BibT_eX]

[DOI]

Proceedings of the Fortieth AAAI Conference on Artificial Intelligence, 2026

Explore to Learn: Latent Exploration Through Disentangled Synergy Patterns for Reinforcement Learning in Overactuated Control.

[BibT_eX]

[DOI]

Proceedings of the Fortieth AAAI Conference on Artificial Intelligence, 2026

RGMP: Recurrent Geometric-prior Multimodal Policy for Generalizable Humanoid Robot Manipulation.

[BibT_eX]

[DOI]

Proceedings of the Fortieth AAAI Conference on Artificial Intelligence, 2026

2025

Improving Multimodal Contrastive Learning of Sentence Embeddings with Object-Phrase Alignment.

[BibT_eX]

[DOI]

Kaiyan Zhao

Zhongtao Miao

Yoshimasa Tsuruoka

CoRR, August, 2025

BiCAM: A Bidirectional Contextualized Attentive Model for Analyzing the Correlation of Heterogeneous Security Events.

[BibT_eX]

[DOI]

IEEE Trans. Reliab., June, 2025

Efficient Diversity-based Experience Replay for Deep Reinforcement Learning.

[BibT_eX]

[DOI]

Proceedings of the Thirty-Fourth International Joint Conference on Artificial Intelligence, 2025

BILE: An Effective Behavior-based Latent Exploration Scheme for Deep Reinforcement Learning.

[BibT_eX]

[DOI]

Proceedings of the Thirty-Fourth International Joint Conference on Artificial Intelligence, 2025

HeMoRa: Unsupervised Heuristic Consensus Sampling for Robust Point Cloud Registration.

[BibT_eX]

[DOI]

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2025

2024

Team-wise effective communication in multi-agent reinforcement learning.

[BibT_eX]

[DOI]

Auton. Agents Multi Agent Syst., December, 2024

CAG-Malconv: A Byte-Level Malware Detection Method With CBAM and Attention-GRU.

[BibT_eX]

[DOI]

IEEE Trans. Netw. Serv. Manag., October, 2024

Direct Quantized Training of Language Models with Stochastic Rounding.

[BibT_eX]

[DOI]

CoRR, 2024

Enhancing LLM Agents for Code Generation with Possibility and Pass-rate Prioritized Experience Replay.

[BibT_eX]

[DOI]

CoRR, 2024

Improving Arithmetic Reasoning Ability of Large Language Models through Relation Tuples, Verification and Dynamic Feedback.

[BibT_eX]

[DOI]

Zhongtao Miao

Kaiyan Zhao

Yoshimasa Tsuruoka

CoRR, 2024

Rethinking Exploration in Reinforcement Learning with Effective Metric-Based Exploration Bonus.

[BibT_eX]

[DOI]

Proceedings of the Advances in Neural Information Processing Systems 37: Annual Conference on Neural Information Processing Systems 2024, 2024

Enhancing Cross-lingual Sentence Embedding for Low-resource Languages with Word Alignment.

[BibT_eX]

[DOI]

Proceedings of the Findings of the Association for Computational Linguistics: NAACL 2024, 2024

AARR-Net: An Attention Assistance Feature Fusion and Model Recursive Recovery Network for Category-Level 6D Object Pose Estimation.

[BibT_eX]

[DOI]

Proceedings of the Neural Information Processing - 31st International Conference, 2024

Leveraging Multi-lingual Positive Instances in Contrastive Learning to Improve Sentence Embedding.

[BibT_eX]

[DOI]

Proceedings of the 18th Conference of the European Chapter of the Association for Computational Linguistics, 2024

2023

Barycentric interpolation collocation algorithm to solve fractional differential equations.

[BibT_eX]

[DOI]

Jin Li

Xiaoning Su

Kaiyan Zhao

Math. Comput. Simul., 2023

Regulating confidence by corner discrepancy and center score in corner-based object detection methods.

[BibT_eX]

[DOI]

J. Intell. Fuzzy Syst., 2023

2022

LIBKDV: A Versatile Kernel Density Visualization Library for Geospatial Analytics.

[BibT_eX]

[DOI]

Proc. VLDB Endow., 2022

Kaiyan Zhao

Timeline

Legend:

Links

On csauthors.net:

Bibliography

Loading...