Shangdong Yang

Orcid: 0000-0001-5379-9539

According to our database¹, Shangdong Yang authored at least 45 papers between 2016 and 2026.

Collaborative distances:

Dijkstra number² of four.
Erdős number³ of four.

Timeline

Legend:

Book In proceedings Article PhD thesis Dataset Other

Links

On csauthors.net:

Bibliography

2026

Model-Based Offline Reinforcement Learning With Adversarial Data Augmentation.

[BibT_eX]

[DOI]

IEEE Trans. Neural Networks Learn. Syst., June, 2026

Behavior-Aware Auxiliary Corrections for Off-Policy Temporal-Difference Prediction.

[BibT_eX]

[DOI]

CoRR, May, 2026

Behavior-Induced Mirror-Prox Temporal-Difference Learning for Faster Off-Policy Prediction.

[BibT_eX]

[DOI]

CoRR, May, 2026

Regularized Centered Emphatic Temporal Difference Learning.

[BibT_eX]

[DOI]

CoRR, May, 2026

Bitboard version of Tetris AI.

[BibT_eX]

[DOI]

CoRR, March, 2026

OpenGuanDan: A Large-Scale Imperfect Information Game Benchmark.

[BibT_eX]

[DOI]

CoRR, February, 2026

A unified and efficient training framework for open-ended non-transitive games.

[BibT_eX]

[DOI]

Neural Networks, 2026

Bellman error centering.

[BibT_eX]

[DOI]

Neural Networks, 2026

MAPG<sup>2</sup>: Multiagent Policy Gradient via Potential Game for Multirobot Task Allocation Problems.

[BibT_eX]

[DOI]

IEEE Internet Things J., 2026

2025

State Abstraction via Deep Supervised Hash Learning.

[BibT_eX]

[DOI]

IEEE Trans. Neural Networks Learn. Syst., July, 2025

Multi-Task Multi-Agent Reinforcement Learning With Interaction and Task Representations.

[BibT_eX]

[DOI]

IEEE Trans. Neural Networks Learn. Syst., July, 2025

Linear Complementary Dual Codes Constructed from Reinforcement Learning.

[BibT_eX]

[DOI]

Yansheng Wu

Jin Ma

Shangdong Yang

J. Syst. Sci. Complex., June, 2025

Bellman Error Centering.

[BibT_eX]

[DOI]

CoRR, February, 2025

Coordinating Multi-Agent Reinforcement Learning via Dual Collaborative Constraints.

[BibT_eX]

[DOI]

Neural Networks, 2025

Efficient Last-Iterate Convergence in Solving Extensive-Form Games.

[BibT_eX]

[DOI]

Proceedings of the Advances in Neural Information Processing Systems 38: Annual Conference on Neural Information Processing Systems 2025, 2025

AGC-Drive: A Large-Scale Dataset for Real-World Aerial-Ground Collaboration in Driving Scenarios.

[BibT_eX]

[DOI]

Proceedings of the Advances in Neural Information Processing Systems 38: Annual Conference on Neural Information Processing Systems 2025, 2025

DISTA-Net: Dynamic Closely-Spaced Infrared Small Target Unmixing.

[BibT_eX]

[DOI]

Proceedings of the IEEE/CVF International Conference on Computer Vision, 2025

Beyond Mandatory Federations: Balancing Egoism, Utilitarianism and Egalitarianism in Mixed-Motive Games.

[BibT_eX]

[DOI]

Proceedings of the Thirty-Ninth AAAI Conference on Artificial Intelligence, 2025

2024

Learning Multi-Intersection Traffic Signal Control via Coevolutionary Multi-Agent Reinforcement Learning.

[BibT_eX]

[DOI]

IEEE Trans. Intell. Transp. Syst., November, 2024

WToE: Learning When to Explore in Multiagent Reinforcement Learning.

[BibT_eX]

[DOI]

IEEE Trans. Cybern., August, 2024

Modeling Rationality: Toward Better Performance Against Unknown Agents in Sequential Games.

[BibT_eX]

[DOI]

IEEE Trans. Cybern., May, 2024

Egoism, utilitarianism and egalitarianism in multi-agent reinforcement learning.

[BibT_eX]

[DOI]

Neural Networks, 2024

Selective policy transfer in multi-agent systems with sparse interactions.

[BibT_eX]

[DOI]

Knowl. Based Syst., 2024

Decentralized Counterfactual Value with Threat Detection for Multi-Agent Reinforcement Learning in mixed cooperative and competitive environments.

[BibT_eX]

[DOI]

Expert Syst. Appl., 2024

A Variance Minimization Approach to Temporal-Difference Learning.

[BibT_eX]

[DOI]

CoRR, 2024

STAR: Spatio-Temporal State Compression for Multi-Agent Tasks with Rich Observations.

[BibT_eX]

[DOI]

Proceedings of the Thirty-Third International Joint Conference on Artificial Intelligence, 2024

Multi-Agent Sparse Interaction Modeling is an Anomaly Detection Problem.

[BibT_eX]

[DOI]

Proceedings of the IEEE International Conference on Acoustics, 2024

Gaussian Blur Optimization Method: Linear Texture Filtering Under Gaussian Function Separation.

[BibT_eX]

[DOI]

Shangdong Yang

Jue Wu

Proceedings of the 17th International Congress on Image and Signal Processing, 2024

2023

Online attentive kernel-based temporal difference learning.

[BibT_eX]

[DOI]

Knowl. Based Syst., October, 2023

Leveraging transition exploratory bonus for efficient exploration in Hard-Transiting reinforcement learning problems.

[BibT_eX]

[DOI]

Future Gener. Comput. Syst., August, 2023

Effective Interpretable Policy Distillation via Critical Experience Point Identification.

[BibT_eX]

[DOI]

IEEE Intell. Syst., 2023

Modified Retrace for Off-Policy Temporal Difference Learning.

[BibT_eX]

[DOI]

Proceedings of the Uncertainty in Artificial Intelligence, 2023

Convergence Analysis of Graphical Game-Based Nash Q-Learning using the Interaction Detection Signal of N-Step Return.

[BibT_eX]

[DOI]

Proceedings of the IEEE International Conference on Acoustics, 2023

Enhancing OOD Generalization in Offline Reinforcement Learning with Energy-Based Policy Optimization.

[BibT_eX]

[DOI]

Proceedings of the ECAI 2023 - 26th European Conference on Artificial Intelligence, September 30 - October 4, 2023, Kraków, Poland, 2023

Learning Explicit Credit Assignment for Cooperative Multi-Agent Reinforcement Learning via Polarization Policy Gradient.

[BibT_eX]

[DOI]

Proceedings of the Thirty-Seventh AAAI Conference on Artificial Intelligence, 2023

2022

New Galois hulls of generalized Reed-Solomon codes.

[BibT_eX]

[DOI]

Yansheng Wu

Chengju Li

Shangdong Yang

Finite Fields Their Appl., 2022

Learning Credit Assignment for Cooperative Reinforcement Learning.

[BibT_eX]

[DOI]

CoRR, 2022

Keeping Minimal Experience to Achieve Efficient Interpretable Policy Distillation.

[BibT_eX]

[DOI]

CoRR, 2022

GUARD: Multigranularity-based Unsupervised Anomaly Detection Algorithm for Multivariate Time Series.

[BibT_eX]

[DOI]

Proceedings of the 8th IEEE International Conference on Cloud Computing and Intelligent Systems, 2022

2021

An Optimal Algorithm for the Stochastic Bandits While Knowing the Near-Optimal Mean Reward.

[BibT_eX]

[DOI]

Shangdong Yang

Yang Gao

IEEE Trans. Neural Networks Learn. Syst., 2021

2020

Contextual Bandits With Hidden Features to Online Recommendation via Sparse Interactions.

[BibT_eX]

[DOI]

IEEE Intell. Syst., 2020

2019

A Contextual Bandit Approach to Personalized Online Recommendation via Sparse Interactions.

[BibT_eX]

[DOI]

Proceedings of the Advances in Knowledge Discovery and Data Mining, 2019

2018

An Optimal Algorithm for the Stochastic Bandits with Knowing Near-optimal Mean Reward.

[BibT_eX]

[DOI]

Proceedings of the 17th International Conference on Autonomous Agents and MultiAgent Systems, 2018

2016

Incremental Nonnegative Matrix Factorization Based on Matrix Sketching and k-means Clustering.

[BibT_eX]

[DOI]

Proceedings of the Intelligent Data Engineering and Automated Learning - IDEAL 2016, 2016

Efficient Average Reward Reinforcement Learning Using Constant Shifting Values.

[BibT_eX]

[DOI]

Proceedings of the Thirtieth AAAI Conference on Artificial Intelligence, 2016

Shangdong Yang

Timeline

Legend:

Links

On csauthors.net:

Bibliography

Loading...