Ronghui Mu

Proceedings of the Thirty-Fourth International Joint Conference on Artificial Intelligence, 2025

Enhancing Robust Fairness via Confusional Spectral Regularization.

[BibT_eX]

[DOI]

Proceedings of the Thirteenth International Conference on Learning Representations, 2025

2024

A survey of safety and trustworthiness of large language models through the lens of verification and validation.

[BibT_eX]

[DOI]

Artif. Intell. Rev., July, 2024

Nrat: towards adversarial training with inherent label noise.

[BibT_eX]

[DOI]

Mach. Learn., June, 2024

3DVerifier: efficient robustness verification for 3D point cloud models.

[BibT_eX]

[DOI]

Mach. Learn., April, 2024

Enhancing robustness in video recognition models: Sparse adversarial attacks and beyond.

[BibT_eX]

[DOI]

Neural Networks, 2024

Building Guardrails for Large Language Models.

[BibT_eX]

[DOI]

CoRR, 2024

PRASS: Probabilistic Risk-averse Robust Learning with Stochastic Search.

[BibT_eX]

[DOI]

Jonathan E. Fieldsend

Proceedings of the Thirty-Third International Joint Conference on Artificial Intelligence, 2024

Position: Building Guardrails for Large Language Models Requires Systematic Design.

[BibT_eX]

[DOI]

Proceedings of the Forty-first International Conference on Machine Learning, 2024

DeepGRE: Global Robustness Evaluation of Deep Neural Networks.

[BibT_eX]

[DOI]

Proceedings of the IEEE International Conference on Acoustics, 2024

Towards Fairness-Aware Adversarial Learning.

[BibT_eX]

[DOI]

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2024

Reward Certification for Policy Smoothed Reinforcement Learning.

[BibT_eX]

[DOI]

Proceedings of the Thirty-Eighth AAAI Conference on Artificial Intelligence, 2024

2023

Randomized Adversarial Training via Taylor Expansion.

[BibT_eX]

[DOI]

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2023

Certified Policy Smoothing for Cooperative Multi-Agent Reinforcement Learning.

[BibT_eX]

[DOI]

Gaojie Jin

Proceedings of the Thirty-Seventh AAAI Conference on Artificial Intelligence, 2023

2021

Sparse Adversarial Video Attacks with Spatial Transformations.

[BibT_eX]

[DOI]