Nicholas Moratelli

Orcid: 0000-0001-9362-5680

According to our database¹, Nicholas Moratelli authored at least 17 papers between 2023 and 2025.

Collaborative distances:

Dijkstra number² of five.
Erdős number³ of four.

Timeline

Legend:

Book

In proceedings

Article

PhD thesis

Dataset

Other

Links

On csauthors.net:

Bibliography

2025

Positive-Augmented Contrastive Learning for Vision-and-Language Evaluation and Training.

[BibT_eX]

[DOI]

Int. J. Comput. Vis., November, 2025

Mitigating Hallucinations in Multimodal LLMs via Object-aware Preference Optimization.

[BibT_eX]

[DOI]

CoRR, August, 2025

LLaVA-MORE: A Comparative Study of LLMs and Visual Backbones for Enhanced Visual Instruction Tuning.

[BibT_eX]

[DOI]

CoRR, March, 2025

Causal Graphical Models for Vision-Language Compositional Understanding.

[BibT_eX]

[DOI]

Fiorenzo Parascandolo

Proceedings of the Thirteenth International Conference on Learning Representations, 2025

Augmenting Multimodal LLMs with Self-Reflective Tokens for Knowledge-based Visual Question Answering.

[BibT_eX]

[DOI]

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2025

2024

Are Learnable Prompts the Right Way of Prompting? Adapting Vision-and-Language Models with Memory Optimization.

[BibT_eX]

[DOI]

IEEE Intell. Syst., 2024

Personalizing Multimodal Large Language Models for Image Captioning: An Experimental Analysis.

[BibT_eX]

[DOI]

CoRR, 2024

Augmenting Multimodal LLMs with Self-Reflective Tokens for Knowledge-based Visual Question Answering.

[BibT_eX]

[DOI]

CoRR, 2024

Revisiting Image Captioning Training Paradigm via Direct CLIP-based Optimization.

[BibT_eX]

[DOI]

CoRR, 2024

Wiki-LLaVA: Hierarchical Retrieval-Augmented Generation for Multimodal LLMs.

[BibT_eX]

[DOI]

CoRR, 2024

The (R)Evolution of Multimodal Large Language Models: A Survey.

[BibT_eX]

[DOI]

CoRR, 2024

Fluent and Accurate Image Captioning with a Self-trained Reward Model.

[BibT_eX]

[DOI]

Proceedings of the Pattern Recognition - 27th International Conference, 2024

Personalizing Multimodal Large Language Models for Image Captioning: An Experimental Analysis.

[BibT_eX]

[DOI]

Proceedings of the Computer Vision - ECCV 2024 Workshops, 2024

Wiki-LLaVA: Hierarchical Retrieval-Augmented Generation for Multimodal LLMs.

[BibT_eX]

[DOI]

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2024

Revisiting Image Captioning Training Paradigm via Direct CLIP-based Optimization.

[BibT_eX]

[DOI]

Proceedings of the 35th British Machine Vision Conference, 2024

The Revolution of Multimodal Large Language Models: A Survey.

[BibT_eX]

[DOI]

Proceedings of the Findings of the Association for Computational Linguistics, 2024

2023

Fashion-Oriented Image Captioning with External Knowledge Retrieval and Fully Attentive Gates.

[BibT_eX]

[DOI]

Sensors, February, 2023

Nicholas Moratelli

Timeline

Legend:

Links

On csauthors.net:

Bibliography

Loading...