Laurène Vaugrante

According to our database¹, Laurène Vaugrante authored at least 5 papers between 2024 and 2026.

Collaborative distances:

Dijkstra number² of five.
Erdős number³ of five.

Timeline

Legend:

Book In proceedings Article PhD thesis Dataset Other

Links

On csauthors.net:

Bibliography

2026

Emergently Misaligned Language Models Show Behavioral Self-Awareness That Shifts With Subsequent Realignment.

[BibT_eX]

[DOI]

Laurène Vaugrante

Anietta Weckauff

Thilo Hagendorff

CoRR, February, 2026

Compromising Honesty and Harmlessness in Language Models via Covert Deception Attacks.

[BibT_eX]

[DOI]

Trans. Mach. Learn. Res., 2026

2025

Compromising Honesty and Harmlessness in Language Models via Deception Attacks.

[BibT_eX]

[DOI]

CoRR, February, 2025

Prompt Engineering Techniques for Language Model Reasoning Lack Replicability.

[BibT_eX]

[DOI]

Laurène Vaugrante

Mathias Niepert

Thilo Hagendorff

Trans. Mach. Learn. Res., 2025

2024

A Looming Replication Crisis in Evaluating Behavior in Language Models? Evidence and Solutions.

[BibT_eX]

[DOI]

Laurène Vaugrante

Mathias Niepert

Thilo Hagendorff

CoRR, 2024

Laurène Vaugrante

Timeline

Legend:

Links

On csauthors.net:

Bibliography

Loading...