Simon Lermen

Orcid: 0009-0007-8614-0395

According to our database¹, Simon Lermen authored at least 10 papers between 2023 and 2026.

Collaborative distances:

Dijkstra number² of four.
Erdős number³ of four.

Timeline

Legend:

Book In proceedings Article PhD thesis Dataset Other

Links

On csauthors.net:

Bibliography

2026

Large-scale online deanonymization with LLMs.

[BibT_eX]

[DOI]

CoRR, February, 2026

Evaluating large language models' ability to automate spear phishing.

[BibT_eX]

[DOI]

Fredrik Heiding

Simon Lermen

Andrew Kao

Claudio Mayrink Verdun

Bruce Schneier

Arun Vishwanath

Expert Syst. Appl., 2026

2025

Can AI Models be Jailbroken to Phish Elderly Victims? An End-to-End Evaluation.

[BibT_eX]

[DOI]

Fredrik Heiding

Simon Lermen

CoRR, November, 2025

Deceptive Automated Interpretability: Language Models Coordinating to Fool Oversight Systems.

[BibT_eX]

[DOI]

Simon Lermen

Mateusz Dziemian

Natalia Pérez-Campanero Antolín

CoRR, April, 2025

2024

Evaluating Large Language Models' Capability to Launch Fully Automated Spear Phishing Campaigns: Validated on Human Subjects.

[BibT_eX]

[DOI]

CoRR, 2024

Applying Refusal-Vector Ablation to Llama 3.1 70B Agents.

[BibT_eX]

[DOI]

Simon Lermen

Mateusz Dziemian

Govind Pimpale

CoRR, 2024

2023

Exploring the Robustness of Model-Graded Evaluations and Automated Interpretability.

[BibT_eX]

[DOI]

Simon Lermen

Ondrej Kvapil

CoRR, 2023

BadLlama: cheaply removing safety fine-tuning from Llama 2-Chat 13B.

[BibT_eX]

[DOI]

CoRR, 2023

LoRA Fine-tuning Efficiently Undoes Safety Training in Llama 2-Chat 70B.

[BibT_eX]

[DOI]

Simon Lermen

Charlie Rogers-Smith

Jeffrey Ladish

CoRR, 2023

Evaluating Shutdown Avoidance of Language Models in Textual Scenarios.

[BibT_eX]

[DOI]

Teun van der Weij

Simon Lermen

Leon Lang

CoRR, 2023

Simon Lermen

Timeline

Legend:

Links

On csauthors.net:

Bibliography

Loading...