Dmitrii Volkov

According to our database¹, Dmitrii Volkov authored at least 9 papers between 2024 and 2025.

Collaborative distances:

Dijkstra number² of five.
Erdős number³ of four.

Timeline

Legend:

Book

In proceedings

Article

PhD thesis

Dataset

Other

Links

On csauthors.net:

Bibliography

2025

GPT-5 at CTFs: Case Studies From Top-Tier Cybersecurity Events.

[BibT_eX]

[DOI]

Reworr

Artem Petrov

Dmitrii Volkov

CoRR, November, 2025

Misalignment Bounty: Crowdsourcing AI Agent Misbehavior.

[BibT_eX]

[DOI]

CoRR, October, 2025

Evaluating AI cyber capabilities with crowdsourced elicitation.

[BibT_eX]

[DOI]

Artem Petrov

Dmitrii Volkov

CoRR, May, 2025

Demonstrating specification gaming in reasoning models.

[BibT_eX]

[DOI]

CoRR, February, 2025

Resurrecting saturated LLM benchmarks with adversarial encoding.

[BibT_eX]

[DOI]

Igor Ivanov

Dmitrii Volkov

CoRR, February, 2025

2024

BadGPT-4o: stripping safety finetuning from GPT models.

[BibT_eX]

[DOI]

Ekaterina Krupkina

Dmitrii Volkov

CoRR, 2024

Hacking CTFs with Plain Agents.

[BibT_eX]

[DOI]

CoRR, 2024

LLM Agent Honeypot: Monitoring AI Hacking Agents in the Wild.

[BibT_eX]

[DOI]

Reworr

Dmitrii Volkov

CoRR, 2024

Badllama 3: removing safety finetuning from Llama 3 in minutes.

[BibT_eX]

[DOI]

Dmitrii Volkov

CoRR, 2024

Dmitrii Volkov

Timeline

Legend:

Links

On csauthors.net:

Bibliography

Loading...