Judd Rosenblatt

According to our database¹, Judd Rosenblatt authored at least 7 papers between 2024 and 2026.

Collaborative distances:

Dijkstra number² of five.
Erdős number³ of four.

Timeline

Legend:

Book In proceedings Article PhD thesis Dataset Other

Links

On csauthors.net:

Bibliography

2026

Learning Self-Interpretation from Interpretability Artifacts: Training Lightweight Adapters on Vector-Label Pairs.

[BibT_eX]

[DOI]

Michael S. A. Graziano

Diogo S. de Lucena

CoRR, February, 2026

Endogenous Resistance to Activation Steering in Language Models.

[BibT_eX]

[DOI]

Michael S. A. Graziano

CoRR, February, 2026

2025

Large Language Models Report Subjective Experience Under Self-Referential Processing.

[BibT_eX]

[DOI]

Cameron Berg

Diogo S. de Lucena

Judd Rosenblatt

CoRR, October, 2025

Momentum Point-Perplexity Mechanics in Large Language Models.

[BibT_eX]

[DOI]

Lorenzo Tomaz

Judd Rosenblatt

Thomas Berry Jones

Diogo Schwerz de Lucena

CoRR, August, 2025

2024

Towards Safe and Honest AI Agents with Neural Self-Other Overlap.

[BibT_eX]

[DOI]

Diogo Schwerz de Lucena

CoRR, 2024

Unexpected Benefits of Self-Modeling in Neural Systems.

[BibT_eX]

[DOI]

Vickram N. Premakumar

Michael Vaiana

Florin Pop

Judd Rosenblatt

Diogo Schwerz de Lucena

Kirsten Ziman

Michael S. A. Graziano

CoRR, 2024

Rethinking harmless refusals when fine-tuning foundation models.

[BibT_eX]

[DOI]

Florin Pop

Judd Rosenblatt

Diogo Schwerz de Lucena

Michael Vaiana

CoRR, 2024

Judd Rosenblatt

Timeline

Legend:

Links

On csauthors.net:

Bibliography

Loading...