Ridgeless Interpolation with Shallow ReLU Networks in $1D$ is Nearest Neighbor Curvature Extrapolation and Provably Generalizes on Lipschitz Functions.

[BibT_eX]

[DOI]

Boris Hanin

CoRR, 2021

Random Neural Networks in the Infinite Width Limit as Gaussian Processes.

[BibT_eX]

[DOI]

Boris Hanin

CoRR, 2021

The Principles of Deep Learning Theory.

[BibT_eX]

[DOI]

Daniel A. Roberts

Sho Yaida

Boris Hanin

CoRR, 2021

How Data Augmentation affects Optimization for Linear Regression.

[BibT_eX]

[DOI]

Boris Hanin

Yi Sun

Proceedings of the Advances in Neural Information Processing Systems 34: Annual Conference on Neural Information Processing Systems 2021, 2021

2020

Data augmentation as stochastic optimization.

[BibT_eX]

[DOI]

Boris Hanin

Yi Sun

CoRR, 2020

Finite Depth and Width Corrections to the Neural Tangent Kernel.

[BibT_eX]

[DOI]

Boris Hanin

Mihai Nica

Proceedings of the 8th International Conference on Learning Representations, 2020

2019

Nonlinear Approximation and (Deep) ReLU Networks.

[BibT_eX]

[DOI]

CoRR, 2019

Deep ReLU Networks Have Surprisingly Few Activation Patterns.

[BibT_eX]

[DOI]

Boris Hanin

David Rolnick

Proceedings of the Advances in Neural Information Processing Systems 32: Annual Conference on Neural Information Processing Systems 2019, 2019

Complexity of Linear Regions in Deep Networks.

[BibT_eX]

[DOI]

Boris Hanin

David Rolnick

Proceedings of the 36th International Conference on Machine Learning, 2019

2018

How to Start Training: The Effect of Initialization and Architecture.

[BibT_eX]

[DOI]

Boris Hanin

David Rolnick

Proceedings of the Advances in Neural Information Processing Systems 31: Annual Conference on Neural Information Processing Systems 2018, 2018

Which Neural Net Architectures Give Rise to Exploding and Vanishing Gradients?

[BibT_eX]

[DOI]

Boris Hanin

Proceedings of the Advances in Neural Information Processing Systems 31: Annual Conference on Neural Information Processing Systems 2018, 2018

2017

Approximating Continuous Functions by ReLU Nets of Minimal Width.

[BibT_eX]

[DOI]

Boris Hanin

Mark Sellke

CoRR, 2017

Universal Function Approximation by Deep Neural Nets with Bounded Width and ReLU Activations.

[BibT_eX]

[DOI]

Boris Hanin

CoRR, 2017

Boris Hanin

Timeline

Legend:

Links

On csauthors.net:

Bibliography

Loading...