Hao-Wen Dong

CoRR, September, 2025

REGen: Multimodal Retrieval-Embedded Generation for Long-to-Short Video Editing.

[BibT_eX]

[DOI]

Paul Pu Liang

Ruanqianqian (Lisa) Huang

CoRR, May, 2025

Deriving Representative Structure from Music Corpora.

[BibT_eX]

[DOI]

Ilana Shapiro

Zachary Novack

Cheng-i Wang

Sorin Lerner

CoRR, February, 2025

Generating Symbolic Music From Natural Language Prompts Using an LLM-Enhanced Dataset.

[BibT_eX]

[DOI]

Weihan Xu

Ruanqianqian (Lisa) Huang

Proceedings of the 26th International Society for Music Information Retrieval Conference, 2025

Video-Guided Text-to-Music Generation Using Public Domain Movie Collections.

[BibT_eX]

[DOI]

Proceedings of the 26th International Society for Music Information Retrieval Conference, 2025

Synthesizing Composite Hierarchical Structure from Symbolic Music Corpora.

[BibT_eX]

[DOI]

Ilana Shapiro

Zachary Novack

Cheng-i Wang

Sorin Lerner

Proceedings of the Thirty-Fourth International Joint Conference on Artificial Intelligence, 2025

TeaserGen: Generating Teasers for Long Documentaries.

[BibT_eX]

[DOI]

Proceedings of the Thirteenth International Conference on Learning Representations, 2025

FUTGA-MIR: Enhancing Fine-grained and Temporally-aware Music Understanding with Music Information Retrieval.

[BibT_eX]

[DOI]

Proceedings of the 2025 IEEE International Conference on Acoustics, 2025

ViolinDiff: Enhancing Expressive Violin Synthesis with Pitch Bend Conditioning.

[BibT_eX]

[DOI]

Daewoong Kim

Dasaem Jeong

Proceedings of the 2025 IEEE International Conference on Acoustics, 2025

2024

Generative AI for Music and Audio

[BibT_eX]

[DOI]

PhD thesis, 2024

Broadband topology optimization of three-dimensional structural-acoustic interaction with reduced order isogeometric FEM/BEM.

[BibT_eX]

[DOI]

Stéphane P. A. Bordas

J. Comput. Phys., 2024

Generative AI for Music and Audio.

[BibT_eX]

[DOI]

CoRR, 2024

Futga: Towards Fine-grained Music Understanding through Temporally-enhanced Generative Augmentation.

[BibT_eX]

[DOI]

CoRR, 2024

Nested Music Transformer: Sequentially Decoding Compound Tokens in Symbolic Music and Audio Generation.

[BibT_eX]

[DOI]

Proceedings of the 25th International Society for Music Information Retrieval Conference, 2024

2023

CLIPSonic: Text-to-Audio Synthesis with Unlabeled Videos and Pretrained Language-Vision Models.

[BibT_eX]

[DOI]

Proceedings of the IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, 2023

CLIPSep: Learning Text-queried Sound Separation with Noisy Unlabeled Videos.

[BibT_eX]

[DOI]

Proceedings of the Eleventh International Conference on Learning Representations, 2023

Multitrack Music Transformer.

[BibT_eX]

[DOI]

Proceedings of the IEEE International Conference on Acoustics, 2023

Equipping Pretrained Unconditional Music Transformers with Instrument and Genre Controls.

[BibT_eX]

[DOI]

Proceedings of the IEEE International Conference on Big Data, 2023

2022

Multitrack Music Transformer: Learning Long-Term Dependencies in Music with Diverse Instruments.

[BibT_eX]

[DOI]

CoRR, 2022

Improving Choral Music Separation through Expressive Synthesized Data from Sampled Instruments.

[BibT_eX]

[DOI]

Miller S. Puckette

Proceedings of the 23rd International Society for Music Information Retrieval Conference, 2022

Deep Performer: Score-to-Audio Music Performance Synthesis.

[BibT_eX]

[DOI]

Cong Zhou

Proceedings of the IEEE International Conference on Acoustics, 2022

2021

Bach Violin Dataset.

[BibT_eX]

[DOI]

Cong Zhou

Dataset, October, 2021

An Empirical Evaluation of End-to-End Polyphonic Optical Music Recognition.

[BibT_eX]

[DOI]

Sachinda Edirisooriya

Proceedings of the 22nd International Society for Music Information Retrieval Conference, 2021

Towards Automatic Instrumentation by Learning to Separate Parts in Symbolic Multitrack Music.

[BibT_eX]

[DOI]

Chris Donahue

Proceedings of the 22nd International Society for Music Information Retrieval Conference, 2021

2020

Automatic Melody Harmonization with Triad Chords: A Comparative Study.

[BibT_eX]

[DOI]

CoRR, 2020

MusPy: A Toolkit for Symbolic Music Generation.

[BibT_eX]

[DOI]

Ke Chen

Proceedings of the 21th International Society for Music Information Retrieval Conference, 2020

2019

Towards a Deeper Understanding of Adversarial Losses.

[BibT_eX]

[DOI]

Yi-Hsuan Yang

CoRR, 2019

2018

Lakh Pianoroll Dataset.

[BibT_eX]

[DOI]

Dataset, February, 2018

Training Generative Adversarial Networks with Binary Neurons by End-to-end Backpropagation.

[BibT_eX]

[DOI]

Yi-Hsuan Yang

CoRR, 2018

Convolutional Generative Adversarial Networks with Binary Neurons for Polyphonic Music Generation.

[BibT_eX]

[DOI]