Yihong Liu

CoRR, July, 2025

Refusal Direction is Universal Across Safety-Aligned Languages.

[BibT_eX]

[DOI]

CoRR, May, 2025

Tracing Multilingual Factual Knowledge Acquisition in Pretraining.

[BibT_eX]

[DOI]

Mingyang Wang

CoRR, May, 2025

HYPEROFA: Expanding LLM Vocabulary to New Languages via Hypernetwork-Based Embedding Initialization.

[BibT_eX]

[DOI]

Enes Özeren

CoRR, April, 2025

On Relation-Specific Neurons in Large Language Models.

[BibT_eX]

[DOI]

Sascha Rothe

François Yvon

CoRR, February, 2025

M-ABSA: A Multilingual Dataset for Aspect-Based Sentiment Analysis.

[BibT_eX]

[DOI]

CoRR, February, 2025

How Transliterations Improve Crosslingual Alignment.

[BibT_eX]

[DOI]

Mingyang Wang

Proceedings of the 31st International Conference on Computational Linguistics, 2025

TransMI: A Framework to Create Strong Baselines from Multilingual Pretrained Language Models for Transliterated Data.

[BibT_eX]

[DOI]

Proceedings of the 31st International Conference on Computational Linguistics, 2025

Understanding In-Context Machine Translation for Low-Resource Languages: A Case Study on Manchu.

[BibT_eX]

[DOI]

Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), 2025

How Programming Concepts and Neurons Are Shared in Code Language Models.

[BibT_eX]

[DOI]

François Yvon

Proceedings of the Findings of the Association for Computational Linguistics, 2025

Lost in Multilinguality: Dissecting Cross-lingual Factual Inconsistency in Transformer Language Models.

[BibT_eX]

[DOI]

Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), 2025

LangSAMP: Language-Script Aware Multilingual Pretraining.

[BibT_eX]

[DOI]

Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), 2025

2024

SYNTHEVAL: Hybrid Behavioral Testing of NLP Models with Synthetic CheckLists.

[BibT_eX]

[DOI]

CoRR, 2024

Exploring the Role of Transliteration in In-Context Learning for Low-resource Languages Written in Non-Latin Scripts.

[BibT_eX]

[DOI]

CoRR, 2024

MoSECroT: Model Stitching with Static Word Embeddings for Crosslingual Zero-shot Transfer.

[BibT_eX]

[DOI]

CoRR, 2024

OFA: A Framework of Initializing Unseen Subword Embeddings for Efficient Large-scale Multilingual Continued Pretraining.

[BibT_eX]

[DOI]

Proceedings of the Findings of the Association for Computational Linguistics: NAACL 2024, 2024

SynthEval: Hybrid Behavioral Testing of NLP Models with Synthetic Evaluation.

[BibT_eX]

[DOI]

Proceedings of the Findings of the Association for Computational Linguistics: EMNLP 2024, 2024

Breaking the Script Barrier in Multilingual Pre-Trained Language Models with Transliteration-Based Post-Training Alignment.

[BibT_eX]

[DOI]

Orgest Xhelili

Proceedings of the Findings of the Association for Computational Linguistics: EMNLP 2024, 2024

TransliCo: A Contrastive Learning Framework to Address the Script Barrier in Multilingual Pretrained Language Models.

[BibT_eX]

[DOI]

Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), 2024

2023

A study of conceptual language similarity: comparison and evaluation.

[BibT_eX]

[DOI]

Haotian Ye

CoRR, 2023

Crosslingual Transfer Learning for Low-Resource Languages Based on Multilingual Colexification Graphs.

[BibT_eX]

[DOI]

CoRR, 2023

On the Copying Problem of Unsupervised NMT: A Training Schedule with a Language Discriminator Loss.

[BibT_eX]

[DOI]

Alexandra Chronopoulou

Alexander Fraser

Proceedings of the 20th International Conference on Spoken Language Translation, 2023

Crosslingual Transfer Learning for Low-Resource Languages Based on Multilingual Colexification Graphs.

[BibT_eX]

[DOI]

Proceedings of the Findings of the Association for Computational Linguistics: EMNLP 2023, 2023

A Crosslingual Investigation of Conceptualization in 1335 Languages.

[BibT_eX]

[DOI]

Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), 2023

2022

Flow-Adapter Architecture for Unsupervised Machine Translation.

[BibT_eX]

[DOI]

Haris Jabbar