Xiang Dai

Orcid: 0000-0002-6020-9688

Affiliations:

Commonwealth Scientific and Industrial Research Organisation (CSIRO), Data61, Sydney, Australia
University of Sydney, School of Computer Science, Sydney, Australia (PhD 2021)

According to our database¹, Xiang Dai authored at least 30 papers between 2017 and 2025.

Collaborative distances:

Dijkstra number² of five.
Erdős number³ of four.

Timeline

Legend:

Book

In proceedings

Article

PhD thesis

Dataset

Other

Bibliography

2025

Proceedings of the First Workshop of Evaluation of Multi-Modal Generation.

[BibT_eX]

[DOI]

Proceedings of the 31st International Conference on Computational Linguistics, 2025

Can VLMs Actually See and Read? A Survey on Modality Collapse in Vision-Language Models.

[BibT_eX]

[DOI]

Proceedings of the Findings of the Association for Computational Linguistics, 2025

2024

MultiADE: A Multi-domain benchmark for Adverse Drug Event extraction.

[BibT_eX]

[DOI]

J. Biomed. Informatics, 2024

An adaptive approach to noisy annotations in scientific information extraction.

[BibT_eX]

[DOI]

Inf. Process. Manag., 2024

Can AI Extract Antecedent Factors of Human Trust in AI? An Application of Information Extraction for Scientific Literature in Behavioural and Computer Sciences.

[BibT_eX]

[DOI]

CoRR, 2024

Identifying Health Risks from Family History: A Survey of Natural Language Processing Techniques.

[BibT_eX]

[DOI]

Xiang Dai

Sarvnaz Karimi

Nathan O'Callaghan

CoRR, 2024

Understanding Faithfulness and Reasoning of Large Language Models on Plain Biomedical Summaries.

[BibT_eX]

[DOI]

Biaoyan Fang

Xiang Dai

Sarvnaz Karimi

Proceedings of the Findings of the Association for Computational Linguistics: EMNLP 2024, 2024

A Critical Look at Meta-evaluating Summarisation Evaluation Metrics.

[BibT_eX]

[DOI]

Xiang Dai

Sarvnaz Karimi

Biaoyan Fang

Proceedings of the Findings of the Association for Computational Linguistics: EMNLP 2024, 2024

Born Differently Makes a Difference: Counterfactual Study of Bias in Biography Generation from a Data-to-Text Perspective.

[BibT_eX]

[DOI]

Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics, 2024

2023

Clinician-Facing AI in the Wild: Taking Stock of the Sociotechnical Challenges and Opportunities for HCI.

[BibT_eX]

[DOI]

Hubert Dariusz Zajac

Dana Li

Xiang Dai

Jonathan Frederik Carlsen

Finn Kensing

Tariq O. Andersen

ACM Trans. Comput. Hum. Interact., April, 2023

Rethinking the Role of Entity Type in Relation Classification.

[BibT_eX]

[DOI]

Xiang Dai

Sarvnaz Karimi

Stephen Wan

Proceedings of the 13th International Joint Conference on Natural Language Processing and the 3rd Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics, 2023

MultiFin: A Dataset for Multilingual Financial NLP.

[BibT_eX]

[DOI]

Proceedings of the Findings of the Association for Computational Linguistics: EACL 2023, 2023

Can Social Media Inform Dietary Approaches for Health Management? A Dataset and Benchmark for Low-Carb Diet.

[BibT_eX]

[DOI]

Proceedings of the 22nd Workshop on Biomedical Natural Language Processing and BioNLP Shared Tasks, 2023

CSIRO Data61 Team at BioLaySumm Task 1: Lay Summarisation of Biomedical Research Articles Using Generative Models.

[BibT_eX]

[DOI]

Proceedings of the 22nd Workshop on Biomedical Natural Language Processing and BioNLP Shared Tasks, 2023

2022

Detecting Entities in the Astrophysics Literature: A Comparison of Word-based and Span-based Entity Recognition Methods.

[BibT_eX]

[DOI]

Xiang Dai

Sarvnaz Karimi

CoRR, 2022

An Exploration of Hierarchical Attention Transformers for Efficient Long Document Classification.

[BibT_eX]

[DOI]

Ilias Chalkidis

Xiang Dai

Manos Fergadiotis

Prodromos Malakasiotis

Desmond Elliott

CoRR, 2022

Revisiting Transformer-based Models for Long Document Classification.

[BibT_eX]

[DOI]

Proceedings of the Findings of the Association for Computational Linguistics: EMNLP 2022, 2022

2021

Recognising Biomedical Names: Challenges and Solutions.

[BibT_eX]

[DOI]

Xiang Dai

CoRR, 2021

mDAPT: Multilingual Domain Adaptive Pretraining in a Single Model.

[BibT_eX]

[DOI]

Proceedings of the Findings of the Association for Computational Linguistics: EMNLP 2021, 2021

SearchEHR: A Family History Search System for Clinical Decision Support.

[BibT_eX]

[DOI]

Xiang Dai

Maciej Rybinski

Sarvnaz Karimi

Proceedings of the CIKM '21: The 30th ACM International Conference on Information and Knowledge Management, Virtual Event, Queensland, Australia, November 1, 2021

2020

NLNDE at CANTEMIST: Neural Sequence Labeling and Parsing Approaches for Clinical Concept Extraction.

[BibT_eX]

[DOI]

Proceedings of the Iberian Languages Evaluation Forum (IberLEF 2020) co-located with 36th Conference of the Spanish Society for Natural Language Processing (SEPLN 2020), 2020

Cost-effective Selection of Pretraining Data: A Case Study of Pretraining BERT on Social Media.

[BibT_eX]

[DOI]

Proceedings of the Findings of the Association for Computational Linguistics: EMNLP 2020, 2020

An Analysis of Simple Data Augmentation for Named Entity Recognition.

[BibT_eX]

[DOI]

Xiang Dai