Research | Ziyang Luo

Selected Publications (* equal contribution)

2026

EvolProver: Advancing Automated Theorem Proving by Evolving Formalized Problems via Symmetry and Difficulty

ICLR 2026

Yuchen Tian, Ruiyuan Huang, Xuanwu Wang, Jing Ma, Zengfeng Huang, Ziyang Luo, Hongzhan Lin, Da Zheng, Lun Du

Paper

GTA1: GUI Test-time Scaling Agent

ICLR 2026

Yan Yang, Dongxu Li, Yutong Dai, Yuhao Yang, Ziyang Luo, Zirui Zhao, Zhiyuan Hu, JUNZHE HUANG, Amrita Saha, Zeyuan Chen, Ran Xu, Liyuan Pan, Caiming Xiong, Junnan Li

Paper

DiffCoT: Diffusion-styled Chain-of-Thought Reasoning in LLMs

ACL 2026

Shidong Cao, Hongzhan Lin, Yuxuan Gu, Ziyang Luo, Jing Ma

Paper

From Storage to Experience: A Survey on the Evolution of LLM Agent Memory Mechanisms

ACL 2026, ICLR 2026 Workshop MemAgents

Jinghao Luo, Yuchen Tian, Chuxue Cao, Ziyang Luo, Hongzhan Lin, Kaixin Li, Chuyi Kong, Ruichao Yang, Jing Ma

Paper

Dialectical Structured Reasoning for Explainable Multimodal Fake News Detection

ACL 2026

Ruichao Yang, Yufan Bian, Wei Gao, Bo-Wen Zhang, Jing Ma, Hongzhan Lin, Ziyang Luo, Xiaobin Zhu, Xu-Cheng Yin

Paper

2025

MemeArena: Automating Context-Aware Unbiased Evaluation of Harmfulness Understanding for Multimodal Large Language Models

EMNLP 2025

Zixin Chen, Hongzhan Lin, Kaixin Li, Ziyang Luo, Yayue Deng, Jing Ma

Paper

MM-CRITIC: A Holistic Evaluation of Large Multimodal Models as Multimodal Critique

EMNLP 2025

Gailun Zeng, Ziyang Luo, Hongzhan Lin, Yuchen Tian, Kaixin Li, Ziyang Gong, Jianxiong Guo, Jing Ma

Paper

Aria-UI: Visual Grounding for GUI Instructions

ACL 2025

Yuhao Yang, Yue Wang, Dongxu Li, Ziyang Luo, Bei Chen, Chao Huang, and Junnan Li

Paper

Tree-of-Evolution: Tree-Structured Instruction Evolution for Code Generation in Large Language Models

ACL 2025

Ziyang Luo, Kaixin Li, Hongzhan Lin, Yuchen Tian, Mohan Kankanhalli, and Jing Ma

Paper

AdamMeme: Adaptively Probe the Reasoning Capacity of Multimodal Large Language Models on Meme Harmfulness

ACL 2025

Zixin Chen, Hongzhan Lin, Kaixin Li, Ziyang Luo, Zhen Ye, Guang Chen, Zhiyong Huang, Jing Ma

Paper

SHARP: Unlocking Interactive Hallucination via Stance Transfer in Role-Playing Agents

ACL 2025

Chuyi Kong, Ziyang Luo, Hongzhan Lin, Zhiyuan Fan, Yaxin Fan, Yuxi SUN, Jing Ma

Paper

VideoAutoArena: An Automated Arena for Evaluating Large Multimodal Models in Video Analysis through User Simulation

CVPR 2025

Ziyang Luo, Haoning Wu, Dongxu Li, Jing Ma, Mohan Kankanhalli, and Junnan Li

Paper Project Page

ScreenSpot-Pro: GUI Grounding for Professional High-Resolution Computer Use

ACM Multimedia 2025

ICLR 2025 Workshop

Kaixin Li, Ziyang Meng, Hongzhan Lin, Ziyang Luo, Yuchen Tian, Jing Ma, Zhiyong Huang and Tat-Seng Chua

Paper Project Page

ScratchEval: Are GPT-4o Smarter than My Child? Evaluating Large Multimodal Models with Visual Programming Challenges

NAACL 2025

Rao Fu, Ziyang Luo, Hongzhan Lin, Zhen Ye, Jing Ma

Paper Code

CodeHalu: Code Hallucinations in LLMs Driven by Execution-based Verification

AAAI 2025

Yuchen Tian, Weixiang Yan, Qian Yang, Xuandong Zhao, Qian Chen, Wen Wang, Ziyang Luo, Lei Ma, Dawn Song

Paper Code

CodeJudge-Eval: Can Large Language Models be Good Judges in Code Understanding?

COLING 2025

Yuwei Zhao*, Ziyang Luo*, Yuchen Tian, Hongzhan Lin, Weixiang Yan, Annan Li, and Jing Ma

Paper Data

EXPLAINHM++: Explainable Harmful Meme Detection with Retrieval-Augmented Debate between Large Multimodal Models

The IEEE Transactions on Knowledge and Data Engineering (TKDE)

Hongzhan Lin, Wei Gao, Jing Ma, Yang Deng, Ziyang Luo, Bo Wang, Ruichao Yang, Tat-Seng Chua

Paper

GOAT-Bench: Safety Insights to Large Multimodal Models through Meme-Based Social Abuse

ACM Transactions on Intelligent Systems and Technology (TIST)

Hongzhan Lin*, Ziyang Luo*, Bo Wang, Ruichao Yang, and Jing Ma

Paper Data

RepreGuard: Detecting LLM-Generated Text by Revealing Hidden Representation Patterns

Transactions of the Association for Computational Linguistics (TACL)

Xin Chen, Junchao Wu, Shu Yang, Runzhe Zhan, Zeyu Wu, Ziyang Luo, Di Wang, Min Yang, Lidia S. Chao, Derek F. Wong

Paper

MFC-Bench: Benchmarking Multimodal Fact-Checking with Large Vision-Language Models

ICLR 2025 Workshop

Shengkang Wang*, Hongzhan Lin*, Ziyang Luo*, Zhen Ye, Guang Chen, and Jing Ma

Paper Data

2024

WizardCoder: Empowering Code Large Language Models with Evol-Instruct

ICLR 2024

Ziyang Luo, Can Xu, Pu Zhao, Qingfeng Sun, Xiubo Geng, Wenxiang Hu, Chongyang Tao, Jing Ma, Qingwei Lin, and Daxin Jiang

Paper Model

AMR-Evol: Adaptive Modular Response Evolution Elicits Better Knowledge Distillation for Large Language Models in Code Generation

EMNLP 2024

Ziyang Luo, Xin Li, Hongzhan Lin, Jing Ma, and Lidong Bing

Paper

Towards Low-Resource Harmful Meme Detection with LMM Agents

EMNLP 2024

Jianzhao Huang, Hongzhan Lin, Ziyan Liu, Ziyang Luo, Guang Chen, and Jing Ma

Paper

MMCode: Evaluating Multi-Modal Code Large Language Models with Visually Rich Programming Problems

EMNLP 2024

Kaixin Li, Yuchen Tian, Qisheng Hu, Ziyang Luo, and Jing Ma

Paper Data

CofiPara: A Coarse-to-fine Paradigm for Multimodal Sarcasm Target Identification with Large Multimodal Models

ACL 2024

Zixin Chen, Hongzhan Lin, Ziyang Luo, Mingfei Cheng, Jing Ma, and Guang Chen

Paper Code

Towards Explainable Harmful Meme Detection through Multimodal Debate between Large Language Models

WWW 2024

Hongzhan Lin, Ziyang Luo, Wei Gao, Jing Ma, Bo Wang, and Ruichao Yang

Paper Code

2023

LexLIP: Lexicon-Bottlenecked Language-Image Pre-Training for Large-Scale Image-Text Sparse Retrieval

ICCV 2023

Ziyang Luo, Pu Zhao, Can Xu, Xiubo Geng, Tao Shen, Chongyang Tao, Jing Ma, Qingwei Lin, and Daxin Jiang

Paper Code

Beneath the Surface: Unveiling Harmful Memes with Multimodal Reasoning Distilled from Large Language Models

EMNLP 2023

Hongzhan Lin*, Ziyang Luo*, Jing Ma, and Long Chen

Paper Code

Zero-Shot Rumor Detection with Propagation Structure via Prompt Learning

AAAI 2023

Hongzhan Lin, Pengyao Yi, Jing Ma, Haiyun Jiang, Ziyang Luo, Shuming Shi, Ruifang Liu

Paper

2022

A Coarse-to-fine Cascaded Evidence-Distillation Neural Network for Explainable Fake News Detection

COLING 2022

Zhiwei Yang, Jing Ma, Hechang Chen, Hongzhan Lin, Ziyang Luo, Yi Chang

Paper

Conditioned Masked Language and Image Modeling for Image-Text Dense Retrieval

EMNLP 2022

Ziyang Luo, Yadong Xi, Rongsheng Zhang, Gongzheng Li, Zeng Zhao, and Jing Ma

Paper

DecBERT: Enhancing the Language Understanding of BERT with Causal Attention Masks

NAACL 2022

Ziyang Luo, Yadong Xi, Jing Ma, Zhiwei Yang, Xiaoxi Mao, Changjie Fan, Rongsheng Zhang

Paper

Easy and Efficient Transformer: Scalable Inference Solution for Large NLP Model

NAACL 2022

Yadong Xi, Gongzheng Li, Jingzhen Ding, Duan Wang, Ziyang Luo, Rongsheng Zhang, Bai Liu, Changjie Fan, Xiaoxi Mao, Zeng Zhao

Paper

2021

Positional Artefacts Propagate Through Masked Language Model Embeddings

ACL 2021

Ziyang Luo, Artur Kulmizev, and Xiaoxi Mao

Paper

Smoothing with Fake Label

CIKM 2021

Ziyang Luo, Yadong Xi, and Xiaoxi Mao

Paper

Gender Bias Hidden Behind Chinese Word Embeddings: The Case of Chinese Adjectives

GeBNLP 2021

Meichun Jiao, Ziyang Luo

Paper

Have Attention Heads in BERT Learned Constituency Grammar?

EACL 2021 SRW

Ziyang Luo

Paper

Selected Open-Source Projects

VideoLLaMA 2: Advancing Spatial-Temporal Modeling and Audio Understanding in Video-LLMs

VideoLLaMA Team@Alibaba

Paper Code

WizardCoder: Empowering Code Large Language Models with Evol-Instruct

WizardLM Team@Microsoft

Paper Code

AURORA-M: The First Open Source Multilingual Language Model Red-teamed according to the U.S. Executive Order

Aurora-M Open-Source Community

Paper Models

Master Thesis

Analyzing the Anisotropy Phenomenon in Transformer-based Masked Language Models

Supervised by Artur Kulmizev, Uppsala University, 2021

Thesis