Wenxiao Wang's picture

2 3 3

Wenxiao Wang

wangwenxiao

·

https://wangwenxiao.github.io

AI & ML interests

None yet

Organizations

None yet

upvoted 2 papers 5 months ago

DyePack: Provably Flagging Test Set Contamination in LLMs Using Backdoors

Paper • 2505.23001 • Published May 29 • 8

Gaming Tool Preferences in Agentic LLMs

Paper • 2505.18135 • Published May 23 • 8

upvoted a paper 6 months ago

Chain-of-Defensive-Thought: Structured Reasoning Elicits Robustness in Large Language Models against Reference Corruption

Paper • 2504.20769 • Published Apr 29 • 3