Qwen2.5-7B-SimpleTIR / README.md

ZhenghaiXue

Create README.md

fbe635a verified 4 months ago

preview code

raw

history blame contribute delete

211 Bytes

metadata

license: apache-2.0
datasets:
  - hkust-nlp/SimpleRL-Zoo-Data
  - agentica-org/DeepScaleR-Preview-Dataset
language:
  - en
metrics:
  - accuracy
base_model:
  - Qwen/Qwen2.5-7B
pipeline_tag: reinforcement-learning