lidaiqiang
/

Qwen2-0.5B-GKD-math

Generated from Trainer

Model card Files Files and versions

Metrics Training metrics Community

Qwen2-0.5B-GKD-math

18.1 MB

1 contributor

History: 6 commits

lidaiqiang's picture

Training in progress, step 227

934f89a verified 13 days ago

runs
Training in progress, step 227 13 days ago
.gitattributes

1.57 kB

Training in progress, step 50 13 days ago
README.md

2.21 kB

Training in progress, step 50 13 days ago
adapter_config.json

857 Bytes

Training in progress, step 50 13 days ago
adapter_model.safetensors

2.18 MB
xet

Training in progress, step 227 13 days ago
added_tokens.json

80 Bytes

Training in progress, step 50 13 days ago
chat_template.jinja

328 Bytes

Training in progress, step 50 13 days ago
merges.txt

1.67 MB

Training in progress, step 50 13 days ago
special_tokens_map.json

367 Bytes

Training in progress, step 50 13 days ago
tokenizer.json

11.4 MB
xet

Training in progress, step 150 13 days ago
tokenizer_config.json

973 Bytes

Training in progress, step 50 13 days ago
training_args.bin
Detected Pickle imports (10)
- "trl.trainer.gkd_config.GKDConfig",
- "transformers.trainer_utils.SaveStrategy",
- "torch.device",
- "accelerate.state.PartialState",
- "accelerate.utils.dataclasses.DistributedType",
- "transformers.trainer_utils.SchedulerType",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "transformers.trainer_utils.HubStrategy",
- "transformers.training_args.OptimizerNames",
- "transformers.trainer_utils.IntervalStrategy"
How to fix it?
6.55 kB
xet

Training in progress, step 50 13 days ago
vocab.json

2.78 MB

Training in progress, step 50 13 days ago