arnomatic
/

german-moe-gpt-v8-pretrained

Text Generation

mixture-of-experts

Mixture of Experts

Model card Files Files and versions

german-moe-gpt-v8-pretrained

608 MB

1 contributor

History: 12 commits

arnomatic's picture

Upload 2 files

3479481 verified 9 days ago

.gitattributes

1.52 kB

initial commit 17 days ago
README.md

7.42 kB

Upload README.md 9 days ago
config.json

764 Bytes

Upload 5 files 17 days ago
generation_config.json

73 Bytes

Upload 5 files 17 days ago
inference.py

6.89 kB

Upload 8 files 15 days ago
kaggle-finetune-moec2a1ae6508.ipynb

47.8 kB

Upload kaggle-finetune-moec2a1ae6508.ipynb 9 days ago
model.safetensors

598 MB
xet

Upload 5 files 17 days ago
moe_config.py

4.73 kB

Upload 8 files 15 days ago
moe_layers.py

11.8 kB

Upload 8 files 15 days ago
moe_model.py

15.8 kB

Upload 8 files 15 days ago
moe_trainer.py

5.88 kB

Upload 8 files 15 days ago
requirements.txt

2.99 kB

Upload 8 files 15 days ago
sample_generation_callback.py

4.94 kB

Upload 8 files 15 days ago
tokenizer.json

9.09 MB

Upload 2 files 9 days ago
tokenizer_config.json

50.5 kB

Upload 2 files 9 days ago
train_moe_v8_clean.py

15.6 kB

Upload 8 files 15 days ago
training_args.bin
Detected Pickle imports (10)
- "transformers.training_args.OptimizerNames",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "torch.device",
- "transformers.training_args.TrainingArguments",
- "accelerate.utils.dataclasses.DistributedType",
- "accelerate.state.PartialState",
- "transformers.trainer_utils.IntervalStrategy",
- "transformers.trainer_utils.SchedulerType",
- "transformers.trainer_utils.SaveStrategy",
- "transformers.trainer_utils.HubStrategy"
How to fix it?
5.37 kB
xet

Upload 5 files 17 days ago