577 MB

1 contributor

History: 2 commits

bobox

KL divergence loss layers selfdistill....Multi step multi task training.

869170b verified over 1 year ago

1_Pooling
KL divergence loss layers selfdistill....Multi step multi task training. over 1 year ago
.gitattributes

1.52 kB

initial commit over 1 year ago
README.md

408 kB

KL divergence loss layers selfdistill....Multi step multi task training. over 1 year ago
added_tokens.json

23 Bytes

KL divergence loss layers selfdistill....Multi step multi task training. over 1 year ago
config.json

879 Bytes

KL divergence loss layers selfdistill....Multi step multi task training. over 1 year ago
config_sentence_transformers.json

195 Bytes

KL divergence loss layers selfdistill....Multi step multi task training. over 1 year ago
modules.json

229 Bytes

KL divergence loss layers selfdistill....Multi step multi task training. over 1 year ago
pytorch_model.bin
Detected Pickle imports (3)
- "torch._utils._rebuild_tensor_v2",
- "torch.FloatStorage",
- "collections.OrderedDict"
What is a pickle import?
565 MB
xet

KL divergence loss layers selfdistill....Multi step multi task training. over 1 year ago
sentence_bert_config.json

53 Bytes

KL divergence loss layers selfdistill....Multi step multi task training. over 1 year ago
special_tokens_map.json

970 Bytes

KL divergence loss layers selfdistill....Multi step multi task training. over 1 year ago
spm.model

2.46 MB
xet

KL divergence loss layers selfdistill....Multi step multi task training. over 1 year ago
tokenizer.json

8.65 MB

KL divergence loss layers selfdistill....Multi step multi task training. over 1 year ago
tokenizer_config.json

1.48 kB

KL divergence loss layers selfdistill....Multi step multi task training. over 1 year ago

Detected Pickle imports (3)