pszemraj
/

griffin-v0.01-c3t-8layer-simplewiki-silu

Text Generation

recurrent_gemma

Generated from Trainer

Model card Files Files and versions

pszemraj commited on Apr 25, 2024

Commit

68b4958

·

verified ·

1 Parent(s): cf208af

Update README.md

Files changed (1) hide show

README.md +13 -18

README.md CHANGED Viewed

@@ -1,35 +1,30 @@
 ---
-base_model: silu-griffin-1024-c3t-8layer
 tags:
 - generated_from_trainer
 metrics:
 - accuracy
-model-index:
-- name: silu-griffin-1024-c3t-8layer-simple_wikipedia_LM-vN
-  results: []
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 should probably proofread and complete it, then remove this comment. -->
-# silu-griffin-1024-c3t-8layer-simple_wikipedia_LM-vN
-This model is a fine-tuned version of [silu-griffin-1024-c3t-8layer](https://huggingface.co/silu-griffin-1024-c3t-8layer) on the pszemraj/simple_wikipedia_LM dataset.
-It achieves the following results on the evaluation set:
-- Loss: 4.0476
-- Accuracy: 0.4224
 ## Model description
-More information needed
-## Intended uses & limitations
-More information needed
-## Training and evaluation data
-More information needed
 ## Training procedure
@@ -65,4 +60,4 @@ The following hyperparameters were used during training:
 - Transformers 4.40.1
 - Pytorch 2.2.0+cu121
 - Datasets 2.19.0
-- Tokenizers 0.19.1

 ---
 tags:
 - generated_from_trainer
 metrics:
 - accuracy
+license: apache-2.0
+datasets:
+- pszemraj/simple_wikipedia_LM
+language:
+- en
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 should probably proofread and complete it, then remove this comment. -->
+# griffin-v0.01-c3t-8layer-simplewiki-silu
+- griffin/recurrent_gemma arch
+- claude3 tokenizer (as an HF gpt2 tokenizer)
 ## Model description
+pretrain experiment on the pszemraj/simple_wikipedia_LM dataset.
+It achieves the following results on the evaluation set:
+- Loss: 4.0476
+- Accuracy: 0.4224
 ## Training procedure
 - Transformers 4.40.1
 - Pytorch 2.2.0+cu121
 - Datasets 2.19.0
+- Tokenizers 0.19.1