allenai
/

OLMo-Ladder-760M-0.5xC

amanrangapur commited on Apr 29

Commit

c8f6875

verified ·

1 Parent(s): c7b618c

Update model architecture to Olmo2

Files changed (1) hide show

config.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "architectures": [
-    "Olmo1124ForCausalLM"
   ],
   "attention_bias": false,
   "attention_dropout": 0.0,
@@ -10,7 +10,7 @@
   "initializer_range": 0.02,
   "intermediate_size": 6144,
   "max_position_embeddings": 4096,
-  "model_type": "olmo_1124",
   "num_attention_heads": 16,
   "num_hidden_layers": 16,
   "num_key_value_heads": 16,
@@ -23,4 +23,4 @@
   "transformers_version": "4.47.0.dev0",
   "use_cache": true,
   "vocab_size": 100352
-}

 {
   "architectures": [
+    "Olmo2ForCausalLM"
   ],
   "attention_bias": false,
   "attention_dropout": 0.0,
   "initializer_range": 0.02,
   "intermediate_size": 6144,
   "max_position_embeddings": 4096,
+  "model_type": "olmo2",
   "num_attention_heads": 16,
   "num_hidden_layers": 16,
   "num_key_value_heads": 16,
   "transformers_version": "4.47.0.dev0",
   "use_cache": true,
   "vocab_size": 100352
+}