End of training

Browse files

Files changed (6) hide show

all_results.json +14 -0
eval_results.json +9 -0
runs/Oct10_19-39-15_patrick-general-gpu/events.out.tfevents.1633894776.patrick-general-gpu.131003.0 +2 -2
runs/Oct10_19-39-15_patrick-general-gpu/events.out.tfevents.1633898237.patrick-general-gpu.131003.2 +3 -0
train_results.json +8 -0
trainer_state.json +100 -0

all_results.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+    "epoch": 5.0,
+    "eval_loss": 0.6270990371704102,
+    "eval_matthews_correlation": 0.0,
+    "eval_runtime": 22.857,
+    "eval_samples": 1043,
+    "eval_samples_per_second": 45.632,
+    "eval_steps_per_second": 5.731,
+    "train_loss": 0.6198258174257484,
+    "train_runtime": 3421.027,
+    "train_samples": 8551,
+    "train_samples_per_second": 12.498,
+    "train_steps_per_second": 3.125
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+    "epoch": 5.0,
+    "eval_loss": 0.6270990371704102,
+    "eval_matthews_correlation": 0.0,
+    "eval_runtime": 22.857,
+    "eval_samples": 1043,
+    "eval_samples_per_second": 45.632,
+    "eval_steps_per_second": 5.731
+}

runs/Oct10_19-39-15_patrick-general-gpu/events.out.tfevents.1633894776.patrick-general-gpu.131003.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e870c53a39192fe597ddfa47d0499d84a2ccb3e51ef166b0514dd7695136894e
-size 5736

 version https://git-lfs.github.com/spec/v1
+oid sha256:2944637b02fd5f1a3070a8f61c5c5d7019813518166f6b50b5cf4995c6b3730a
+size 6090

runs/Oct10_19-39-15_patrick-general-gpu/events.out.tfevents.1633898237.patrick-general-gpu.131003.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2c025b4da530ba4d007fce768f280ee3dcaaafac988655977152f2153281b81e
+size 375

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 5.0,
+    "train_loss": 0.6198258174257484,
+    "train_runtime": 3421.027,
+    "train_samples": 8551,
+    "train_samples_per_second": 12.498,
+    "train_steps_per_second": 3.125
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,100 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 5.0,
+  "global_step": 10690,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "learning_rate": 3.5566666666666666e-05,
+      "loss": 0.6212,
+      "step": 2138
+    },
+    {
+      "epoch": 1.0,
+      "eval_loss": 0.6539720296859741,
+      "eval_matthews_correlation": 0.0,
+      "eval_runtime": 22.7284,
+      "eval_samples_per_second": 45.89,
+      "eval_steps_per_second": 5.764,
+      "step": 2138
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 2.6700000000000002e-05,
+      "loss": 0.62,
+      "step": 4276
+    },
+    {
+      "epoch": 2.0,
+      "eval_loss": 0.6409146785736084,
+      "eval_matthews_correlation": 0.0,
+      "eval_runtime": 22.7182,
+      "eval_samples_per_second": 45.91,
+      "eval_steps_per_second": 5.766,
+      "step": 4276
+    },
+    {
+      "epoch": 3.0,
+      "learning_rate": 1.783333333333333e-05,
+      "loss": 0.6182,
+      "step": 6414
+    },
+    {
+      "epoch": 3.0,
+      "eval_loss": 0.6234332919120789,
+      "eval_matthews_correlation": 0.0,
+      "eval_runtime": 22.7216,
+      "eval_samples_per_second": 45.904,
+      "eval_steps_per_second": 5.765,
+      "step": 6414
+    },
+    {
+      "epoch": 4.0,
+      "learning_rate": 8.966666666666667e-06,
+      "loss": 0.6181,
+      "step": 8552
+    },
+    {
+      "epoch": 4.0,
+      "eval_loss": 0.6234201192855835,
+      "eval_matthews_correlation": 0.0,
+      "eval_runtime": 22.7101,
+      "eval_samples_per_second": 45.927,
+      "eval_steps_per_second": 5.768,
+      "step": 8552
+    },
+    {
+      "epoch": 5.0,
+      "learning_rate": 1e-07,
+      "loss": 0.6217,
+      "step": 10690
+    },
+    {
+      "epoch": 5.0,
+      "eval_loss": 0.6270990371704102,
+      "eval_matthews_correlation": 0.0,
+      "eval_runtime": 22.7215,
+      "eval_samples_per_second": 45.904,
+      "eval_steps_per_second": 5.765,
+      "step": 10690
+    },
+    {
+      "epoch": 5.0,
+      "step": 10690,
+      "total_flos": 2.674821632676864e+16,
+      "train_loss": 0.6198258174257484,
+      "train_runtime": 3421.027,
+      "train_samples_per_second": 12.498,
+      "train_steps_per_second": 3.125
+    }
+  ],
+  "max_steps": 10690,
+  "num_train_epochs": 5,
+  "total_flos": 2.674821632676864e+16,
+  "trial_name": null,
+  "trial_params": null
+}