yehiawp4
/

videomae-base-finetuned-kinetics-finetuned-my-dataset-4-epochs

+{
+    "epoch": 3.24,
+    "eval_accuracy": 0.9583333333333334,
+    "eval_loss": 0.15978051722049713,
+    "eval_runtime": 59.6275,
+    "eval_samples_per_second": 1.61,
+    "eval_steps_per_second": 0.268
+}

test_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 3.24,
+    "eval_accuracy": 0.9583333333333334,
+    "eval_loss": 0.15978051722049713,
+    "eval_runtime": 59.6275,
+    "eval_samples_per_second": 1.61,
+    "eval_steps_per_second": 0.268
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,483 @@

+{
+  "best_metric": 0.9473684210526315,
+  "best_model_checkpoint": "videomae-base-finetuned-kinetics-finetuned-my-dataset-4-epochs\\checkpoint-572",
+  "epoch": 3.2447552447552446,
+  "eval_steps": 500,
+  "global_step": 572,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.02,
+      "grad_norm": 6.4546613693237305,
+      "learning_rate": 8.620689655172414e-06,
+      "loss": 1.661,
+      "step": 10
+    },
+    {
+      "epoch": 0.03,
+      "grad_norm": 5.571170330047607,
+      "learning_rate": 1.7241379310344828e-05,
+      "loss": 1.6084,
+      "step": 20
+    },
+    {
+      "epoch": 0.05,
+      "grad_norm": 6.379495143890381,
+      "learning_rate": 2.5862068965517244e-05,
+      "loss": 1.5554,
+      "step": 30
+    },
+    {
+      "epoch": 0.07,
+      "grad_norm": 5.455715656280518,
+      "learning_rate": 3.4482758620689657e-05,
+      "loss": 1.4752,
+      "step": 40
+    },
+    {
+      "epoch": 0.09,
+      "grad_norm": 8.574926376342773,
+      "learning_rate": 4.3103448275862066e-05,
+      "loss": 1.4367,
+      "step": 50
+    },
+    {
+      "epoch": 0.1,
+      "grad_norm": 7.630256652832031,
+      "learning_rate": 4.980544747081712e-05,
+      "loss": 1.2503,
+      "step": 60
+    },
+    {
+      "epoch": 0.12,
+      "grad_norm": 13.884824752807617,
+      "learning_rate": 4.883268482490273e-05,
+      "loss": 1.1133,
+      "step": 70
+    },
+    {
+      "epoch": 0.14,
+      "grad_norm": 11.933884620666504,
+      "learning_rate": 4.7859922178988334e-05,
+      "loss": 1.0921,
+      "step": 80
+    },
+    {
+      "epoch": 0.16,
+      "grad_norm": 11.359259605407715,
+      "learning_rate": 4.688715953307393e-05,
+      "loss": 0.7924,
+      "step": 90
+    },
+    {
+      "epoch": 0.17,
+      "grad_norm": 12.164495468139648,
+      "learning_rate": 4.591439688715953e-05,
+      "loss": 0.8217,
+      "step": 100
+    },
+    {
+      "epoch": 0.19,
+      "grad_norm": 4.461577415466309,
+      "learning_rate": 4.494163424124514e-05,
+      "loss": 0.4345,
+      "step": 110
+    },
+    {
+      "epoch": 0.21,
+      "grad_norm": 14.569128036499023,
+      "learning_rate": 4.396887159533074e-05,
+      "loss": 0.5056,
+      "step": 120
+    },
+    {
+      "epoch": 0.23,
+      "grad_norm": 12.43501091003418,
+      "learning_rate": 4.299610894941635e-05,
+      "loss": 0.4189,
+      "step": 130
+    },
+    {
+      "epoch": 0.24,
+      "grad_norm": 17.019834518432617,
+      "learning_rate": 4.202334630350195e-05,
+      "loss": 0.4072,
+      "step": 140
+    },
+    {
+      "epoch": 0.25,
+      "eval_accuracy": 0.7473684210526316,
+      "eval_loss": 0.6893969178199768,
+      "eval_runtime": 117.3206,
+      "eval_samples_per_second": 1.619,
+      "eval_steps_per_second": 0.273,
+      "step": 144
+    },
+    {
+      "epoch": 1.01,
+      "grad_norm": 4.544285774230957,
+      "learning_rate": 4.105058365758755e-05,
+      "loss": 0.425,
+      "step": 150
+    },
+    {
+      "epoch": 1.03,
+      "grad_norm": 4.996816635131836,
+      "learning_rate": 4.007782101167315e-05,
+      "loss": 0.2163,
+      "step": 160
+    },
+    {
+      "epoch": 1.05,
+      "grad_norm": 8.629969596862793,
+      "learning_rate": 3.910505836575876e-05,
+      "loss": 0.3379,
+      "step": 170
+    },
+    {
+      "epoch": 1.06,
+      "grad_norm": 11.086934089660645,
+      "learning_rate": 3.813229571984436e-05,
+      "loss": 0.1983,
+      "step": 180
+    },
+    {
+      "epoch": 1.08,
+      "grad_norm": 17.69314193725586,
+      "learning_rate": 3.715953307392996e-05,
+      "loss": 0.3418,
+      "step": 190
+    },
+    {
+      "epoch": 1.1,
+      "grad_norm": 3.8406598567962646,
+      "learning_rate": 3.618677042801556e-05,
+      "loss": 0.1979,
+      "step": 200
+    },
+    {
+      "epoch": 1.12,
+      "grad_norm": 8.322322845458984,
+      "learning_rate": 3.5214007782101175e-05,
+      "loss": 0.522,
+      "step": 210
+    },
+    {
+      "epoch": 1.13,
+      "grad_norm": 26.0389461517334,
+      "learning_rate": 3.4241245136186774e-05,
+      "loss": 0.2249,
+      "step": 220
+    },
+    {
+      "epoch": 1.15,
+      "grad_norm": 14.741497039794922,
+      "learning_rate": 3.326848249027237e-05,
+      "loss": 0.2022,
+      "step": 230
+    },
+    {
+      "epoch": 1.17,
+      "grad_norm": 25.44049072265625,
+      "learning_rate": 3.229571984435798e-05,
+      "loss": 0.3132,
+      "step": 240
+    },
+    {
+      "epoch": 1.19,
+      "grad_norm": 6.259922981262207,
+      "learning_rate": 3.1322957198443584e-05,
+      "loss": 0.308,
+      "step": 250
+    },
+    {
+      "epoch": 1.2,
+      "grad_norm": 3.718748092651367,
+      "learning_rate": 3.0350194552529183e-05,
+      "loss": 0.1048,
+      "step": 260
+    },
+    {
+      "epoch": 1.22,
+      "grad_norm": 9.242581367492676,
+      "learning_rate": 2.937743190661479e-05,
+      "loss": 0.1878,
+      "step": 270
+    },
+    {
+      "epoch": 1.24,
+      "grad_norm": 0.549322783946991,
+      "learning_rate": 2.8404669260700388e-05,
+      "loss": 0.1778,
+      "step": 280
+    },
+    {
+      "epoch": 1.25,
+      "eval_accuracy": 0.9105263157894737,
+      "eval_loss": 0.2762860655784607,
+      "eval_runtime": 120.6902,
+      "eval_samples_per_second": 1.574,
+      "eval_steps_per_second": 0.265,
+      "step": 288
+    },
+    {
+      "epoch": 2.0,
+      "grad_norm": 0.7821664810180664,
+      "learning_rate": 2.7431906614785997e-05,
+      "loss": 0.2725,
+      "step": 290
+    },
+    {
+      "epoch": 2.02,
+      "grad_norm": 3.510664939880371,
+      "learning_rate": 2.6459143968871596e-05,
+      "loss": 0.0888,
+      "step": 300
+    },
+    {
+      "epoch": 2.04,
+      "grad_norm": 0.5098416805267334,
+      "learning_rate": 2.54863813229572e-05,
+      "loss": 0.0764,
+      "step": 310
+    },
+    {
+      "epoch": 2.06,
+      "grad_norm": 1.5534539222717285,
+      "learning_rate": 2.45136186770428e-05,
+      "loss": 0.0346,
+      "step": 320
+    },
+    {
+      "epoch": 2.07,
+      "grad_norm": 6.638437271118164,
+      "learning_rate": 2.3540856031128406e-05,
+      "loss": 0.0397,
+      "step": 330
+    },
+    {
+      "epoch": 2.09,
+      "grad_norm": 35.592262268066406,
+      "learning_rate": 2.256809338521401e-05,
+      "loss": 0.2642,
+      "step": 340
+    },
+    {
+      "epoch": 2.11,
+      "grad_norm": 0.5243805050849915,
+      "learning_rate": 2.1595330739299615e-05,
+      "loss": 0.1475,
+      "step": 350
+    },
+    {
+      "epoch": 2.13,
+      "grad_norm": 16.06882095336914,
+      "learning_rate": 2.0622568093385214e-05,
+      "loss": 0.0525,
+      "step": 360
+    },
+    {
+      "epoch": 2.14,
+      "grad_norm": 21.048095703125,
+      "learning_rate": 1.964980544747082e-05,
+      "loss": 0.0923,
+      "step": 370
+    },
+    {
+      "epoch": 2.16,
+      "grad_norm": 0.9029656648635864,
+      "learning_rate": 1.867704280155642e-05,
+      "loss": 0.1186,
+      "step": 380
+    },
+    {
+      "epoch": 2.18,
+      "grad_norm": 19.88978385925293,
+      "learning_rate": 1.7704280155642024e-05,
+      "loss": 0.068,
+      "step": 390
+    },
+    {
+      "epoch": 2.2,
+      "grad_norm": 1.3962284326553345,
+      "learning_rate": 1.6731517509727626e-05,
+      "loss": 0.0854,
+      "step": 400
+    },
+    {
+      "epoch": 2.21,
+      "grad_norm": 8.434904098510742,
+      "learning_rate": 1.575875486381323e-05,
+      "loss": 0.0269,
+      "step": 410
+    },
+    {
+      "epoch": 2.23,
+      "grad_norm": 0.28366413712501526,
+      "learning_rate": 1.4785992217898833e-05,
+      "loss": 0.1492,
+      "step": 420
+    },
+    {
+      "epoch": 2.25,
+      "grad_norm": 9.057991027832031,
+      "learning_rate": 1.3813229571984437e-05,
+      "loss": 0.1602,
+      "step": 430
+    },
+    {
+      "epoch": 2.25,
+      "eval_accuracy": 0.8947368421052632,
+      "eval_loss": 0.2830742597579956,
+      "eval_runtime": 127.7774,
+      "eval_samples_per_second": 1.487,
+      "eval_steps_per_second": 0.25,
+      "step": 432
+    },
+    {
+      "epoch": 3.01,
+      "grad_norm": 0.4281996190547943,
+      "learning_rate": 1.2840466926070038e-05,
+      "loss": 0.0725,
+      "step": 440
+    },
+    {
+      "epoch": 3.03,
+      "grad_norm": 0.3639540374279022,
+      "learning_rate": 1.1867704280155642e-05,
+      "loss": 0.0253,
+      "step": 450
+    },
+    {
+      "epoch": 3.05,
+      "grad_norm": 0.6328150629997253,
+      "learning_rate": 1.0894941634241246e-05,
+      "loss": 0.0083,
+      "step": 460
+    },
+    {
+      "epoch": 3.07,
+      "grad_norm": 0.0523068867623806,
+      "learning_rate": 9.922178988326848e-06,
+      "loss": 0.0335,
+      "step": 470
+    },
+    {
+      "epoch": 3.08,
+      "grad_norm": 0.029841965064406395,
+      "learning_rate": 8.949416342412452e-06,
+      "loss": 0.0033,
+      "step": 480
+    },
+    {
+      "epoch": 3.1,
+      "grad_norm": 0.06523406505584717,
+      "learning_rate": 7.976653696498054e-06,
+      "loss": 0.0622,
+      "step": 490
+    },
+    {
+      "epoch": 3.12,
+      "grad_norm": 6.156842231750488,
+      "learning_rate": 7.003891050583658e-06,
+      "loss": 0.0621,
+      "step": 500
+    },
+    {
+      "epoch": 3.14,
+      "grad_norm": 0.4030187129974365,
+      "learning_rate": 6.031128404669261e-06,
+      "loss": 0.0478,
+      "step": 510
+    },
+    {
+      "epoch": 3.15,
+      "grad_norm": 7.486963748931885,
+      "learning_rate": 5.058365758754864e-06,
+      "loss": 0.0057,
+      "step": 520
+    },
+    {
+      "epoch": 3.17,
+      "grad_norm": 21.099483489990234,
+      "learning_rate": 4.085603112840467e-06,
+      "loss": 0.0575,
+      "step": 530
+    },
+    {
+      "epoch": 3.19,
+      "grad_norm": 0.5362010598182678,
+      "learning_rate": 3.11284046692607e-06,
+      "loss": 0.1306,
+      "step": 540
+    },
+    {
+      "epoch": 3.21,
+      "grad_norm": 2.0333070755004883,
+      "learning_rate": 2.1400778210116734e-06,
+      "loss": 0.0212,
+      "step": 550
+    },
+    {
+      "epoch": 3.22,
+      "grad_norm": 0.11834029853343964,
+      "learning_rate": 1.1673151750972764e-06,
+      "loss": 0.0824,
+      "step": 560
+    },
+    {
+      "epoch": 3.24,
+      "grad_norm": 0.06718810647726059,
+      "learning_rate": 1.9455252918287938e-07,
+      "loss": 0.0134,
+      "step": 570
+    },
+    {
+      "epoch": 3.24,
+      "eval_accuracy": 0.9473684210526315,
+      "eval_loss": 0.18670256435871124,
+      "eval_runtime": 127.8371,
+      "eval_samples_per_second": 1.486,
+      "eval_steps_per_second": 0.25,
+      "step": 572
+    },
+    {
+      "epoch": 3.24,
+      "step": 572,
+      "total_flos": 4.2579166172730163e+18,
+      "train_loss": 0.3607311663168997,
+      "train_runtime": 3239.8454,
+      "train_samples_per_second": 1.059,
+      "train_steps_per_second": 0.177
+    },
+    {
+      "epoch": 3.24,
+      "eval_accuracy": 0.9583333333333334,
+      "eval_loss": 0.15978054702281952,
+      "eval_runtime": 64.9438,
+      "eval_samples_per_second": 1.478,
+      "eval_steps_per_second": 0.246,
+      "step": 572
+    },
+    {
+      "epoch": 3.24,
+      "eval_accuracy": 0.9583333333333334,
+      "eval_loss": 0.15978051722049713,
+      "eval_runtime": 59.6275,
+      "eval_samples_per_second": 1.61,
+      "eval_steps_per_second": 0.268,
+      "step": 572
+    }
+  ],
+  "logging_steps": 10,
+  "max_steps": 572,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 9223372036854775807,
+  "save_steps": 500,
+  "total_flos": 4.2579166172730163e+18,
+  "train_batch_size": 6,
+  "trial_name": null,
+  "trial_params": null
+}