ChayanM
/

ViT-RadBert_Mimic

@@ -15,12 +15,12 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [](https://huggingface.co/) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.0887
-- Rouge1: 32.8977
-- Rouge2: 21.8288
-- Rougel: 32.302
-- Rougelsum: 32.7773
-- Gen Len: 18.79
 ## Model description
@@ -40,27 +40,47 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 5e-05
-- train_batch_size: 8
-- eval_batch_size: 8
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- num_epochs: 10
 ### Training results
-| Training Loss | Epoch | Step | Validation Loss | Rouge1  | Rouge2  | Rougel  | Rougelsum | Gen Len |
-|:-------------:|:-----:|:----:|:---------------:|:-------:|:-------:|:-------:|:---------:|:-------:|
-| 0.2426        | 1.0   | 625  | 0.1040          | 27.5188 | 21.3864 | 27.3549 | 27.4573   | 19.258  |
-| 0.0954        | 2.0   | 1250 | 0.0891          | 19.0537 | 14.7729 | 18.9993 | 19.0513   | 19.666  |
-| 0.0809        | 3.0   | 1875 | 0.0857          | 28.2601 | 21.7315 | 28.0709 | 28.3266   | 19.416  |
-| 0.0679        | 4.0   | 2500 | 0.0858          | 30.8838 | 23.7439 | 30.6859 | 30.936    | 18.792  |
-| 0.0635        | 5.0   | 3125 | 0.0861          | 32.0132 | 23.2768 | 31.5703 | 31.8913   | 18.796  |
-| 0.0596        | 6.0   | 3750 | 0.0880          | 34.1984 | 23.726  | 33.7241 | 34.2367   | 18.59   |
-| 0.056         | 7.0   | 4375 | 0.0904          | 34.6439 | 23.7097 | 34.0416 | 34.5722   | 18.91   |
-| 0.0471        | 8.0   | 5000 | 0.0858          | 34.0822 | 22.9515 | 33.3727 | 33.8493   | 18.79   |
-| 0.0442        | 9.0   | 5625 | 0.0874          | 34.2676 | 23.6976 | 33.7124 | 34.2363   | 18.782  |
-| 0.0412        | 10.0  | 6250 | 0.0887          | 32.8977 | 21.8288 | 32.302  | 32.7773   | 18.79   |
 ### Framework versions

 This model is a fine-tuned version of [](https://huggingface.co/) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 24.4199
+- Rouge1: 0.0
+- Rouge2: 0.0
+- Rougel: 0.0
+- Rougelsum: 0.0
+- Gen Len: 20.0
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 5e-05
+- train_batch_size: 4
+- eval_batch_size: 4
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- num_epochs: 30
 ### Training results
+| Training Loss | Epoch | Step    | Validation Loss | Rouge1 | Rouge2 | Rougel | Rougelsum | Gen Len |
+|:-------------:|:-----:|:-------:|:---------------:|:------:|:------:|:------:|:---------:|:-------:|
+| 0.2872        | 1.0   | 48913   | 9.6292          | 0.0    | 0.0    | 0.0    | 0.0       | 20.0    |
+| 0.2786        | 2.0   | 97826   | 19.9417         | 0.0    | 0.0    | 0.0    | 0.0       | 20.0    |
+| 0.267         | 3.0   | 146739  | 20.0859         | 0.0    | 0.0    | 0.0    | 0.0       | 20.0    |
+| 0.2658        | 4.0   | 195652  | 21.5540         | 0.0    | 0.0    | 0.0    | 0.0       | 20.0    |
+| 0.2852        | 5.0   | 244565  | 23.4539         | 0.0    | 0.0    | 0.0    | 0.0       | 20.0    |
+| 0.2845        | 6.0   | 293478  | 22.8548         | 0.0    | 0.0    | 0.0    | 0.0       | 20.0    |
+| 0.2769        | 7.0   | 342391  | 24.3758         | 0.0    | 0.0    | 0.0    | 0.0       | 20.0    |
+| 0.2871        | 8.0   | 391304  | 24.4345         | 0.0    | 0.0    | 0.0    | 0.0       | 20.0    |
+| 0.2747        | 9.0   | 440217  | 20.6148         | 0.0    | 0.0    | 0.0    | 0.0       | 20.0    |
+| 0.2705        | 10.0  | 489130  | 21.4447         | 0.0    | 0.0    | 0.0    | 0.0       | 20.0    |
+| 0.2709        | 11.0  | 538043  | 24.5166         | 0.0    | 0.0    | 0.0    | 0.0       | 20.0    |
+| 0.2745        | 12.0  | 586956  | 25.3361         | 0.0    | 0.0    | 0.0    | 0.0       | 20.0    |
+| 0.2687        | 13.0  | 635869  | 27.1382         | 0.0    | 0.0    | 0.0    | 0.0       | 20.0    |
+| 0.2704        | 14.0  | 684782  | 24.3621         | 0.0    | 0.0    | 0.0    | 0.0       | 20.0    |
+| 0.2699        | 15.0  | 733695  | 25.0646         | 0.0    | 0.0    | 0.0    | 0.0       | 20.0    |
+| 0.2588        | 16.0  | 782608  | 25.5271         | 0.0    | 0.0    | 0.0    | 0.0       | 20.0    |
+| 0.2656        | 17.0  | 831521  | 25.8602         | 0.0    | 0.0    | 0.0    | 0.0       | 20.0    |
+| 0.2622        | 18.0  | 880434  | 27.6951         | 0.0    | 0.0    | 0.0    | 0.0       | 20.0    |
+| 0.2528        | 19.0  | 929347  | 25.5126         | 0.0    | 0.0    | 0.0    | 0.0       | 20.0    |
+| 0.2668        | 20.0  | 978260  | 27.6786         | 0.0    | 0.0    | 0.0    | 0.0       | 20.0    |
+| 0.2651        | 21.0  | 1027173 | 28.1278         | 0.0    | 0.0    | 0.0    | 0.0       | 20.0    |
+| 0.2535        | 22.0  | 1076086 | 27.4651         | 0.0    | 0.0    | 0.0    | 0.0       | 20.0    |
+| 0.256         | 23.0  | 1124999 | 25.5766         | 0.0    | 0.0    | 0.0    | 0.0       | 20.0    |
+| 0.2596        | 24.0  | 1173912 | 26.1662         | 0.0    | 0.0    | 0.0    | 0.0       | 20.0    |
+| 0.2415        | 25.0  | 1222825 | 25.7623         | 0.0    | 0.0    | 0.0    | 0.0       | 20.0    |
+| 0.2401        | 26.0  | 1271738 | 24.2354         | 0.0    | 0.0    | 0.0    | 0.0       | 20.0    |
+| 0.2588        | 27.0  | 1320651 | 23.6133         | 0.0    | 0.0    | 0.0    | 0.0       | 20.0    |
+| 0.2343        | 28.0  | 1369564 | 24.4396         | 0.0    | 0.0    | 0.0    | 0.0       | 20.0    |
+| 0.2545        | 29.0  | 1418477 | 24.1665         | 0.0    | 0.0    | 0.0    | 0.0       | 20.0    |
+| 0.2316        | 30.0  | 1467390 | 24.4199         | 0.0    | 0.0    | 0.0    | 0.0       | 20.0    |
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c4811cae012110a591b93dd16cc3a27f1d01aaeb60a91c6c67f59345d8df3903
 size 1834458276

 version https://git-lfs.github.com/spec/v1
+oid sha256:cd333b650df0abea8e89862c007d396d9a54ea9361ac931776d2f8f804f822a1
 size 1834458276