End of training

Browse files

Files changed (6) hide show

README.md +25 -25
config.json +1 -1
model.safetensors +1 -1
runs/Feb07_13-11-54_32d4dd9baa07/events.out.tfevents.1738933920.32d4dd9baa07.2176.10 +3 -0
runs/Feb07_13-11-54_32d4dd9baa07/events.out.tfevents.1738934452.32d4dd9baa07.2176.11 +3 -0
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -20,11 +20,11 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [MiMe-MeMo/MeMo-BERT-03](https://huggingface.co/MiMe-MeMo/MeMo-BERT-03) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Accuracy: 0.6792
-- Precision: 0.6765
-- Recall: 0.6792
-- F1: 0.6746
-- Loss: 0.7595
 ## Model description
@@ -58,29 +58,29 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Accuracy | Precision | Recall | F1     | Validation Loss |
 |:-------------:|:-----:|:----:|:--------:|:---------:|:------:|:------:|:---------------:|
-| No log        | 1.0   | 13   | 0.5338   | 0.4780    | 0.5338 | 0.3897 | 0.9820          |
-| No log        | 2.0   | 26   | 0.3960   | 0.1568    | 0.3960 | 0.2246 | 1.0372          |
-| No log        | 3.0   | 39   | 0.5620   | 0.5455    | 0.5620 | 0.4488 | 0.8622          |
-| No log        | 4.0   | 52   | 0.4484   | 0.7058    | 0.4484 | 0.3114 | 0.9687          |
-| No log        | 5.0   | 65   | 0.5407   | 0.6971    | 0.5407 | 0.4809 | 0.9041          |
-| No log        | 6.0   | 78   | 0.5509   | 0.7154    | 0.5509 | 0.4959 | 0.9406          |
-| No log        | 7.0   | 91   | 0.6102   | 0.7030    | 0.6102 | 0.5844 | 0.8172          |
-| No log        | 8.0   | 104  | 0.6456   | 0.6834    | 0.6456 | 0.5938 | 0.8220          |
-| No log        | 9.0   | 117  | 0.6879   | 0.6838    | 0.6879 | 0.6820 | 0.6951          |
-| No log        | 10.0  | 130  | 0.5891   | 0.7194    | 0.5891 | 0.5533 | 1.1123          |
-| No log        | 11.0  | 143  | 0.6290   | 0.7002    | 0.6290 | 0.6121 | 0.8014          |
-| No log        | 12.0  | 156  | 0.6856   | 0.6800    | 0.6856 | 0.6798 | 0.7288          |
-| No log        | 13.0  | 169  | 0.6861   | 0.6773    | 0.6861 | 0.6812 | 0.7181          |
-| No log        | 14.0  | 182  | 0.6808   | 0.6740    | 0.6808 | 0.6757 | 0.7335          |
-| No log        | 15.0  | 195  | 0.6749   | 0.6819    | 0.6749 | 0.6693 | 0.7542          |
-| No log        | 16.0  | 208  | 0.6795   | 0.6774    | 0.6795 | 0.6746 | 0.7692          |
-| No log        | 17.0  | 221  | 0.6590   | 0.6808    | 0.6590 | 0.6524 | 0.8030          |
-| No log        | 18.0  | 234  | 0.6863   | 0.6770    | 0.6863 | 0.6810 | 0.7495          |
-| No log        | 18.48 | 240  | 0.6792   | 0.6765    | 0.6792 | 0.6746 | 0.7595          |
 ### Framework versions
-- Transformers 4.47.1
 - Pytorch 2.5.1+cu124
 - Tokenizers 0.21.0

 This model is a fine-tuned version of [MiMe-MeMo/MeMo-BERT-03](https://huggingface.co/MiMe-MeMo/MeMo-BERT-03) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Accuracy: 0.6579
+- Precision: 0.6594
+- Recall: 0.6579
+- F1: 0.6534
+- Loss: 0.8215
 ## Model description
 | Training Loss | Epoch | Step | Accuracy | Precision | Recall | F1     | Validation Loss |
 |:-------------:|:-----:|:----:|:--------:|:---------:|:------:|:------:|:---------------:|
+| No log        | 1.0   | 13   | 0.5463   | 0.5179    | 0.5463 | 0.4339 | 1.0286          |
+| No log        | 2.0   | 26   | 0.4100   | 0.1876    | 0.4100 | 0.2461 | 1.0251          |
+| No log        | 3.0   | 39   | 0.5086   | 0.6698    | 0.5086 | 0.4356 | 0.8710          |
+| No log        | 4.0   | 52   | 0.4802   | 0.6966    | 0.4802 | 0.3729 | 1.3227          |
+| No log        | 5.0   | 65   | 0.4691   | 0.7161    | 0.4691 | 0.3548 | 1.0735          |
+| No log        | 6.0   | 78   | 0.5927   | 0.6874    | 0.5927 | 0.5628 | 0.8102          |
+| No log        | 7.0   | 91   | 0.5402   | 0.7032    | 0.5402 | 0.4823 | 1.3396          |
+| No log        | 8.0   | 104  | 0.6661   | 0.6753    | 0.6661 | 0.6340 | 0.7542          |
+| No log        | 9.0   | 117  | 0.6234   | 0.6935    | 0.6234 | 0.6047 | 0.8814          |
+| No log        | 10.0  | 130  | 0.6633   | 0.6732    | 0.6633 | 0.6574 | 0.7494          |
+| No log        | 11.0  | 143  | 0.6567   | 0.6597    | 0.6567 | 0.6520 | 0.7748          |
+| No log        | 12.0  | 156  | 0.6606   | 0.6596    | 0.6606 | 0.6552 | 0.7600          |
+| No log        | 13.0  | 169  | 0.6624   | 0.6744    | 0.6624 | 0.6567 | 0.7976          |
+| No log        | 14.0  | 182  | 0.6667   | 0.6668    | 0.6667 | 0.6619 | 0.7685          |
+| No log        | 15.0  | 195  | 0.6452   | 0.6778    | 0.6452 | 0.6361 | 0.8573          |
+| No log        | 16.0  | 208  | 0.6536   | 0.6721    | 0.6536 | 0.6466 | 0.8498          |
+| No log        | 17.0  | 221  | 0.6545   | 0.6625    | 0.6545 | 0.6501 | 0.8457          |
+| No log        | 18.0  | 234  | 0.6570   | 0.6602    | 0.6570 | 0.6523 | 0.8187          |
+| No log        | 18.48 | 240  | 0.6579   | 0.6594    | 0.6579 | 0.6534 | 0.8215          |
 ### Framework versions
+- Transformers 4.48.2
 - Pytorch 2.5.1+cu124
 - Tokenizers 0.21.0

config.json CHANGED Viewed

@@ -35,7 +35,7 @@
   "pad_token_id": 1,
   "position_embedding_type": "absolute",
   "torch_dtype": "float32",
-  "transformers_version": "4.47.1",
   "type_vocab_size": 1,
   "use_cache": true,
   "vocab_size": 50005

   "pad_token_id": 1,
   "position_embedding_type": "absolute",
   "torch_dtype": "float32",
+  "transformers_version": "4.48.2",
   "type_vocab_size": 1,
   "use_cache": true,
   "vocab_size": 50005

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:dfb92a5efa8df5ec9ac13870bc61a4c3a225e29470ecc1c03ef877247670c120
 size 495460172

 version https://git-lfs.github.com/spec/v1
+oid sha256:0f811fa1ba17312e9ba42aa529d28ecfb491eb4de93100606f91fd7b0dd7fe20
 size 495460172

runs/Feb07_13-11-54_32d4dd9baa07/events.out.tfevents.1738933920.32d4dd9baa07.2176.10 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:221421cbff3932ad6f5cd9a1b1e8d28992af2b13ff9ed951a5ab042ea1337b9c
+size 14819

runs/Feb07_13-11-54_32d4dd9baa07/events.out.tfevents.1738934452.32d4dd9baa07.2176.11 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b2fb4e27e1bf54ee445749b8cb976b1a371199bf548c1e5a54f5be9a137ae5b7
+size 560

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0ee121e931e0184a41ef90281497e94fa253955722aa96c53d0775ab16ab49f7
 size 5496

 version https://git-lfs.github.com/spec/v1
+oid sha256:2bf66c5a73ad3bcf39d8c674f7271758ddcc03923bb60f2cdb115a5dca83bf3d
 size 5496