Add/update the quantized ONNX model files and README.md for Transformers.js v3

## Applied Quantizations

### ✅ Based on `model.onnx` *with* slimming

↳ ✅ `int8`: `model_int8.onnx` (added)
↳ ✅ `uint8`: `model_uint8.onnx` (added)
↳ ✅ `q4`: `model_q4.onnx` (added)
↳ ✅ `q4f16`: `model_q4f16.onnx` (added)
↳ ✅ `bnb4`: `model_bnb4.onnx` (added)

### ✅ Based on `model.onnx` *with* slimming

↳ ✅ `int8`: `model_int8.onnx` (added)
↳ ✅ `uint8`: `model_uint8.onnx` (added)
↳ ✅ `q4`: `model_q4.onnx` (added)
↳ ✅ `q4f16`: `model_q4f16.onnx` (added)
↳ ✅ `bnb4`: `model_bnb4.onnx` (added)

Files changed (6) hide show

README.md +3 -3
onnx/model_bnb4.onnx +3 -0
onnx/model_int8.onnx +3 -0
onnx/model_q4.onnx +3 -0
onnx/model_q4f16.onnx +3 -0
onnx/model_uint8.onnx +3 -0

README.md CHANGED Viewed

@@ -8,15 +8,15 @@ https://huggingface.co/google/electra-base-discriminator with ONNX weights to be
 ## Usage (Transformers.js)
-If you haven't already, you can install the [Transformers.js](https://huggingface.co/docs/transformers.js) JavaScript library from [NPM](https://www.npmjs.com/package/@xenova/transformers) using:
 ```bash
-npm i @xenova/transformers
 ```
 **Example:** Feature extraction w/ `Xenova/electra-base-discriminator`.
 ```javascript
-import { pipeline } from '@xenova/transformers';
 // Create feature extraction pipeline
 const extractor = await pipeline('feature-extraction', 'Xenova/electra-base-discriminator');

 ## Usage (Transformers.js)
+If you haven't already, you can install the [Transformers.js](https://huggingface.co/docs/transformers.js) JavaScript library from [NPM](https://www.npmjs.com/package/@huggingface/transformers) using:
 ```bash
+npm i @huggingface/transformers
 ```
 **Example:** Feature extraction w/ `Xenova/electra-base-discriminator`.
 ```javascript
+import { pipeline } from '@huggingface/transformers';
 // Create feature extraction pipeline
 const extractor = await pipeline('feature-extraction', 'Xenova/electra-base-discriminator');

onnx/model_bnb4.onnx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ab7f4520015d00f47f1ec37a204831703c7f8c08bed16a02c9c81ee9e69ad596
+size 143893455

onnx/model_int8.onnx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fec7cfe97ca7a7e82635deb4f35095a34d28065f66d65faa7acb21ea73cacd0b
+size 109622387

onnx/model_q4.onnx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3b092edb34d1e50ca0b868176c1135cd1c7b000477e82216c7bd2bdb75ed0315
+size 149201343

onnx/model_q4f16.onnx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1f8b285aca72ea6c319184f032c51eb23561666305d95eaa08328d0ca852a14c
+size 95979116

onnx/model_uint8.onnx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d60554cafc252df44e2653fdba6faec3b93b9d120c03cc3d7f0ccc4778bcf39d
+size 109622432