SentenceTransformer based on sergeyzh/rubert-tiny-turbo
This is a sentence-transformers model finetuned from sergeyzh/rubert-tiny-turbo. It maps sentences & paragraphs to a 312-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
Model Details
Model Description
- Model Type: Sentence Transformer
- Base model: sergeyzh/rubert-tiny-turbo
- Maximum Sequence Length: 2048 tokens
- Output Dimensionality: 312 dimensions
- Similarity Function: Cosine Similarity
Model Sources
- Documentation: Sentence Transformers Documentation
- Repository: Sentence Transformers on GitHub
- Hugging Face: Sentence Transformers on Hugging Face
Full Model Architecture
SentenceTransformer(
(0): Transformer({'max_seq_length': 2048, 'do_lower_case': False}) with Transformer model: BertModel
(1): Pooling({'word_embedding_dimension': 312, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Normalize()
)
Usage
Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("denis-gordeev/reranker_dialog_items_biencoder_rubert-tiny-turbo-7")
# Run inference
sentences = [
'Здравствуйте! Подскажите, пожалуйста, у вас есть наушники, которые подходят для профессионального использования при ремонте и тестировании техники? Желательно мониторные и с хорошим качеством звука.',
"{'id': '9628c865-82ac-4c81-817d-5c414715af2d', 'externalId': '100052027418_149597', 'title': 'Проводные наушники Samsung EO-IC100 White', 'price': 1440.0, 'url': 'https://megamarket.ru/catalog/details/naushniki-mic-samsung-eo-ic100bwegru-white-type-c-100052027418_149597', 'imageLink': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/147/185/808/101/812/4/100052027418b0.jpg', 'description': '<p>Проводные наушники Samsung EO-IC100 White – это стильное устройство, которое обеспечивает качественное звучание любимых композиций.</p>\\n<h2>Погружение в музыку</h2>\\n<p>С помощью наушников пользователь может наслаждаться любимыми треками в любое время. Они оснащены встроенным микрофоном, который позволяет отвечать на звонки прямо во время прогулки или поездки. Другие технические параметры:</p>\\n<ul>\\n<li>Встроенный аккумулятор обеспечивает автономную работу устройства в течение восьми часов.</li>\\n<li>Закрытая конструкция наушников создает эффект полного погружения в музыку.</li>\\n<li>Динамические излучатели воспроизводят чистый и детализированный звук.</li>\\n</ul>\\n<p>Корпус выполнен из прочного пластика, а амбушюры – из мягкого силикона. Устройство удобно носить длительное время, оно не вызывает дискомфорта даже при активных движениях.</p>', 'rating': 4.4, 'reviewCount': 30, 'extraInfo': ''}",
"{'long_web_name': 'Картридж для матричного принтера CACTUS CS-ERC27 (CS-ERC27) черный, совместимый', 'price': 263.0, 'url': 'https://megamarket.ru/catalog/details/kartridzh-dlya-matrichnogo-printera-cactus-cs-erc27-cs-erc27-chernyy-sovmestimyy-100030714541/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-17/974/600/623/515/38/100030714541b0.jpg', 'id': '100030714541_14154', 'description': '', 'rating': 5.0, 'review_count': 1}",
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 312]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
Evaluation
Metrics
Binary Classification
- Dataset:
item-classification - Evaluated with
BinaryClassificationEvaluator
| Metric | Value |
|---|---|
| cosine_accuracy | 0.947 |
| cosine_accuracy_threshold | 0.777 |
| cosine_f1 | 0.8655 |
| cosine_f1_threshold | 0.7681 |
| cosine_precision | 0.7824 |
| cosine_recall | 0.9684 |
| cosine_ap | 0.7986 |
| cosine_mcc | 0.8402 |
Training Details
Training Dataset
Unnamed Dataset
- Size: 49,285 training samples
- Columns:
anchor,text, andlabel - Approximate statistics based on the first 1000 samples:
anchor text label type string string int details - min: 19 tokens
- mean: 35.78 tokens
- max: 56 tokens
- min: 55 tokens
- mean: 352.41 tokens
- max: 1356 tokens
- 0: ~85.90%
- 1: ~14.10%
- Samples:
anchor text label Здравствуйте! Я хочу купить Smart-TV приставку для просмотра фильмов и видео. Можете посоветовать какие-то модели? Желательно, чтобы приставка была быстрая и поддерживала 4K.{'long_web_name': 'Смарт-приставка Xiaomi TV Box S 2nd Gen 2/8 черная (PFJ4167RU)', 'price': 6290.0, 'description': 'НОВИНКА 2023 ГОДА! 2-е поколение потокового медиаплеера Xiaomi TV Box S. ТВ приставка Xiaomi TV Box S 2nd Gen (PFJ4167RU). 4х ядерный процессор Cortex-A55 Графический процессор-ARM Mali G31 MP2 Dolby Vision 4K Ultra HDR 10+ Встроены Google TV и Google Assistant 360° Bluetooth и ИК-пульт дистанционного управления Двухдиапазонный Wi-Fi Качество изображения 4K Ultra HD Беспроводное дублирование экрана Улучшенный угол обзора', 'rating': 4.86, 'review_count': 919}1Здравствуйте! Я хочу купить Smart-TV приставку для просмотра фильмов и видео. Можете посоветовать какие-то модели? Желательно, чтобы приставка была быстрая и поддерживала 4K.{'long_web_name': 'Смартфон Honor Honor 90 12/512GB изумрудный зеленый (5109ATRU)', 'price': 40890.0, 'url': 'https://megamarket.ru/catalog/details/smartfon-honor-honor-90-12-512gb-izumrudnyy-zelenyy-5109atru-100063902396/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-97/523/126/541/612/13/100063902396b0.jpg', 'id': '100063902396_126519', 'description': '', 'rating': 4.86, 'review_count': 27}0Здравствуйте! Я хочу купить Smart-TV приставку для просмотра фильмов и видео. Можете посоветовать какие-то модели? Желательно, чтобы приставка была быстрая и поддерживала 4K.{'long_web_name': 'Видеокарта MSI NVIDIA GeForce RTX 3060 Gaming X LHR', 'price': 39330.0, 'url': 'https://megamarket.ru/catalog/details/videokarta-msi-geforce-rtx-3060-gaming-x-12g-100028302832/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/179/595/992/532/211/22/100028302832b0.png', 'id': '100028302832_40440', 'description': 'Видеокарта MSI NVIDIA GeForce RTX 3060 Gaming X (LHR) (RTX 3060 GAMING X 12G) - это мощное графическое решение для настоящих геймеров. Современный дизайн и передовые технологии позволяют вам наслаждаться потрясающими игровыми впечатлениями и запускать самые требовательные игры без затруднений.
\n\nПотрясающая графика и высокая производительность
\n\nС видеокартой MSI NVIDIA GeForce RTX 3060 Gaming X вы сможете наслаждаться невероятно реалистичными и проработанными изображениями. Благодаря новейшему графическому процессору GA106 и объему видеопамяти 12 ГБ игры будут работать плавно и без лагов, а поддержка трассировки лучей ...0 - Loss:
ContrastiveLosswith these parameters:{ "distance_metric": "SiameseDistanceMetric.COSINE_DISTANCE", "margin": 0.5, "size_average": true }
Evaluation Dataset
Unnamed Dataset
- Size: 7,885 evaluation samples
- Columns:
anchor,text, andlabel - Approximate statistics based on the first 1000 samples:
anchor text label type string string int details - min: 7 tokens
- mean: 23.9 tokens
- max: 37 tokens
- min: 56 tokens
- mean: 365.94 tokens
- max: 1356 tokens
- 0: ~85.70%
- 1: ~14.30%
- Samples:
anchor text label Привет! Хочу купить фитнес-браслет для отслеживания шагов и сна. Может, что-то недорогое, но с хорошей функциональностью? Подскажете, какие есть варианты?{'long_web_name': 'Фитнес-браслет HUAWEI Band 8, черный матовый', 'price': 2555.0, 'description': 'Фитнес-браслет Huawei Band 8 (черный) — это устройство, которое помогает следить за здоровьем и физической активностью.
\nПомогает контролировать состояние организма
\nБраслет оснащен датчиком SpO2, который отслеживает уровень кислорода в крови. Также он имеет встроенный пульсометр, который позволяет узнать частоту сердцебиения. Другие параметры:
\n- \n
- дисплей AMOLED — отображает время, количество пройденных шагов, сожженные калории; \n
- 100 спортивных режимов — можно выбрать подходящий для тренировки; \n
- гироскоп и акселерометр — определяют положение тела в пространстве и скорость движения. \n
Благодаря водонепроницаемости браслет можно носить во время плавания. Корпус защищен от попадания влаги и пыли. Ремешок выполнен из силикона — мягкий и приятный на ощупь. Есть возможность регулировать длину.
', 'rating': 4.94, 'review_count': 7...1Привет! Хочу купить фитнес-браслет для отслеживания шагов и сна. Может, что-то недорогое, но с хорошей функциональностью? Подскажете, какие есть варианты?{'long_web_name': 'Видеокарта ASUS NVIDIA GeForce RTX 4090 TUF Gaming OC Edition (TUF-RTX4090-O24G-GAMING)', 'price': 296368.0, 'url': 'https://megamarket.ru/catalog/details/videokarta-asus-tuf-rtx4090-o24g-gaming-rtx4090-100044516044/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/228/133/388/117/192/3/100044516044b9.jpg', 'id': '100044516044_59182', 'description': 'Видеокарта ASUS NVIDIA GeForce RTX 4090 TUF Gaming OC Edition (90YV0IE0-M0NA00) - высокопроизводительное графическое решение, которое обеспечивает невероятно реалистичную визуализацию игровых миров.
\nМаксимальная производительность для настоящих игроков
\nASUS NVIDIA GeForce RTX 4090 TUF Gaming OC Edition - это явный лидер среди видеокарт нового поколения. Она оснащена мощным графическим процессором GeForce RTX 4090 и имеет объем видеопамяти 24 ГБ GDDR6X, что обеспечивает потрясающую детализацию и плавность изображения.
\nУлучшенная поддержка трассировки лучей предоставля...
\n0Привет! Хочу купить фитнес-браслет для отслеживания шагов и сна. Может, что-то недорогое, но с хорошей функциональностью? Подскажете, какие есть варианты?{'long_web_name': 'Встраиваемая варочная панель газовая Weissgauff HGG 640 BG черный', 'price': 16790.0, 'url': 'https://megamarket.ru/catalog/details/vstraivaemaya-gazovaya-panel-weissgauff-hgg-640-bg-100026765438/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/609/462/228/514/151/3/100026765438b0.jpg', 'id': '100026765438_6061', 'description': 'Встраиваемая независимая газовая панель Weissgauff шириной 60 см, исполненная в закалённом чёрном стекле - это стильное и компактное решение для вашей кухни!
*Ширина 60 см это европейский стандарт качества, признанный миллионами довольных покупателей по всему миру!
*Чёрное закаленное стекло не только роскошно выглядит, подчеркивая великолепный внешний вид данной модели, но и отлично справляется с механическими воздействиями и температурными перегрузками!
*Решетки из высококачественного чугуна это неизменное качество, надежность и долговечность, воплощенные в каждой детали! А особая элегантность их дизайна не тольк...0 - Loss:
ContrastiveLosswith these parameters:{ "distance_metric": "SiameseDistanceMetric.COSINE_DISTANCE", "margin": 0.5, "size_average": true }
Training Hyperparameters
Non-Default Hyperparameters
eval_strategy: stepsper_device_train_batch_size: 16per_device_eval_batch_size: 16num_train_epochs: 1warmup_ratio: 0.1fp16: Trueload_best_model_at_end: Truebatch_sampler: no_duplicates
All Hyperparameters
Click to expand
overwrite_output_dir: Falsedo_predict: Falseeval_strategy: stepsprediction_loss_only: Trueper_device_train_batch_size: 16per_device_eval_batch_size: 16per_gpu_train_batch_size: Noneper_gpu_eval_batch_size: Nonegradient_accumulation_steps: 1eval_accumulation_steps: Nonetorch_empty_cache_steps: Nonelearning_rate: 5e-05weight_decay: 0.0adam_beta1: 0.9adam_beta2: 0.999adam_epsilon: 1e-08max_grad_norm: 1.0num_train_epochs: 1max_steps: -1lr_scheduler_type: linearlr_scheduler_kwargs: {}warmup_ratio: 0.1warmup_steps: 0log_level: passivelog_level_replica: warninglog_on_each_node: Truelogging_nan_inf_filter: Truesave_safetensors: Truesave_on_each_node: Falsesave_only_model: Falserestore_callback_states_from_checkpoint: Falseno_cuda: Falseuse_cpu: Falseuse_mps_device: Falseseed: 42data_seed: Nonejit_mode_eval: Falseuse_ipex: Falsebf16: Falsefp16: Truefp16_opt_level: O1half_precision_backend: autobf16_full_eval: Falsefp16_full_eval: Falsetf32: Nonelocal_rank: 0ddp_backend: Nonetpu_num_cores: Nonetpu_metrics_debug: Falsedebug: []dataloader_drop_last: Falsedataloader_num_workers: 0dataloader_prefetch_factor: Nonepast_index: -1disable_tqdm: Falseremove_unused_columns: Truelabel_names: Noneload_best_model_at_end: Trueignore_data_skip: Falsefsdp: []fsdp_min_num_params: 0fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap: Noneaccelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}deepspeed: Nonelabel_smoothing_factor: 0.0optim: adamw_torchoptim_args: Noneadafactor: Falsegroup_by_length: Falselength_column_name: lengthddp_find_unused_parameters: Noneddp_bucket_cap_mb: Noneddp_broadcast_buffers: Falsedataloader_pin_memory: Truedataloader_persistent_workers: Falseskip_memory_metrics: Trueuse_legacy_prediction_loop: Falsepush_to_hub: Falseresume_from_checkpoint: Nonehub_model_id: Nonehub_strategy: every_savehub_private_repo: Nonehub_always_push: Falsegradient_checkpointing: Falsegradient_checkpointing_kwargs: Noneinclude_inputs_for_metrics: Falseinclude_for_metrics: []eval_do_concat_batches: Truefp16_backend: autopush_to_hub_model_id: Nonepush_to_hub_organization: Nonemp_parameters:auto_find_batch_size: Falsefull_determinism: Falsetorchdynamo: Noneray_scope: lastddp_timeout: 1800torch_compile: Falsetorch_compile_backend: Nonetorch_compile_mode: Nonedispatch_batches: Nonesplit_batches: Noneinclude_tokens_per_second: Falseinclude_num_input_tokens_seen: Falseneftune_noise_alpha: Noneoptim_target_modules: Nonebatch_eval_metrics: Falseeval_on_start: Falseuse_liger_kernel: Falseeval_use_gather_object: Falseaverage_tokens_across_devices: Falseprompts: Nonebatch_sampler: no_duplicatesmulti_dataset_batch_sampler: proportional
Training Logs
| Epoch | Step | Training Loss | Validation Loss | item-classification_cosine_ap |
|---|---|---|---|---|
| 0 | 0 | - | 0.0237 | 0.4047 |
| 0.0649 | 100 | 0.0132 | - | - |
| 0.1298 | 200 | 0.0062 | - | - |
| 0.1622 | 250 | - | 0.0037 | 0.7734 |
| 0.1947 | 300 | 0.0053 | - | - |
| 0.2596 | 400 | 0.0053 | - | - |
| 0.3245 | 500 | 0.004 | 0.0043 | 0.7855 |
| 0.3894 | 600 | 0.0049 | - | - |
| 0.4543 | 700 | 0.0044 | - | - |
| 0.4867 | 750 | - | 0.0039 | 0.7641 |
| 0.5191 | 800 | 0.0039 | - | - |
| 0.5840 | 900 | 0.0043 | - | - |
| 0.6489 | 1000 | 0.0036 | 0.0035 | 0.7709 |
| 0.7138 | 1100 | 0.0042 | - | - |
| 0.7787 | 1200 | 0.0036 | - | - |
| 0.8112 | 1250 | - | 0.0036 | 0.7956 |
| 0.8436 | 1300 | 0.0038 | - | - |
| 0.9085 | 1400 | 0.0038 | - | - |
| 0.9734 | 1500 | 0.0032 | 0.0035 | 0.7986 |
| 1.0 | 1541 | - | 0.0035 | 0.7986 |
- The bold row denotes the saved checkpoint.
Framework Versions
- Python: 3.10.16
- Sentence Transformers: 3.4.0.dev0
- Transformers: 4.47.1
- PyTorch: 2.5.1+cu124
- Accelerate: 1.2.1
- Datasets: 3.2.0
- Tokenizers: 0.21.0
Citation
BibTeX
Sentence Transformers
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
ContrastiveLoss
@inproceedings{hadsell2006dimensionality,
author={Hadsell, R. and Chopra, S. and LeCun, Y.},
booktitle={2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'06)},
title={Dimensionality Reduction by Learning an Invariant Mapping},
year={2006},
volume={2},
number={},
pages={1735-1742},
doi={10.1109/CVPR.2006.100}
}
- Downloads last month
- 2
Model tree for denis-gordeev/reranker_dialog_items_biencoder_rubert-tiny-turbo-7
Evaluation results
- Cosine Accuracy on item classificationself-reported0.947
- Cosine Accuracy Threshold on item classificationself-reported0.777
- Cosine F1 on item classificationself-reported0.865
- Cosine F1 Threshold on item classificationself-reported0.768
- Cosine Precision on item classificationself-reported0.782
- Cosine Recall on item classificationself-reported0.968
- Cosine Ap on item classificationself-reported0.799
- Cosine Mcc on item classificationself-reported0.840