File size: 58,961 Bytes
84368b4 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358 359 360 361 362 363 364 365 366 367 368 369 370 371 372 373 374 375 376 377 378 379 380 381 382 383 384 385 386 387 388 389 390 391 392 393 394 395 396 397 398 399 400 401 402 403 404 405 406 407 408 409 410 411 412 413 414 415 416 417 418 419 420 421 422 423 424 425 426 427 428 429 430 431 432 433 434 435 436 437 438 439 440 441 442 443 444 445 446 447 448 449 450 451 452 453 454 455 456 457 458 459 460 461 462 463 464 465 466 467 468 469 470 471 472 473 474 475 476 477 478 479 480 481 482 483 484 485 486 487 488 489 490 491 492 493 494 495 496 497 498 499 500 501 502 503 504 505 506 507 508 509 510 511 512 513 514 515 516 517 518 519 520 521 522 523 524 525 526 527 528 529 530 531 532 533 534 535 536 537 538 539 540 541 542 543 544 545 546 547 548 549 550 551 552 553 554 555 556 557 558 559 560 561 562 563 564 565 566 567 568 569 570 571 572 573 574 575 576 577 578 579 580 581 582 583 584 585 586 587 588 589 590 591 592 593 594 595 596 597 598 599 600 601 602 603 604 605 606 607 608 609 610 611 612 613 614 615 616 617 618 619 620 621 622 623 624 625 626 627 628 629 630 631 632 633 634 635 636 637 638 639 640 641 642 643 644 645 646 |
---
tags:
- sentence-transformers
- sentence-similarity
- feature-extraction
- generated_from_trainer
- dataset_size:49285
- loss:ContrastiveLoss
base_model: sergeyzh/rubert-tiny-turbo
widget:
- source_sentence: Здравствуйте! Подскажите, пожалуйста, у вас есть смарт-часы Samsung
Gear? И какие модели сейчас в наличии?
sentences:
- '{''long_web_name'': ''Кронштейн для телевизора 17"-43" ONKRON M4S наклонно-поворотный,
чёрный'', ''price'': 2300.0, ''url'': ''https://megamarket.ru/catalog/details/kronshteyn-dlya-televizora-onkron-m4s-100024214080/'',
''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-36/944/630/271/712/55/100024214080b0.jpg'',
''id'': ''100024214080_16245'', ''description'': ''<p>Настенный наклонно-поворотный
кронштейн для телевизора <strong>ONKRON M4S</strong> предназначен для
экранов с диагональю от 17 до 43 дюймов (43,18-109,2 см).</p><p>Крепление для
ТВ подходит для маленьких и средних телевизоров весом до 35 кг. Крепкий и надежный,
при этом элегантный кронштейн для ТВ станет стильным дополнением домашнего интерьера.</p><p><strong>Преимущества:</strong></p><p>а)
Предусмотренная производителем система держателей проводов позволит закрепить
их в нужном положении – это придаст дополнительное удобство и сделает более
аккуратным внешний вид Вашего устройства.<br />б) Крепление на стену изготовлено
из высококачественной стали, что обеспечивает его прочность.<br />в) Пластиковые
накладки скроют всевозможные монтажные крепления, добавив эстетичности образу
Вашего устройства.<br />г) Вы можете занимать любое удобное положение при просмотре
ТВ за счет широких возможностей регулировки угла наклона от -5° до +8°.
Эти возможности позволят получать удовольствие от просмотра.<br />д) Подходит
практически всем современным телевизорам - LCD, LED, OLED, Ultra HD, plasma, с
выгнутыми и плоскими мониторами. Поддерживает стандарты VESA в диапазоне от 100x100
мм до 200x200 мм.</p><p>Приятным удивлением станет стоимость подставки для телевизора
– ценовое решение можно назвать максимально выгодным, учитывая заявленные
технические характеристики продукта, особенно возможности наклона и поворота.</p><p><strong>Совместимость</strong>:
кронштейн подходит для большинства телевизоров популярных брендов, среди которых
Samsung, LG, Sony, KIVI, Tcl, Xiaomi Mi, SUPRA, Panasonic, Hyundai, Erisson, Asano,
Horizont, JVC, Thomson, HARTENS, Sharp, Toshiba, Skyworth, BBK, AVEL, Витязь,
Веко, BQ, DEXP, SkyLine, Pioneer, Rolsen, Harper, Hisense, Hitachi, Polarline,
Prestigio, Telefunken и других.</p><p><strong>Комплектация</strong>: кронштейн
для телевизора, комплект ключей и крепежа для установки ТВ, подробная инструкция
на русском языке.</p>'', ''rating'': 4.94, ''review_count'': 434}'
- '{''long_web_name'': ''Смарт-часы Huawei Watch GT 4 черный'', ''price'': 19999.0,
''url'': ''https://megamarket.ru/catalog/details/smart-chasy-gt-4-chernyy-chernyy-3215416-600013640661/'',
''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/415/122/331/011/232/7/600013640661b0.jpeg'',
''id'': ''600013640661_99804'', ''description'': ''Мода не стоит на месте, как
и технологии. Вперед к достижениям и новым открытиям! Носимые устройства HUAWEI.
Опережая тренды. Культовый восьмиугольный дизайн. Сбалансированные пропорции
в сочетании с ровным гранями — воплощение незаурядной классики часового искусства. Завораживающая
игра света. Благодаря инновационному креплению и изящному безелю часы выглядят
более воздушными. Сочетание эргономичности и стиля Легкий корпус и на 13% более
высокая полезная площадь экрана2, обрамленного узким безелем, создают идеальный
баланс между эстетикой и функциональностью. ДлинаxШиринаxВысота (мм): PNX-B19:
46 x 46 x 10,9 Время зарядки: Около 100 минут (при температуре окружающей среды
+25°C) Напряжение и сила тока зарядного устройства 5 В /2 А Теоретическое время
работы 14 дней (PNX-B19)/7 дней (ARA-B19) в обычных сценариях использования (зависит
от привычек пользователя, и интенсивности использования устройства). Bluetooth
BT5.2, поддержка BLE/BR/EDR NFC Поддерживается Навигация Поддерживается Wi-Fi
Поддерживается (только 2,4 ГГц) Вибромотор Линейный мотор Микрофон Поддерживается
Динамик Поддерживается Физические кнопки Кнопка питания, функциональная кнопка,
поддержка таких операций, как нажатие, нажатие и удержание и поворот кнопки часов
Водонепроницаемость 5 АТМ, IP68'', ''rating'': 4.92, ''review_count'': 541}'
- '{''long_web_name'': ''Сменная панель для мультипекаря Redmond RAMB-07'', ''price'':
1499.0, ''url'': ''https://megamarket.ru/catalog/details/paneli-dlya-multipekarya-redmond-ramb-07-treugolnik-100000404418/'',
''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/1516661/100000404418b0.jpg'',
''id'': ''100000404418_3333'', ''description'': ''Универсальные съемные панели
для любого мультипекаря REDMOND серии 6! Позволят приготовить сладкое печенье,
бисквитные пирожные, небольшие пирожки с разнообразными начинками или сырники
для завтрака. Панели изготовлены из металла с антипригарным покрытием - они долговечны
и легки в уходе.'', ''rating'': 4.88, ''review_count'': 31}'
- source_sentence: Здравствуйте! Мне нужна техника для выпечки, а именно хлебопечка.
Ищу недорогую модель для использования дома. Вы могли бы мне порекомендовать что-то
подходящее?
sentences:
- '{''long_web_name'': ''Кабель Perfeo TV - TV 2м White (T5002)'', ''price'': 223.0,
''url'': ''https://megamarket.ru/catalog/details/kabel-perfeo-rca-rca-2m-white-t5002-600002644126/'',
''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-2/13/97/02/45/51/16/600002644126b0.jpeg'',
''id'': ''600002644126_44832'', ''description'': ''Высококачественный и недорогой
антенный кабель ТВ вилка - ТВ розетка. Предназначен для передачи аналоговых стереозвуковых
сигналов между аудио и аудио-видео устройствами или их компонентами'', ''rating'':
4.8, ''review_count'': 5}'
- '{''long_web_name'': ''Хлебопечка Kitfort KT-304'', ''price'': 11990.0, ''description'':
''<p>Хлебопечь Kitfort КТ-304 мощностью 550 Вт позволяет готовить хлеб весом до
750 г. Модель оснащена таймером, который дает возможность отсрочить старт программы
на срок до 13 часов.</p>\n<h2>Простая готовка вкусного хлеба</h2>\n<p>Прибор имеет
16 автоматических программ, среди которых есть режимы для приготовления джема,
йогурта, варенья, плова, каши, кекса, пирога, пасты, лазаньи, пиццы, а также для
замеса теста. Есть функция поддержания температуры. Корпус выполнен из металла
— прочного материала, устойчивого к механическим повреждениям. Основные параметры
устройства:</p>\n<ul>\n<li>вес 4,9 кг — удобно перемещать;</li>\n<li>дисплей —
отображает время, номер выбранной программы, оставшееся время до конца работы;</li>\n<li>звуковая
индикация — оповещает об окончании программы и этапах ее выполнения.</li>\n</ul>\n<p>К
прибору прилагаются мерный стаканчик, лопатка и крюк. Длина сетевого шнура составляет
1 м — удобно пользоваться даже на значительном расстоянии от розетки.</p>'', ''rating'':
4.88, ''review_count'': 177}'
- '{''long_web_name'': ''Беспроводная мышь Logitech MX Master 3S Black (910-006565)'',
''price'': 9499.0, ''url'': ''https://megamarket.ru/catalog/details/besprovodnaya-igrovaya-mysh-logitech-910-006565-black-910-006565-100047346008/'',
''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-17/224/876/611/226/162/0/100047346008b0.png'',
''id'': ''100047346008_99804'', ''description'': '''', ''rating'': 4.88, ''review_count'':
63}'
- source_sentence: Привет! Хочу купить фитнес-браслет для отслеживания шагов и сна.
Может, что-то недорогое, но с хорошей функциональностью? Подскажете, какие есть
варианты?
sentences:
- '{''long_web_name'': ''Смарт браслет HUAWEI Band 8 (ASK-B19) розовый'', ''price'':
3383.0, ''description'': ''<p>Смарт-браслет Huawei Band 8 розового цвета (ASK-B19)
— это устройство, которое поможет контролировать физическую активность и состояние
здоровья.</p>\n<h2>Компактная модель</h2>\n<p>Браслет оснащен цветным экраном
AMOLED диагональю 1,47 дюйма. На нем отображается информация о количестве пройденных
шагов, частоте сердечных сокращений, уровне кислорода в крови и другие данные.
Устройство имеет следующие параметры:</p>\n<ul>\n<li>встроенный динамик позволяет
принимать и отклонять звонки;</li>\n<li>сенсорный дисплей обеспечивает удобную
навигацию;</li>\n<li>ремешок из силикона не вызывает аллергических реакций и раздражений
кожи;</li>\n<li>корпус выполнен из пластика, который защищает внутренние детали
от повреждений.</li>\n</ul>\n<p>Благодаря водонепроницаемости можно плавать в
бассейне или море, не снимая гаджет. Также есть функция поиска смартфона.</p>'',
''rating'': 4.95, ''review_count'': 211}'
- '{''long_web_name'': ''Наушники Beyerdynamic DT 770 Pro (250 Ohm) Black'', ''price'':
33281.0, ''description'': ''<p>Наушники Beyerdynamic DT 770 Pro Black закрытого
динамического типа с диапазоном частот от 5 до 35000. Особенность модели заключается
в наличии специального велюрового амбушюра и пружинного изголовья из высокопрочной
стали, которое сохраняет первозданную форму в течение продолжительного времени.</p>\r\n<h2>Технический
потенциал и отсутствие помех</h2>\r\n<p>Конструкция наушников предполагает встроенную
систему Bass Reflex, которая позволяет достичь более качественных звуков на низкой
и высокой частоте. Модель характеризуется улучшенной шумоизоляцией, предотвращающей
возникновение помех во время использования аксессуара. Наушникам свойственны такие
особенности:</p>\r\n<ul>\r\n<li>сопротивление – 250 Ом;</li>\r\n<li>уровень SPL
– 96 дБ;</li>\r\n<li>чувствительность – 96 дБ.</li>\r\n</ul>\r\n<p>Наивысший показатель
мощности составляет 100 мВ, а искажение во время эксплуатации не превышает 0,05%.
Также имеется адаптер, позволяющий подключать технику к любому типу предусилителя.</p>'',
''rating'': 4.92, ''review_count'': 85}'
- '{''long_web_name'': ''Внешний аккумулятор Xiaomi Power Bank 3 30000 mAh White'',
''price'': 1699.0, ''url'': ''https://megamarket.ru/catalog/details/xiaomi-power-bank-3-30000-mah-vneshniy-akkumulyator-white-600002354850/'',
''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/211/585/306/791/613/7/600002354850b0.jpeg'',
''id'': ''600002354850_148061'', ''description'': ''Xiaomi Mi Power Bank 3 30000mAh
позволит вам зарядить как минимум 10 раз подряд любой современный смартфон. Внешний
аккумулятор подходит для всех мобильных устройств. Корпус белого цвета приятен
на ощупь, он устойчив к царапинам, истиранию. Благодаря светодиодным лампочкам
на панели, вы с легкостью можете отслеживать уровень заряда аккумулятора.'', ''rating'':
4.08, ''review_count'': 1001}'
- source_sentence: Здравствуйте! Подскажите, пожалуйста, у вас есть наушники, которые
подходят для профессионального использования при ремонте и тестировании техники?
Желательно мониторные и с хорошим качеством звука.
sentences:
- '{''long_web_name'': ''Внешний аккумулятор Xiaomi Mi Power Bank 3 PLM18ZM 20000
mAh Type-C White'', ''price'': 1315.0, ''url'': ''https://megamarket.ru/catalog/details/vneshniy-akkumulyator-xiaomi-mi-power-bank-3-20000-mah-type-c-white-600000977913/'',
''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/15118561227/600000977913b0.jpeg'',
''id'': ''600000977913_58978'', ''description'': ''<p>Внешний аккумулятор Xiaomi
Mi Power Bank 3 20000 mAh Type-C White обеспечит зарядку мобильных телефонов,
планшетов, ноутбуков или микротоковых электронных девайсов (смарт-часов, фитнес-браслетов)
при отсутствии сети. Допускается двусторонняя зарядка (подключение к сети и мобильному
гаджету). Производителем предусмотрена защита от перегрева, скачков напряжения,
перегрузок, коротких замыканий.</p> \n<h2>Компактность и производительность</h2>
\n<p>Батарея Li-Pol защищена от воздействия внешней среды, механических повреждений
пластиковым корпусом размерами 153,5х73,5х27,5 мм. На нижней торцевой стороне
корпуса размещаются разъемы USB Тype С для подключения разряженных портативных
устройств и micro-USB для подключения к сети самого повербанка. Сверху находится
кнопка включения и световые индикаторы, которые сигнализируют об уровне заряда
аккумулятора. Ключевые показатели работы:</p> \n<ul> \n<li>напряжение на выходе
– 12 В;</li> \n<li>выходная мощность – 45 Вт;</li> \n<li>зарядка аккумулятора
проводится в течение 4,5 часов при подключении к сети.</li> \n</ul> \n<p>Полного
заряда аккумулятора достаточно для подзарядки 4-7 смартфонов, в зависимости от
модели. Срок службы Power Bank составляет в среднем 8 лет (500 рабочих циклов).</p>'',
''rating'': 4.45, ''review_count'': 2237}'
- '{''long_web_name'': ''Холодильник Haier C4F740CDBGU1 черный'', ''price'': 94999.0,
''description'': '''', ''rating'': 4.77, ''review_count'': 21}'
- '{''long_web_name'': ''Смарт-часы Samsung Galaxy Watch4 40 мм Rose Gold (SM-R860NZDACIS)'',
''price'': 18790.0, ''url'': ''https://megamarket.ru/catalog/details/smart-chasy-samsung-fresh-small-rose-gold-sm-r860nzdacis-100029004579/'',
''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-89/034/461/791/922/42/100029004579b0.jpg'',
''id'': ''100029004579_146899'', ''description'': ''Совместимость с IOS отсутствует.'',
''rating'': 4.76, ''review_count'': 87}'
- source_sentence: Здравствуйте! Подскажите, пожалуйста, у вас есть наушники, которые
подходят для профессионального использования при ремонте и тестировании техники?
Желательно мониторные и с хорошим качеством звука.
sentences:
- '{''long_web_name'': ''Картридж для матричного принтера CACTUS CS-ERC27 (CS-ERC27)
черный, совместимый'', ''price'': 263.0, ''url'': ''https://megamarket.ru/catalog/details/kartridzh-dlya-matrichnogo-printera-cactus-cs-erc27-cs-erc27-chernyy-sovmestimyy-100030714541/'',
''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-17/974/600/623/515/38/100030714541b0.jpg'',
''id'': ''100030714541_14154'', ''description'': '''', ''rating'': 5.0, ''review_count'':
1}'
- '{''long_web_name'': ''SSD накопитель Samsung 980 PRO M.2 2280 1 ТБ (MZ-V8P1T0BW)
подходит для PS5'', ''price'': 13100.0, ''url'': ''https://megamarket.ru/catalog/details/vnutrenniy-ssd-nakopitel-samsung-980-pro-1tb-mz-v8p1t0bw-100028165060/'',
''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-58/101/921/992/616/31/100028165060b0.jpg'',
''id'': ''100028165060_90492'', ''description'': ''Накопитель M.2 SSD Samsung
980 PRO MZ-V8P1T0BW со скоростью до 7000 Мбит/сек в режиме последовательного чтения
обеспечивает высокий уровень производительности аппаратной платформы при рендеринге,
визуализации, в программах с 3D графикой, а также при обработке игровых ресурсов.
Подключается к материнской плате через разъем M.2. Интерфейс PCI-E 4.0 x4 с поддержкой
NVMe и структурой памяти 3D TLC NAND — диск отличается высокой пропускной способностью
передачи данных. Объем памяти 1000 ГБ — позволяет хранить большой объем информации.
Алгоритм термоконтроля Dynamic Thermal Guard автоматически управляет температурой
и регулирует энергопотребление для повышения стабильности. При помощи фирменного
программного обеспечения Samsung Magician можно контролировать состояние диска,
объем, температуру и другие параметры.'', ''rating'': 4.85, ''review_count'':
1056}'
- '{''id'': ''9628c865-82ac-4c81-817d-5c414715af2d'', ''externalId'': ''100052027418_149597'',
''title'': ''Проводные наушники Samsung EO-IC100 White'', ''price'': 1440.0, ''url'':
''https://megamarket.ru/catalog/details/naushniki-mic-samsung-eo-ic100bwegru-white-type-c-100052027418_149597'',
''imageLink'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/147/185/808/101/812/4/100052027418b0.jpg'',
''description'': ''<p>Проводные наушники Samsung EO-IC100 White – это стильное
устройство, которое обеспечивает качественное звучание любимых композиций.</p>\n<h2>Погружение
в музыку</h2>\n<p>С помощью наушников пользователь может наслаждаться любимыми
треками в любое время. Они оснащены встроенным микрофоном, который позволяет отвечать
на звонки прямо во время прогулки или поездки. Другие технические параметры:</p>\n<ul>\n<li>Встроенный
аккумулятор обеспечивает автономную работу устройства в течение восьми часов.</li>\n<li>Закрытая
конструкция наушников создает эффект полного погружения в музыку.</li>\n<li>Динамические
излучатели воспроизводят чистый и детализированный звук.</li>\n</ul>\n<p>Корпус
выполнен из прочного пластика, а амбушюры – из мягкого силикона. Устройство удобно
носить длительное время, оно не вызывает дискомфорта даже при активных движениях.</p>'',
''rating'': 4.4, ''reviewCount'': 30, ''extraInfo'': ''''}'
pipeline_tag: sentence-similarity
library_name: sentence-transformers
metrics:
- cosine_accuracy
- cosine_accuracy_threshold
- cosine_f1
- cosine_f1_threshold
- cosine_precision
- cosine_recall
- cosine_ap
- cosine_mcc
model-index:
- name: SentenceTransformer based on sergeyzh/rubert-tiny-turbo
results:
- task:
type: binary-classification
name: Binary Classification
dataset:
name: item classification
type: item-classification
metrics:
- type: cosine_accuracy
value: 0.946987951807229
name: Cosine Accuracy
- type: cosine_accuracy_threshold
value: 0.776970386505127
name: Cosine Accuracy Threshold
- type: cosine_f1
value: 0.8654895666131622
name: Cosine F1
- type: cosine_f1_threshold
value: 0.7680637836456299
name: Cosine F1 Threshold
- type: cosine_precision
value: 0.7823563551944284
name: Cosine Precision
- type: cosine_recall
value: 0.9683908045977011
name: Cosine Recall
- type: cosine_ap
value: 0.7985956006356972
name: Cosine Ap
- type: cosine_mcc
value: 0.8402021557690131
name: Cosine Mcc
---
# SentenceTransformer based on sergeyzh/rubert-tiny-turbo
This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [sergeyzh/rubert-tiny-turbo](https://huggingface.co/sergeyzh/rubert-tiny-turbo). It maps sentences & paragraphs to a 312-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
## Model Details
### Model Description
- **Model Type:** Sentence Transformer
- **Base model:** [sergeyzh/rubert-tiny-turbo](https://huggingface.co/sergeyzh/rubert-tiny-turbo) <!-- at revision 93769a3baad2b037e5c2e4312fccf6bcfe082bf1 -->
- **Maximum Sequence Length:** 2048 tokens
- **Output Dimensionality:** 312 dimensions
- **Similarity Function:** Cosine Similarity
<!-- - **Training Dataset:** Unknown -->
<!-- - **Language:** Unknown -->
<!-- - **License:** Unknown -->
### Model Sources
- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
### Full Model Architecture
```
SentenceTransformer(
(0): Transformer({'max_seq_length': 2048, 'do_lower_case': False}) with Transformer model: BertModel
(1): Pooling({'word_embedding_dimension': 312, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Normalize()
)
```
## Usage
### Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
```bash
pip install -U sentence-transformers
```
Then you can load this model and run inference.
```python
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("denis-gordeev/reranker_dialog_items_biencoder_rubert-tiny-turbo-7")
# Run inference
sentences = [
'Здравствуйте! Подскажите, пожалуйста, у вас есть наушники, которые подходят для профессионального использования при ремонте и тестировании техники? Желательно мониторные и с хорошим качеством звука.',
"{'id': '9628c865-82ac-4c81-817d-5c414715af2d', 'externalId': '100052027418_149597', 'title': 'Проводные наушники Samsung EO-IC100 White', 'price': 1440.0, 'url': 'https://megamarket.ru/catalog/details/naushniki-mic-samsung-eo-ic100bwegru-white-type-c-100052027418_149597', 'imageLink': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/147/185/808/101/812/4/100052027418b0.jpg', 'description': '<p>Проводные наушники Samsung EO-IC100 White – это стильное устройство, которое обеспечивает качественное звучание любимых композиций.</p>\\n<h2>Погружение в музыку</h2>\\n<p>С помощью наушников пользователь может наслаждаться любимыми треками в любое время. Они оснащены встроенным микрофоном, который позволяет отвечать на звонки прямо во время прогулки или поездки. Другие технические параметры:</p>\\n<ul>\\n<li>Встроенный аккумулятор обеспечивает автономную работу устройства в течение восьми часов.</li>\\n<li>Закрытая конструкция наушников создает эффект полного погружения в музыку.</li>\\n<li>Динамические излучатели воспроизводят чистый и детализированный звук.</li>\\n</ul>\\n<p>Корпус выполнен из прочного пластика, а амбушюры – из мягкого силикона. Устройство удобно носить длительное время, оно не вызывает дискомфорта даже при активных движениях.</p>', 'rating': 4.4, 'reviewCount': 30, 'extraInfo': ''}",
"{'long_web_name': 'Картридж для матричного принтера CACTUS CS-ERC27 (CS-ERC27) черный, совместимый', 'price': 263.0, 'url': 'https://megamarket.ru/catalog/details/kartridzh-dlya-matrichnogo-printera-cactus-cs-erc27-cs-erc27-chernyy-sovmestimyy-100030714541/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-17/974/600/623/515/38/100030714541b0.jpg', 'id': '100030714541_14154', 'description': '', 'rating': 5.0, 'review_count': 1}",
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 312]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
```
<!--
### Direct Usage (Transformers)
<details><summary>Click to see the direct usage in Transformers</summary>
</details>
-->
<!--
### Downstream Usage (Sentence Transformers)
You can finetune this model on your own dataset.
<details><summary>Click to expand</summary>
</details>
-->
<!--
### Out-of-Scope Use
*List how the model may foreseeably be misused and address what users ought not to do with the model.*
-->
## Evaluation
### Metrics
#### Binary Classification
* Dataset: `item-classification`
* Evaluated with [<code>BinaryClassificationEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.BinaryClassificationEvaluator)
| Metric | Value |
|:--------------------------|:-----------|
| cosine_accuracy | 0.947 |
| cosine_accuracy_threshold | 0.777 |
| cosine_f1 | 0.8655 |
| cosine_f1_threshold | 0.7681 |
| cosine_precision | 0.7824 |
| cosine_recall | 0.9684 |
| **cosine_ap** | **0.7986** |
| cosine_mcc | 0.8402 |
<!--
## Bias, Risks and Limitations
*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
-->
<!--
### Recommendations
*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
-->
## Training Details
### Training Dataset
#### Unnamed Dataset
* Size: 49,285 training samples
* Columns: <code>anchor</code>, <code>text</code>, and <code>label</code>
* Approximate statistics based on the first 1000 samples:
| | anchor | text | label |
|:--------|:-----------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------|:------------------------------------------------|
| type | string | string | int |
| details | <ul><li>min: 19 tokens</li><li>mean: 35.78 tokens</li><li>max: 56 tokens</li></ul> | <ul><li>min: 55 tokens</li><li>mean: 352.41 tokens</li><li>max: 1356 tokens</li></ul> | <ul><li>0: ~85.90%</li><li>1: ~14.10%</li></ul> |
* Samples:
| anchor | text | label |
|:--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------|
| <code>Здравствуйте! Я хочу купить Smart-TV приставку для просмотра фильмов и видео. Можете посоветовать какие-то модели? Желательно, чтобы приставка была быстрая и поддерживала 4K.</code> | <code>{'long_web_name': 'Смарт-приставка Xiaomi TV Box S 2nd Gen 2/8 черная (PFJ4167RU)', 'price': 6290.0, 'description': 'НОВИНКА 2023 ГОДА! 2-е поколение потокового медиаплеера Xiaomi TV Box S. ТВ приставка Xiaomi TV Box S 2nd Gen (PFJ4167RU). 4х ядерный процессор Cortex-A55 Графический процессор-ARM Mali G31 MP2 Dolby Vision 4K Ultra HDR 10+ Встроены Google TV и Google Assistant 360° Bluetooth и ИК-пульт дистанционного управления Двухдиапазонный Wi-Fi Качество изображения 4K Ultra HD Беспроводное дублирование экрана Улучшенный угол обзора', 'rating': 4.86, 'review_count': 919}</code> | <code>1</code> |
| <code>Здравствуйте! Я хочу купить Smart-TV приставку для просмотра фильмов и видео. Можете посоветовать какие-то модели? Желательно, чтобы приставка была быстрая и поддерживала 4K.</code> | <code>{'long_web_name': 'Смартфон Honor Honor 90 12/512GB изумрудный зеленый (5109ATRU)', 'price': 40890.0, 'url': 'https://megamarket.ru/catalog/details/smartfon-honor-honor-90-12-512gb-izumrudnyy-zelenyy-5109atru-100063902396/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-97/523/126/541/612/13/100063902396b0.jpg', 'id': '100063902396_126519', 'description': '', 'rating': 4.86, 'review_count': 27}</code> | <code>0</code> |
| <code>Здравствуйте! Я хочу купить Smart-TV приставку для просмотра фильмов и видео. Можете посоветовать какие-то модели? Желательно, чтобы приставка была быстрая и поддерживала 4K.</code> | <code>{'long_web_name': 'Видеокарта MSI NVIDIA GeForce RTX 3060 Gaming X LHR', 'price': 39330.0, 'url': 'https://megamarket.ru/catalog/details/videokarta-msi-geforce-rtx-3060-gaming-x-12g-100028302832/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/179/595/992/532/211/22/100028302832b0.png', 'id': '100028302832_40440', 'description': '<p>Видеокарта MSI NVIDIA GeForce RTX 3060 Gaming X (LHR) (RTX 3060 GAMING X 12G) - это мощное графическое решение для настоящих геймеров. Современный дизайн и передовые технологии позволяют вам наслаждаться потрясающими игровыми впечатлениями и запускать самые требовательные игры без затруднений.</p>\n\n<h2>Потрясающая графика и высокая производительность</h2>\n\n<p>С видеокартой MSI NVIDIA GeForce RTX 3060 Gaming X вы сможете наслаждаться невероятно реалистичными и проработанными изображениями. Благодаря новейшему графическому процессору GA106 и объему видеопамяти 12 ГБ игры будут работать плавно и без лагов, а поддержка трассировки лучей ...</code> | <code>0</code> |
* Loss: [<code>ContrastiveLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#contrastiveloss) with these parameters:
```json
{
"distance_metric": "SiameseDistanceMetric.COSINE_DISTANCE",
"margin": 0.5,
"size_average": true
}
```
### Evaluation Dataset
#### Unnamed Dataset
* Size: 7,885 evaluation samples
* Columns: <code>anchor</code>, <code>text</code>, and <code>label</code>
* Approximate statistics based on the first 1000 samples:
| | anchor | text | label |
|:--------|:---------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------|:------------------------------------------------|
| type | string | string | int |
| details | <ul><li>min: 7 tokens</li><li>mean: 23.9 tokens</li><li>max: 37 tokens</li></ul> | <ul><li>min: 56 tokens</li><li>mean: 365.94 tokens</li><li>max: 1356 tokens</li></ul> | <ul><li>0: ~85.70%</li><li>1: ~14.30%</li></ul> |
* Samples:
| anchor | text | label |
|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------|
| <code>Привет! Хочу купить фитнес-браслет для отслеживания шагов и сна. Может, что-то недорогое, но с хорошей функциональностью? Подскажете, какие есть варианты?</code> | <code>{'long_web_name': 'Фитнес-браслет HUAWEI Band 8, черный матовый', 'price': 2555.0, 'description': '<p>Фитнес-браслет Huawei Band 8 (черный) — это устройство, которое помогает следить за здоровьем и физической активностью.</p>\n<h2>Помогает контролировать состояние организма</h2>\n<p>Браслет оснащен датчиком SpO2, который отслеживает уровень кислорода в крови. Также он имеет встроенный пульсометр, который позволяет узнать частоту сердцебиения. Другие параметры:</p>\n<ul>\n<li>дисплей AMOLED — отображает время, количество пройденных шагов, сожженные калории;</li>\n<li>100 спортивных режимов — можно выбрать подходящий для тренировки;</li>\n<li>гироскоп и акселерометр — определяют положение тела в пространстве и скорость движения.</li>\n</ul>\n<p>Благодаря водонепроницаемости браслет можно носить во время плавания. Корпус защищен от попадания влаги и пыли. Ремешок выполнен из силикона — мягкий и приятный на ощупь. Есть возможность регулировать длину.</p>', 'rating': 4.94, 'review_count': 7...</code> | <code>1</code> |
| <code>Привет! Хочу купить фитнес-браслет для отслеживания шагов и сна. Может, что-то недорогое, но с хорошей функциональностью? Подскажете, какие есть варианты?</code> | <code>{'long_web_name': 'Видеокарта ASUS NVIDIA GeForce RTX 4090 TUF Gaming OC Edition (TUF-RTX4090-O24G-GAMING)', 'price': 296368.0, 'url': 'https://megamarket.ru/catalog/details/videokarta-asus-tuf-rtx4090-o24g-gaming-rtx4090-100044516044/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/228/133/388/117/192/3/100044516044b9.jpg', 'id': '100044516044_59182', 'description': '<p>Видеокарта ASUS NVIDIA GeForce RTX 4090 TUF Gaming OC Edition (90YV0IE0-M0NA00) - высокопроизводительное графическое решение, которое обеспечивает невероятно реалистичную визуализацию игровых миров.</p>\n<h2>Максимальная производительность для настоящих игроков</h2>\n<p>ASUS NVIDIA GeForce RTX 4090 TUF Gaming OC Edition - это явный лидер среди видеокарт нового поколения. Она оснащена мощным графическим процессором GeForce RTX 4090 и имеет объем видеопамяти 24 ГБ GDDR6X, что обеспечивает потрясающую детализацию и плавность изображения.</p>\n<ol>\n<li>Улучшенная поддержка трассировки лучей предоставля...</code> | <code>0</code> |
| <code>Привет! Хочу купить фитнес-браслет для отслеживания шагов и сна. Может, что-то недорогое, но с хорошей функциональностью? Подскажете, какие есть варианты?</code> | <code>{'long_web_name': 'Встраиваемая варочная панель газовая Weissgauff HGG 640 BG черный', 'price': 16790.0, 'url': 'https://megamarket.ru/catalog/details/vstraivaemaya-gazovaya-panel-weissgauff-hgg-640-bg-100026765438/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/609/462/228/514/151/3/100026765438b0.jpg', 'id': '100026765438_6061', 'description': 'Встраиваемая независимая газовая панель Weissgauff шириной 60 см, исполненная в закалённом чёрном стекле - это стильное и компактное решение для вашей кухни!<br>*Ширина 60 см это европейский стандарт качества, признанный миллионами довольных покупателей по всему миру!<br>*Чёрное закаленное стекло не только роскошно выглядит, подчеркивая великолепный внешний вид данной модели, но и отлично справляется с механическими воздействиями и температурными перегрузками!<br>*Решетки из высококачественного чугуна это неизменное качество, надежность и долговечность, воплощенные в каждой детали! А особая элегантность их дизайна не тольк...</code> | <code>0</code> |
* Loss: [<code>ContrastiveLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#contrastiveloss) with these parameters:
```json
{
"distance_metric": "SiameseDistanceMetric.COSINE_DISTANCE",
"margin": 0.5,
"size_average": true
}
```
### Training Hyperparameters
#### Non-Default Hyperparameters
- `eval_strategy`: steps
- `per_device_train_batch_size`: 16
- `per_device_eval_batch_size`: 16
- `num_train_epochs`: 1
- `warmup_ratio`: 0.1
- `fp16`: True
- `load_best_model_at_end`: True
- `batch_sampler`: no_duplicates
#### All Hyperparameters
<details><summary>Click to expand</summary>
- `overwrite_output_dir`: False
- `do_predict`: False
- `eval_strategy`: steps
- `prediction_loss_only`: True
- `per_device_train_batch_size`: 16
- `per_device_eval_batch_size`: 16
- `per_gpu_train_batch_size`: None
- `per_gpu_eval_batch_size`: None
- `gradient_accumulation_steps`: 1
- `eval_accumulation_steps`: None
- `torch_empty_cache_steps`: None
- `learning_rate`: 5e-05
- `weight_decay`: 0.0
- `adam_beta1`: 0.9
- `adam_beta2`: 0.999
- `adam_epsilon`: 1e-08
- `max_grad_norm`: 1.0
- `num_train_epochs`: 1
- `max_steps`: -1
- `lr_scheduler_type`: linear
- `lr_scheduler_kwargs`: {}
- `warmup_ratio`: 0.1
- `warmup_steps`: 0
- `log_level`: passive
- `log_level_replica`: warning
- `log_on_each_node`: True
- `logging_nan_inf_filter`: True
- `save_safetensors`: True
- `save_on_each_node`: False
- `save_only_model`: False
- `restore_callback_states_from_checkpoint`: False
- `no_cuda`: False
- `use_cpu`: False
- `use_mps_device`: False
- `seed`: 42
- `data_seed`: None
- `jit_mode_eval`: False
- `use_ipex`: False
- `bf16`: False
- `fp16`: True
- `fp16_opt_level`: O1
- `half_precision_backend`: auto
- `bf16_full_eval`: False
- `fp16_full_eval`: False
- `tf32`: None
- `local_rank`: 0
- `ddp_backend`: None
- `tpu_num_cores`: None
- `tpu_metrics_debug`: False
- `debug`: []
- `dataloader_drop_last`: False
- `dataloader_num_workers`: 0
- `dataloader_prefetch_factor`: None
- `past_index`: -1
- `disable_tqdm`: False
- `remove_unused_columns`: True
- `label_names`: None
- `load_best_model_at_end`: True
- `ignore_data_skip`: False
- `fsdp`: []
- `fsdp_min_num_params`: 0
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
- `fsdp_transformer_layer_cls_to_wrap`: None
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
- `deepspeed`: None
- `label_smoothing_factor`: 0.0
- `optim`: adamw_torch
- `optim_args`: None
- `adafactor`: False
- `group_by_length`: False
- `length_column_name`: length
- `ddp_find_unused_parameters`: None
- `ddp_bucket_cap_mb`: None
- `ddp_broadcast_buffers`: False
- `dataloader_pin_memory`: True
- `dataloader_persistent_workers`: False
- `skip_memory_metrics`: True
- `use_legacy_prediction_loop`: False
- `push_to_hub`: False
- `resume_from_checkpoint`: None
- `hub_model_id`: None
- `hub_strategy`: every_save
- `hub_private_repo`: None
- `hub_always_push`: False
- `gradient_checkpointing`: False
- `gradient_checkpointing_kwargs`: None
- `include_inputs_for_metrics`: False
- `include_for_metrics`: []
- `eval_do_concat_batches`: True
- `fp16_backend`: auto
- `push_to_hub_model_id`: None
- `push_to_hub_organization`: None
- `mp_parameters`:
- `auto_find_batch_size`: False
- `full_determinism`: False
- `torchdynamo`: None
- `ray_scope`: last
- `ddp_timeout`: 1800
- `torch_compile`: False
- `torch_compile_backend`: None
- `torch_compile_mode`: None
- `dispatch_batches`: None
- `split_batches`: None
- `include_tokens_per_second`: False
- `include_num_input_tokens_seen`: False
- `neftune_noise_alpha`: None
- `optim_target_modules`: None
- `batch_eval_metrics`: False
- `eval_on_start`: False
- `use_liger_kernel`: False
- `eval_use_gather_object`: False
- `average_tokens_across_devices`: False
- `prompts`: None
- `batch_sampler`: no_duplicates
- `multi_dataset_batch_sampler`: proportional
</details>
### Training Logs
| Epoch | Step | Training Loss | Validation Loss | item-classification_cosine_ap |
|:----------:|:--------:|:-------------:|:---------------:|:-----------------------------:|
| 0 | 0 | - | 0.0237 | 0.4047 |
| 0.0649 | 100 | 0.0132 | - | - |
| 0.1298 | 200 | 0.0062 | - | - |
| 0.1622 | 250 | - | 0.0037 | 0.7734 |
| 0.1947 | 300 | 0.0053 | - | - |
| 0.2596 | 400 | 0.0053 | - | - |
| 0.3245 | 500 | 0.004 | 0.0043 | 0.7855 |
| 0.3894 | 600 | 0.0049 | - | - |
| 0.4543 | 700 | 0.0044 | - | - |
| 0.4867 | 750 | - | 0.0039 | 0.7641 |
| 0.5191 | 800 | 0.0039 | - | - |
| 0.5840 | 900 | 0.0043 | - | - |
| 0.6489 | 1000 | 0.0036 | 0.0035 | 0.7709 |
| 0.7138 | 1100 | 0.0042 | - | - |
| 0.7787 | 1200 | 0.0036 | - | - |
| 0.8112 | 1250 | - | 0.0036 | 0.7956 |
| 0.8436 | 1300 | 0.0038 | - | - |
| 0.9085 | 1400 | 0.0038 | - | - |
| **0.9734** | **1500** | **0.0032** | **0.0035** | **0.7986** |
| 1.0 | 1541 | - | 0.0035 | 0.7986 |
* The bold row denotes the saved checkpoint.
### Framework Versions
- Python: 3.10.16
- Sentence Transformers: 3.4.0.dev0
- Transformers: 4.47.1
- PyTorch: 2.5.1+cu124
- Accelerate: 1.2.1
- Datasets: 3.2.0
- Tokenizers: 0.21.0
## Citation
### BibTeX
#### Sentence Transformers
```bibtex
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
```
#### ContrastiveLoss
```bibtex
@inproceedings{hadsell2006dimensionality,
author={Hadsell, R. and Chopra, S. and LeCun, Y.},
booktitle={2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'06)},
title={Dimensionality Reduction by Learning an Invariant Mapping},
year={2006},
volume={2},
number={},
pages={1735-1742},
doi={10.1109/CVPR.2006.100}
}
```
<!--
## Glossary
*Clearly define terms in order to be accessible across audiences.*
-->
<!--
## Model Card Authors
*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
-->
<!--
## Model Card Contact
*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
--> |