CrossEncoder based on BAAI/bge-reranker-v2-m3
This is a Cross Encoder model finetuned from BAAI/bge-reranker-v2-m3 using the sentence-transformers library. It computes scores for pairs of texts, which can be used for text pair classification.
Model Details
Model Description
- Model Type: Cross Encoder
- Base model: BAAI/bge-reranker-v2-m3
- Maximum Sequence Length: 8192 tokens
- Number of Output Labels: 3 labels
Model Sources
- Documentation: Sentence Transformers Documentation
- Documentation: Cross Encoder Documentation
- Repository: Sentence Transformers on GitHub
- Hugging Face: Cross Encoders on Hugging Face
Usage
Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import CrossEncoder
# Download from the 🤗 Hub
model = CrossEncoder("cross_encoder_model_id")
# Get scores for pairs of texts
pairs = [
['[PROMPT]\nVào năm 1951, sau khi đến Việt Nam, John F. Kennedy đã hỏi tướng De Lattre - người lúc đó là Cao ủy kiêm Tổng chỉ huy quân Pháp ở Đông Dương - về lý do tại sao viện trợ của Nga không thể giúp Pháp chiến thắng. Chức vụ của De Lattre là gì?\n[CONTEXT]\nTháng 10/1951, nghị sĩ John F. Kennedy - về sau trở thành Tổng thống Mỹ - đã đến Việt Nam để khảo sát. Lúc đó, Mỹ đã tài trợ một cách hào phóng cho chiến tranh của thực dân Pháp ở Đông Dương, nhưng Kennedy tự hỏi: tại sao viện trợ Mỹ vẫn không thể giúp Pháp chiến thắng? Ông đã hỏi tướng De Lattre, Cao ủy kiêm Tổng chỉ huy quân Pháp ở Đông Dương rằng: “Tại sao ông có thể trông mong người Việt Nam (Quốc gia Việt Nam) chiến đấu (chống lại Việt Minh) để duy trì nước họ như một bộ phận của Pháp?". Về lại Mỹ, Kennedy phát biểu ngày 15/11/1951 trên đài phát thanh:', '[RESPONSE]\nVào năm 1951, John F. Kennedy đã hỏi tướng De Lattre, người lúc đó là Thủ tướng Pháp, về lý do tại sao viện trợ của Nga không thể giúp Pháp chiến thắng ở Đông Dương.'],
['[PROMPT]\nMặc dù cải cách hành chính của Nhật Bản đã được thực hiện từ tháng 1 năm 2001 và được cho là đã mang lại kết quả đáng khích lệ, nhưng nền kinh tế Nhật Bản lại tăng trưởng vượt bậc với tốc độ trung bình hơn 5% mỗi năm trong giai đoạn 2001-2015. Vậy tình hình của việc cải cách hành chính đang diễn ra như thế nào?\n[CONTEXT]\nNhật Bản đang xúc tiến 6 chương trình cải cách lớn trong đó có cải cách cơ cấu kinh tế, giảm thâm hụt ngân sách, cải cách khu vực tài chính và sắp xếp lại cơ cấu chính phủ,... Cải cách hành chính của Nhật được thực hiện từ tháng 1 năm 2001. Dù diễn ra chậm chạp nhưng cải cách đang đi dần vào quỹ đạo, trở thành xu thế không thể đảo ngược ở Nhật Bản và gần đây đã đem lại kết quả đáng khích lệ, nền kinh tế Nhật đã phục hồi và tăng trưởng trở lại, tuy nhiên trong giai đoạn 2001-2015, kinh tế Nhật vẫn chỉ đạt được tốc độ tăng trưởng rất chậm, trung bình chỉ dưới 1% mỗi năm.', '[RESPONSE]\nCác cải cách hành chính của Nhật Bản được hỗ trợ bởi việc áp dụng công nghệ tiên tiến từ các nước phát triển khác như Mỹ và Đức, điều này giúp tối ưu hóa quy trình và nâng cao hiệu quả quản lý hành chính.'],
['[PROMPT]\nBirminham đóng vai trò wan trọng vè công việc gi?\n[CONTEXT]\nBirmingham từng nổi bật trong vai trò là một trung tâm sản xuất và kỹ thuật, song kinh tế thành phố hiện nay do khu vực dịch vụ chi phối, đến năm 2012 khu vực này chiếm 88% số công việc của thành phố. Birmingham là trung tâm lớn nhất tại Anh Quốc về công việc trong hành chính công, giáo dục và y tế; và sau Leeds là trung tâm lớn thứ nhì ngoài Luân Đôn về công việc trong các khu vực tài chính và kinh doanh khác. Birmingham được xếp hạng là một thành phố thế giới cấp beta-, đứng sau Luân Đôn và Manchester tại Anh Quốc, và nền kinh tế đại đô thị quanh thành phố lớn thứ nhì tại Anh Quốc với GDP PPP đạt 121,1 tỉ USD vào năm 2014. Các công ty lớn có trụ sở tại Birmingham gồm công ty kỹ thuật IMI plc, và tính cả vùng đại đô thị thì Birmingham là nơi tập trung nhiều công ty lớn chỉ sau Luân Đôn và vùng đông nam. Thành phố có các hạ tầng lớn như Trung tâm Triển lãm Quốc gia và Trung tâm Hội nghị Quốc tế, thu hút 42% tổng số hội nghị và hội chợ triển lãm tại Anh Quốc.', '[RESPONSE]\nBirmingham đóng vai trò quan trọng trong công việc hành chính công, giáo dục, y tế và là trung tâm lớn thứ nhì ngoài Luân Đôn về công việc tài chính và kinh doanh.'],
['[PROMPT]\nNhững khu rừng nào nằm ở phía Đông và Tây trong nội thành Paris, và có phải chúng được quy hoạch bởi Napoleon Bonaparte không?\n[CONTEXT]\nTới thời Đệ nhị đế chế, việc tạo ra các không gian xanh trở nên cần thiết cho một thành phố có dân số đang phát triển nhanh. Với sự chỉ đạo của kỹ sư Jean-Charles Alphand và họa sĩ phong cảnh Jean-Pierre Barillet-Deschamps, các khu vườn của Paris mới có được bộ mặt như hiện nay. Rừng Boulogne và rừng Vincennes, nằm ngoài Paris, được bố trí tôn trọng điểm cực tây và điểm cực đông của nội thành thành phố. Một số khu vườn khác trong trung tâm cũng được bố trí lại cùng các không gian thoáng đãng được mở ra ở các khu phố. Ở các quận mới hơn, một số công viên quan trọng được quy hoạch: Monceau, Montsouris, Buttes-Chaumont đều do kiến trúc sư của Napoléon III dự kiến.', '[RESPONSE]\nRừng Boulogne ở phía Tây và rừng Vincennes ở phía Đông nội thành Paris. Chúng không được quy hoạch bởi Napoleon Bonaparte mà dưới thời Đệ nhị đế chế, với sự chỉ đạo của kỹ sư Jean-Charles Alphand.'],
["[PROMPT]\nCông trình nào được xây dựng lại vào thập niên 50 và 60 của thế kỉ XX, trong khi dân số thành phố đạt đỉnh vào năm 1970 với 1,113,000 cư dân?\n[CONTEXT]\nThành phố trải qua tái phát triển quy mô lớn trong các thập niên 1950 và 1960. Quá trình này gồm có các bất động sản cao tầng quy mô lớn như Castle Vale. Bull Ring được xây dựng lại và ga Birmingham New Street được tái phát triển. Trong các thập niên sau Chiến tranh thế giới thứ hai, thành phần dân tộc tại Birmingham có thay đổi quan trọng, do thành phố tiếp nhận các dòng di dân đến từ các quốc gia trong và ngoài Thịnh vượng chung. The city's population peaked in 1951 at 1,113,000 residents.", '[RESPONSE]\nDân số thành phố đạt đỉnh vào năm 1970 với 1,113,000 cư dân, và trong thập niên 50 và 60, các khu vực như Castle Vale và Bull Ring không được tái phát triển, mà thay vào đó là ga Birmingham New Street.'],
]
scores = model.predict(pairs)
print(scores.shape)
# (5, 3)
Training Details
Training Dataset
Unnamed Dataset
- Size: 5,759 training samples
- Columns:
sentence_0,sentence_1, andlabel - Approximate statistics based on the first 1000 samples:
sentence_0 sentence_1 label type string string int details - min: 548 characters
- mean: 972.34 characters
- max: 2962 characters
- min: 32 characters
- mean: 192.04 characters
- max: 314 characters
- 0: ~32.60%
- 1: ~34.30%
- 2: ~33.10%
- Samples:
sentence_0 sentence_1 label [PROMPT]
Vào năm 1951, sau khi đến Việt Nam, John F. Kennedy đã hỏi tướng De Lattre - người lúc đó là Cao ủy kiêm Tổng chỉ huy quân Pháp ở Đông Dương - về lý do tại sao viện trợ của Nga không thể giúp Pháp chiến thắng. Chức vụ của De Lattre là gì?
[CONTEXT]
Tháng 10/1951, nghị sĩ John F. Kennedy - về sau trở thành Tổng thống Mỹ - đã đến Việt Nam để khảo sát. Lúc đó, Mỹ đã tài trợ một cách hào phóng cho chiến tranh của thực dân Pháp ở Đông Dương, nhưng Kennedy tự hỏi: tại sao viện trợ Mỹ vẫn không thể giúp Pháp chiến thắng? Ông đã hỏi tướng De Lattre, Cao ủy kiêm Tổng chỉ huy quân Pháp ở Đông Dương rằng: “Tại sao ông có thể trông mong người Việt Nam (Quốc gia Việt Nam) chiến đấu (chống lại Việt Minh) để duy trì nước họ như một bộ phận của Pháp?". Về lại Mỹ, Kennedy phát biểu ngày 15/11/1951 trên đài phát thanh:[RESPONSE]
Vào năm 1951, John F. Kennedy đã hỏi tướng De Lattre, người lúc đó là Thủ tướng Pháp, về lý do tại sao viện trợ của Nga không thể giúp Pháp chiến thắng ở Đông Dương.1[PROMPT]
Mặc dù cải cách hành chính của Nhật Bản đã được thực hiện từ tháng 1 năm 2001 và được cho là đã mang lại kết quả đáng khích lệ, nhưng nền kinh tế Nhật Bản lại tăng trưởng vượt bậc với tốc độ trung bình hơn 5% mỗi năm trong giai đoạn 2001-2015. Vậy tình hình của việc cải cách hành chính đang diễn ra như thế nào?
[CONTEXT]
Nhật Bản đang xúc tiến 6 chương trình cải cách lớn trong đó có cải cách cơ cấu kinh tế, giảm thâm hụt ngân sách, cải cách khu vực tài chính và sắp xếp lại cơ cấu chính phủ,... Cải cách hành chính của Nhật được thực hiện từ tháng 1 năm 2001. Dù diễn ra chậm chạp nhưng cải cách đang đi dần vào quỹ đạo, trở thành xu thế không thể đảo ngược ở Nhật Bản và gần đây đã đem lại kết quả đáng khích lệ, nền kinh tế Nhật đã phục hồi và tăng trưởng trở lại, tuy nhiên trong giai đoạn 2001-2015, kinh tế Nhật vẫn chỉ đạt được tốc độ tăng trưởng rất chậm, trung bình chỉ dưới 1% mỗi năm.[RESPONSE]
Các cải cách hành chính của Nhật Bản được hỗ trợ bởi việc áp dụng công nghệ tiên tiến từ các nước phát triển khác như Mỹ và Đức, điều này giúp tối ưu hóa quy trình và nâng cao hiệu quả quản lý hành chính.2[PROMPT]
Birminham đóng vai trò wan trọng vè công việc gi?
[CONTEXT]
Birmingham từng nổi bật trong vai trò là một trung tâm sản xuất và kỹ thuật, song kinh tế thành phố hiện nay do khu vực dịch vụ chi phối, đến năm 2012 khu vực này chiếm 88% số công việc của thành phố. Birmingham là trung tâm lớn nhất tại Anh Quốc về công việc trong hành chính công, giáo dục và y tế; và sau Leeds là trung tâm lớn thứ nhì ngoài Luân Đôn về công việc trong các khu vực tài chính và kinh doanh khác. Birmingham được xếp hạng là một thành phố thế giới cấp beta-, đứng sau Luân Đôn và Manchester tại Anh Quốc, và nền kinh tế đại đô thị quanh thành phố lớn thứ nhì tại Anh Quốc với GDP PPP đạt 121,1 tỉ USD vào năm 2014. Các công ty lớn có trụ sở tại Birmingham gồm công ty kỹ thuật IMI plc, và tính cả vùng đại đô thị thì Birmingham là nơi tập trung nhiều công ty lớn chỉ sau Luân Đôn và vùng đông nam. Thành phố có các hạ tầng lớn như Trung tâm Triển lãm Quốc gia và Trung tâm Hội nghị Quốc tế, thu hút 42% tổng số hộ...[RESPONSE]
Birmingham đóng vai trò quan trọng trong công việc hành chính công, giáo dục, y tế và là trung tâm lớn thứ nhì ngoài Luân Đôn về công việc tài chính và kinh doanh.0 - Loss:
CrossEntropyLoss
Training Hyperparameters
Non-Default Hyperparameters
per_device_train_batch_size: 4per_device_eval_batch_size: 4num_train_epochs: 1fp16: True
All Hyperparameters
Click to expand
overwrite_output_dir: Falsedo_predict: Falseeval_strategy: noprediction_loss_only: Trueper_device_train_batch_size: 4per_device_eval_batch_size: 4per_gpu_train_batch_size: Noneper_gpu_eval_batch_size: Nonegradient_accumulation_steps: 1eval_accumulation_steps: Nonetorch_empty_cache_steps: Nonelearning_rate: 5e-05weight_decay: 0.0adam_beta1: 0.9adam_beta2: 0.999adam_epsilon: 1e-08max_grad_norm: 1num_train_epochs: 1max_steps: -1lr_scheduler_type: linearlr_scheduler_kwargs: {}warmup_ratio: 0.0warmup_steps: 0log_level: passivelog_level_replica: warninglog_on_each_node: Truelogging_nan_inf_filter: Truesave_safetensors: Truesave_on_each_node: Falsesave_only_model: Falserestore_callback_states_from_checkpoint: Falseno_cuda: Falseuse_cpu: Falseuse_mps_device: Falseseed: 42data_seed: Nonejit_mode_eval: Falseuse_ipex: Falsebf16: Falsefp16: Truefp16_opt_level: O1half_precision_backend: autobf16_full_eval: Falsefp16_full_eval: Falsetf32: Nonelocal_rank: 0ddp_backend: Nonetpu_num_cores: Nonetpu_metrics_debug: Falsedebug: []dataloader_drop_last: Falsedataloader_num_workers: 0dataloader_prefetch_factor: Nonepast_index: -1disable_tqdm: Falseremove_unused_columns: Truelabel_names: Noneload_best_model_at_end: Falseignore_data_skip: Falsefsdp: []fsdp_min_num_params: 0fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap: Noneaccelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}parallelism_config: Nonedeepspeed: Nonelabel_smoothing_factor: 0.0optim: adamw_torch_fusedoptim_args: Noneadafactor: Falsegroup_by_length: Falselength_column_name: lengthddp_find_unused_parameters: Noneddp_bucket_cap_mb: Noneddp_broadcast_buffers: Falsedataloader_pin_memory: Truedataloader_persistent_workers: Falseskip_memory_metrics: Trueuse_legacy_prediction_loop: Falsepush_to_hub: Falseresume_from_checkpoint: Nonehub_model_id: Nonehub_strategy: every_savehub_private_repo: Nonehub_always_push: Falsehub_revision: Nonegradient_checkpointing: Falsegradient_checkpointing_kwargs: Noneinclude_inputs_for_metrics: Falseinclude_for_metrics: []eval_do_concat_batches: Truefp16_backend: autopush_to_hub_model_id: Nonepush_to_hub_organization: Nonemp_parameters:auto_find_batch_size: Falsefull_determinism: Falsetorchdynamo: Noneray_scope: lastddp_timeout: 1800torch_compile: Falsetorch_compile_backend: Nonetorch_compile_mode: Noneinclude_tokens_per_second: Falseinclude_num_input_tokens_seen: Falseneftune_noise_alpha: Noneoptim_target_modules: Nonebatch_eval_metrics: Falseeval_on_start: Falseuse_liger_kernel: Falseliger_kernel_config: Noneeval_use_gather_object: Falseaverage_tokens_across_devices: Falseprompts: Nonebatch_sampler: batch_samplermulti_dataset_batch_sampler: proportionalrouter_mapping: {}learning_rate_mapping: {}
Training Logs
| Epoch | Step | Training Loss |
|---|---|---|
| 0.3472 | 500 | 0.8217 |
| 0.6944 | 1000 | 0.7103 |
| 0.3472 | 500 | 0.7214 |
| 0.6944 | 1000 | 0.7183 |
Framework Versions
- Python: 3.12.11
- Sentence Transformers: 5.1.1
- Transformers: 4.56.2
- PyTorch: 2.8.0+cu128
- Accelerate: 1.10.1
- Datasets: 4.1.1
- Tokenizers: 0.22.1
Citation
BibTeX
Sentence Transformers
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
- Downloads last month
- 4
Model tree for htNghiaaa/dsc25-bge-reranker-finetuned-kfold5-v1
Base model
BAAI/bge-reranker-v2-m3