and get access to the augmented documentation experience
Collaborate on models, datasets and Spaces
Faster examples with accelerated inference
Switch between documentation themes
to get started
Quiz de sfârșit de capitol
Hai să testăm ceea ce ai învățat în acest capitol!
1. Când ar trebui să antrenezi un nou tokenizer?
2. Care este avantajul utilizării unui generator de liste de texte în comparație cu o listă de liste de texte atunci când utilizați train_new_from_iterator() ?
3. Care sunt avantajele utilizării unui tokenizer “rapid”?
4. Cum tratează pipelineul token-classification entitățile care se întind pe mai mulți tokeni?
5. Cum gestionează pipelineul question-answering contextele lungi?
6. Ce este normalizarea?
7. Ce este pre-tokenizarea pentru un subword tokenizer?
8. Selectați propozițiile care se aplică modelului de tokenizare BPE.
9. Selectați propozițiile care se aplică modelului de tokenizare WordPiece.
10. Selectați propozițiile care se aplică modelului de tokenizare Unigram.