moonshotai
/

Kimi-K2-Instruct-0905

Text Generation

Model card Files Files and versions

bigmoyan commited on 6 days ago

Commit

12d9c7c

·

verified ·

1 Parent(s): 94a4053

fix-vocab-size (#17)

- fix vocab size (15c1aa443e6aa5877a0aef051055cf54ea01c85c)

Files changed (1) hide show

tokenization_kimi.py +1 -1

tokenization_kimi.py CHANGED Viewed

@@ -104,7 +104,7 @@ class TikTokenTokenizer(PreTrainedTokenizer):
         self.special_tokens = {
             special_tokens_mapping.get(i, f"<|reserved_token_{i}|>"): i
             for i in range(
-                num_base_tokens, num_base_tokens + self.num_reserved_special_tokens + 2
             )
         }

         self.special_tokens = {
             special_tokens_mapping.get(i, f"<|reserved_token_{i}|>"): i
             for i in range(
+                num_base_tokens, num_base_tokens + self.num_reserved_special_tokens
             )
         }