nlp-waseda
/

roberta-large-japanese-seq512

Model card Files Files and versions

dkawahara commited on Jun 13, 2022

Commit

40948ff

·

1 Parent(s): 07adfbf

Updated README.md.

Files changed (1) hide show

README.md +3 -3

README.md CHANGED Viewed

@@ -9,7 +9,7 @@ widget:
 - text: "早稲田 大学 で 自然 言語 処理 を [MASK] する 。"
 ---
-# nlp-waseda/roberta-large-japanese
 ## Model description
@@ -20,8 +20,8 @@ This is a Japanese RoBERTa large model pretrained on Japanese Wikipedia and the
 You can use this model for masked language modeling as follows:
 ```python
 from transformers import AutoTokenizer, AutoModelForMaskedLM
-tokenizer = AutoTokenizer.from_pretrained("nlp-waseda/roberta-large-japanese")
-model = AutoModelForMaskedLM.from_pretrained("nlp-waseda/roberta-large-japanese")
 sentence = '早稲田 大学 で 自然 言語 処理 を [MASK] する 。' # input should be segmented into words by Juman++ in advance
 encoding = tokenizer(sentence, return_tensors='pt')

 - text: "早稲田 大学 で 自然 言語 処理 を [MASK] する 。"
 ---
+# nlp-waseda/roberta-large-japanese-seq512
 ## Model description
 You can use this model for masked language modeling as follows:
 ```python
 from transformers import AutoTokenizer, AutoModelForMaskedLM
+tokenizer = AutoTokenizer.from_pretrained("nlp-waseda/roberta-large-japanese-seq512")
+model = AutoModelForMaskedLM.from_pretrained("nlp-waseda/roberta-large-japanese-seq512")
 sentence = '早稲田 大学 で 自然 言語 処理 を [MASK] する 。' # input should be segmented into words by Juman++ in advance
 encoding = tokenizer(sentence, return_tensors='pt')