Blenderbot
免責事項: 何か奇妙なものを見つけた場合は、 Github Issue を報告してください。
Overview
Section titled “Overview”Blender チャットボット モデルは、Recipes for building an open-domain chatbot Stephen Roller、Emily Dinan、Naman Goyal、Da Ju、Mary Williamson、yinghan Liu、で提案されました。 ジン・シュー、マイル・オット、カート・シャスター、エリック・M・スミス、Y-ラン・ブーロー、ジェイソン・ウェストン、2020年4月30日。
論文の要旨は次のとおりです。
オープンドメインのチャットボットの構築は、機械学習研究にとって難しい分野です。これまでの研究では次のことが示されていますが、 ニューラル モデルをパラメーターの数とトレーニング対象のデータのサイズでスケーリングすると、結果が向上します。 高性能のチャットボットには他の要素も重要であることを示します。良い会話には多くのことが必要です 会話の専門家がシームレスに融合するスキル: 魅力的な話のポイントを提供し、話を聞く 一貫した態度を維持しながら、知識、共感、個性を適切に表現する ペルソナ。適切なトレーニング データと選択が与えられた場合、大規模モデルがこれらのスキルを学習できることを示します。 世代戦略。 90M、2.7B、9.4B パラメーター モデルを使用してこれらのレシピのバリアントを構築し、モデルを作成します。 コードは公開されています。人間による評価では、当社の最良のモデルが既存のアプローチよりも優れていることがマルチターンで示されています 魅力と人間性の測定という観点からの対話。次に、分析によってこの作業の限界について説明します。 弊社機種の故障事例
チップ:
- Blenderbot は絶対位置埋め込みを備えたモデルであるため、通常は入力を右側にパディングすることをお勧めします。 左。
このモデルは sshleifer によって提供されました。著者のコードは ここ にあります。
Implementation Notes
Section titled “Implementation Notes”- Blenderbot は、標準の seq2seq モデル トランスフォーマー ベースのアーキテクチャを使用します。
- 利用可能なチェックポイントは、モデル ハブ で見つけることができます。
- これは デフォルト Blenderbot モデル クラスです。ただし、次のような小さなチェックポイントもいくつかあります。
facebook/blenderbot_small_90Mはアーキテクチャが異なるため、一緒に使用する必要があります。 BlenderbotSmall。
モデルの使用例を次に示します。
>>> from transformers import BlenderbotTokenizer, BlenderbotForConditionalGeneration
>>> mname = "facebook/blenderbot-400M-distill">>> model = BlenderbotForConditionalGeneration.from_pretrained(mname)>>> tokenizer = BlenderbotTokenizer.from_pretrained(mname)>>> UTTERANCE = "My friends are cool but they eat too many carbs.">>> inputs = tokenizer([UTTERANCE], return_tensors="pt")>>> reply_ids = model.generate(**inputs)>>> print(tokenizer.batch_decode(reply_ids))["<s> That's unfortunate. Are they trying to lose weight or are they just trying to be healthier?</s>"]Documentation resources
Section titled “Documentation resources”BlenderbotConfig
Section titled “BlenderbotConfig”[[autodoc]] BlenderbotConfig
BlenderbotTokenizer
Section titled “BlenderbotTokenizer”[[autodoc]] BlenderbotTokenizer
BlenderbotTokenizerFast
Section titled “BlenderbotTokenizerFast”[[autodoc]] BlenderbotTokenizerFast
BlenderbotModel
Section titled “BlenderbotModel”forward および generate の引数については、transformers.BartModelを参照してください。
[[autodoc]] BlenderbotModel - forward
BlenderbotForConditionalGeneration
Section titled “BlenderbotForConditionalGeneration”forward と generate の引数については、BartForConditionalGeneration を参照してください。
[[autodoc]] BlenderbotForConditionalGeneration - forward
BlenderbotForCausalLM
Section titled “BlenderbotForCausalLM”[[autodoc]] BlenderbotForCausalLM - forward