機械学習およびAIにおけるパラメータとは、学習済みモデルの挙動を定義する内部の数値(重みとバイアス)を指す。これはモデルが「知っている」ことの中核であり、学習プロセスの成果物として、膨大な学習データに触れることで発見された入力と出力の間の統計的関係を符号化したものである。ニューラルネットワークが入力を処理するたびに、これらのパラメータを用いてネットワークのアーキテクチャを通じて入力値を乗算し、加算し、変換することで、その種の入力と関連付けるようモデルが学習した内容を反映する出力を生成する。学習前には、パラメータは小さなランダム値に初期化され、学習中には最適化を通じて反復的に調整され、モデルの出力と正解出力との差を最小化していく。学習後、パラメータは固定され、保存されたモデル、すなわち生成ツールを通じてユーザーが対話するファイルやシステムを構成する。
モデルのパラメータ数は、その規模と能力を示す指標として頻繁に引用される。現代の大規模言語モデルや画像生成モデルは数十億のパラメータを含み(GPT-3は1,750億、より大規模なモデルは1兆を超える)、自然言語、画像、または動画を高品質でモデル化するために必要な表現容量の規模を反映している。しかし、パラメータ数だけが品質や能力の完全な指標ではなく、アーキテクチャ設計、学習データの品質、学習方法論、そして特定のタスク領域がすべて、特定のパラメータ数で達成できる内容に大きく影響する。高品質でドメイン特化したデータで学習された小規模なモデルは、特定の領域内における特定タスクで、より大規模な汎用モデルを上回ることがある。パラメータ利用の効率性(各パラメータがどれだけの能力に寄与するか)はAI研究の活発な領域であり、スパースモデルやmixture-of-experts手法といったアーキテクチャ上の革新により、個々の推論に用いるパラメータ数を比例的に増やすことなく、より大きな実効容量を実現できるようになっている。
AI生成ツールの文脈では、「パラメータ」という用語は日常的な用法において、より身近な第二の意味を持つ。生成プラットフォームのインターフェースを通じて公開される、ユーザーが調整可能な設定や制御、すなわちCFGスケール、ステップ数、シード、ノイズレベル、サンプラーといった類似の数値は、しばしば口語的に「生成パラメータ」や「プロンプトパラメータ」と呼ばれる。この用法は、モデルパラメータ(学習後に固定され、ユーザーがアクセスできない)とは技術的には区別されるが、いずれの意味も出力を形作る数値を表している。モデルパラメータはモデルが何をできるかを決定し、生成パラメータは特定の生成タスクにモデルの能力をどのように適用するかを決定する。両方の用法(およびその関係性)を理解することは、AI生成システムを効果的に扱う上での基礎となる。