Glossaryarrow
モデル(AI)
モデル(AI)

人工知能および機械学習において、モデルとは、大量のデータで学習させてデータ内のパターン、関係、構造を獲得させた計算システムであり、新しい入力に対して学習したパターンを適用して出力を生み出すことができるものである。AIモデルは最も根源的な意味で関数である。すなわち入力(テキストプロンプト、画像、語列、パラメータ群)を受け取り、学習中に発達させた世界の内部表現を適用することで出力(生成画像、テキスト応答、動画クリップ、分類結果)を生み出す。この用語は、訓練済みのAIシステム全般を指す最も広い概念レベルでも、また特定の名称を持つ個別モデル(GPT-4、Stable Diffusion、Flux、Kling、Claude)が、特定のアーキテクチャ、学習データ、能力を備えた特定の訓練済みシステムを指す具体的な製品レベルでも用いられる。

学習プロセスこそが、モデルを従来型のプログラムから区別するものである。従来のプログラムがプログラマーによって書かれた明示的なルールに従うのに対し、モデルは学習中に膨大な量の事例にさらされることを通じて自らの内部表現を発達させる。これはモデルのパラメータ(しばしば数十億個の数値)が、学習データ上でモデルの出力と正解出力の差を最小化するよう反復的に調整されるプロセスである。学習後、これらのパラメータは固定され、学習分布内のパターンに関する獲得された表現を符号化する。モデルが推論時に新しい入力を受け取ると、これらの学習済みパラメータを適用して、学習中に出会ったパターンを反映する出力を生み出す。これこそが、言語モデルが流暢なテキストを生成し、画像モデルがフォトリアルな画像を生み出し、動画モデルが整合性のある動きを生成できる理由である。言語、画像、動きに関するルールでプログラムされているからではなく、膨大な事例から統計的な規則性を学習したからこそ可能になるのである。

AI生成ツールのユーザーにとって、モデルは能力の基本単位である。モデルごとに強み、弱み、ビジュアルスタイル、学習データ、振る舞いの傾向は異なる。タスクに適したモデルを選ぶことは、効果的なプロンプトを書くことと同じくらい重要だ。画像生成モデルにはフォトリアル出力、様式化された美学、建築ビジュアライゼーション、キャラクターの一貫性などを得意とするものがある。動画生成モデルはモーションの扱い、時間的整合性、解像度、プロンプト遵守の点で差がある。言語モデルは推論能力、知識、指示遵守、出力スタイルにおいて差がある。モデルとは(何でもできる汎用知能ではなく)特定の特性を備えた特定の訓練済みアーティファクトであるという理解は、AI生成ツールを効果的に使うための土台である。Morphicのようなプラットフォーム内では、異なるモデルオプションが異なる生成アプローチを提供しており、適切なモデルの選択はクリエイターが行う最初で最も重大なパラメータ選択となる。

Can't find what you are looking for?
Contact us and let us know.
bg