学習データ
学習データ(Training data)とは、AIモデルが学習プロセス中に曝露される既存のコンテンツ——画像、映像、テキスト、音声、その他のメディア——の集合であり、モデルがパターン、スタイル、関係、視覚概念の理解をそこから得る。学習データの特性が、モデルが何を知っているか、何を生成できるか、アウトプットに持ち込むバイアスやギャップを直接形作る。
画像・映像生成モデルでは、学習データは通常、画像とテキストのペア——記述的キャプションやメタデータと組み合わされた画像——の数百万から数十億で構成され、モデルに視覚コンテンツと言語の結びつきを教える。このデータセットの多様性、品質、構成がモデルの強みと限界を決める。西洋の視覚文化を主に学習したモデルは他の美的伝統で苦戦しうる。高品質なプロ写真で学習したモデルは、低品質なインターネット画像で学習したモデルより見た目の良いアウトプットを生む傾向がある。特定の被写体やスタイルの十分な例なしに学習したモデルは、それらを一貫して生成しないか、まったく生成しない。学習データのキュレーションと調達は、AI開発における最も重要な技術的・倫理的・法的議論の一つである。
学習データを理解すると、モデルが特定のコンテンツタイプで優れ、他で苦戦する理由が明らかになり、クリエイターがAIツールをより効果的に使える。モデルが特定のスタイル、被写体、文脈を説得力を持って一貫して生成できない場合、最もありそうな説明は、そのコンテンツが学習データで過少表現または欠如していたこと——モデルを切り替える、プロンプト戦略を調整する、ギャップを埋めるためにファインチューニングを使うタイミングを判断するうえで有用な診断である。