ニューラルネットワーク
ニューラルネットワークとは?
ニューラルネットワークとは、データからパターンを学習する数学的接続の層状システムです(経験から学ぶ脳のように)。そして学んだパターンを使って、画像、テキスト、映像などの新しい出力を生成します。
ひと目で分かる
- 別名
- 人工ニューラルネットワーク(ANN)深層ニューラルネットワーク(DNN)深層学習モデル
- 用途
- 大規模データセットからパターンを学習し、予測と生成を可能にするすべての現代AI生成システムの基盤となるアーキテクチャ画像認識、自然言語処理、音声合成、生成AI
- 主なツール
- TensorFlowPyTorchAll AI generation models (stable diffusion, GPT, CLIP, etc.)
- 関連用語
- Deep learningDiffusion modelTransformerGANTrainingParametersModel
- How it works in simple terms
- データがネットワークに入り、相互接続された処理ユニットの層を通過する。各層はデータを学習済みの方法で変換し、最終層から出力が現れる。学習中、接続は誤差を最小化するために何百万回も何十億回も調整される。学習後、調整された接続が、ネットワークが学んだすべてを符号化している。
- Where you encounter this
- あらゆるAI生成ツール、すなわち画像生成器、映像生成器、チャットボット、音声合成システムは、1つ以上のニューラルネットワークの上に構築されている。AIに画像や映像を生成するよう求めるとき、あなたは入力をニューラルネットワークに送り込み、それを出力へと変換させているのだ。
創ってみませんか?
シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる
シンプルで透明性の高い料金体系、速度制限なし、無限のCanvasで創造性を最大化する、オールインワンのAIクリエイティブプラットフォーム。
他の概念との比較
Compared with related concepts
ニューラルネットワークは、しばしば古典的機械学習やルールベースのAIシステムと対比される。ルールベースのシステムは、出力を生み出すための人間が明示的に書いたルールを符号化する。透明で予測可能だが、脆弱で、現実世界のデータの複雑さと変動性を扱えない。古典的機械学習は、手作業で設計した特徴と統計的学習を組み合わせる。対照的にニューラルネットワークは、特徴エンジニアリングなしに生データから自身の表現を直接学習し、はるかに高い複雑さとニュアンスを扱えるが、解釈性は低く、より多くのデータを必要とする。従来のアプローチに対するニューラルネットワークの成功が、現在のAI生成の革命の基盤である。
たとえば…
ニューラルネットワークは、音楽理論を学ぶのではなく数千の楽曲を聴くことで音楽を学ぶ生徒のようなものだ。露出とフィードバックを通じて徐々に、音楽の構造、パターン、スタイルの内的感覚を養い、それを応用して、吸収したすべてを反映する新しい音楽を生み出せるようになる。
プロのヒント
生成モデルが特定タイプの出力(珍しい文化的な美意識、希少な物体、特定の写真スタイル)に一貫して苦戦するとき、それはしばしばそれらの要素がモデルの学習データで過小に表現されていたという信号である。同じ要素についてより長く、より強引なプロンプトを書くのではなく、過小に表現された要素を、モデルがよく知るより一般的な参照点と組み合わせてみるとよい(「伝統的な日本の能舞台、西洋のプロセニアム劇場に似た空間配置」)。これは、なじみのない要求をモデルの既存の学習済み表現に結びつける助けとなる。
種類とバリエーション
畳み込みニューラルネットワーク(CNN)は画像や空間データに特化し、局所的なパターン検出を使って複数のスケールで特徴を識別する。再帰型ニューラルネットワーク(RNN)は、時間ステップにわたって一種の記憶を保持することで逐次データを処理する。トランスフォーマーはアテンション機構を使い、入力のすべての要素間の関係を同時に処理するため、言語モデルの支配的アーキテクチャであり、画像・映像生成でもますます使われている。敵対的生成ネットワーク(GAN)は、2つの競合するネットワーク(生成器と識別器)を互いに対抗させて学習させ、リアルな出力を生み出す。拡散モデルは、特定の順方向・逆方向のノイズプロセスを使ってデータを生成する。変分オートエンコーダ(VAE)は、データの圧縮された潜在表現を学習する。ほとんどの現代の大規模AIシステムは、単一の全体システムの中で複数のアーキテクチャタイプを組み合わせている。
Morphicで最初のシーンを作ってみませんか?
Morphicを試す主な活用シーン
ニューラルネットワークは、クリエイティブ制作で使われるあらゆるAI生成ツールの基盤技術である。画像合成、映像生成、自然言語生成、音声合成、音楽生成、コード生成、画像認識・分類、物体検出、翻訳、要約、そして現代の機械学習のその他ほぼすべての応用がそれにあたる。ニューラルネットワークをこれらすべてのシステムの共通基盤として理解することは、なぜ似たプロンプティングの原則が異なるモダリティやツールにわたって当てはまることが多いのかをクリエイターが理解する助けとなる。すべては、同じ根本的な学習済みパターン認識アーキテクチャの変種なのだ。
創ってみませんか?
シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる
シンプルで透明性の高い料金体系、速度制限なし、無限のCanvasで創造性を最大化する、オールインワンのAIクリエイティブプラットフォーム。
FAQ
ニューラルネットワークとは、数値的な重みで接続された層状の処理ユニット(ニューロン)から構成される計算システムで、データからパターンを学習し、学んだパターンを新しい入力に適用して出力を生み出すよう設計されています。生物学的ニューラルネットワークの構造に着想を得たもので、画像生成器、言語モデル、映像生成ツールを含む、すべての現代AIシステムの基盤となるアーキテクチャです。
ニューラルネットワークは、正解の出力が分かっている大量の例にさらされる学習プロセスを通じて学習します。学習中、重み(ニューロン間の接続の数値)は、バックプロパゲーションと呼ばれるプロセスを通じて、ネットワークの出力と正解出力との誤差を最小化するよう反復的に調整されます。多くの例にわたる多数の反復の後、重みは学習済みの表現を符号化し、ネットワークが新しい入力に対して正確な出力を生み出せるようになります。
深層学習は、多くの隠れ層を持つニューラルネットワーク、すなわち「深い」ネットワークを特に指します。すべての深層学習モデルはニューラルネットワークですが、すべてのニューラルネットワークが深層学習モデルというわけではありません(層の少ない浅いネットワークも存在します)。実際には、「深層学習」という語は現代のAI生成を支える大規模で多層のネットワークに最もよく使われます。その深さこそが、高品質な出力に必要な複雑で階層的な表現の学習を可能にするからです。
重みとは、ネットワーク内のニューロン間の接続の数値で、学習中に調整されます。パラメータはより広い用語で、重みとバイアス、すなわち学習中に学ばれるネットワーク内のすべての数値を含みます。大規模言語モデルや画像生成モデルは数十億のパラメータを持つことがあり、その一つ一つがネットワーク全体の学習済み表現に寄与します。学習後、パラメータは固定され、モデルの能力と特性を定義します。
トランスフォーマーとは、アテンション機構を使って入力を処理する特定タイプのニューラルネットワークアーキテクチャで、ネットワークが入力のすべての要素間の関係を逐次的にではなく同時に考慮できるようにします。トランスフォーマーは言語モデル(GPT、Claude、Gemini)の支配的アーキテクチャであり、画像・映像生成でもますます使われています。いくつかあるニューラルネットワークのアーキテクチャの変種の一つで、アテンションベースの処理アプローチが特徴です。
従来のプログラムはプログラマーが書いた明示的なルールに従い、それらのルールが扱えることに限定されます。ニューラルネットワークはデータから自身のルールを学習し、人間が明示的に書くのが不可能なほど複雑なパターンの内的表現を養います。これがニューラルネットワークが写真の中の顔を認識し、文の意味を理解し、フォトリアリスティックな画像を生成できる理由です。これらは、いかなる明示的なルールセットも提供しえないほど多くのニュアンスと柔軟性を要するタスクなのです。
ニューラルネットワークと人工知能は関連していますが、同義ではありません。AIは、知的な振る舞いを示すシステムを構築するための多くのアプローチを包含する広い分野です。ニューラルネットワークはAIアーキテクチャの一つのクラスで、現在ほとんどの実用的AI応用において支配的なものです。初期のAIシステムは、ニューラルネットワークではなくルールベースのアプローチ、探索アルゴリズム、エキスパートシステムを使っていました。現在のAI生成の革命は特にニューラルネットワークの革命ですが、概念としてのAIはより古く、より広いものです。
パラメータ数は、ネットワークの表現能力、すなわちどれだけの複雑さを潜在的に学習できるかの大まかな指標です。一般に、より大きなネットワークは複雑なパターンを表現する能力が高いですが、効果的に学習させるにはより多くのデータと計算も必要です。ただし、サイズだけで品質が決まるわけではありません。アーキテクチャ、学習データの品質、学習方法論、そして特定のタスク領域がすべて、モデルにできることに大きく影響します。優れた領域特化データで学習された小さなモデルは、その領域内のタスクで、はるかに大きな汎用モデルを上回ることがあります。