Neural Network(신경망)는 생물학적 뇌 구조에 느슨히 영감을 받은 연산 시스템으로, 데이터를 처리·변환하는 뉴런이라 불리는 수학적 단위의 상호 연결된 레이어로 구성됩니다. 학습 동안 뉴런 간 연결 강도를 조정함으로써 신경망은 모든 시나리오에 대한 규칙을 명시적으로 프로그래밍하지 않고도 패턴을 인식하고, 예측하고, 입력 데이터에서 출력을 생성하도록 학습합니다.
AI 이미지·영상 생성에 쓰이는 현대 신경망은 딥 신경망으로, 데이터가 통과하며 점진적으로 변환되는 많은 순차 레이어를 가집니다. 각 레이어는 점점 더 추상적인 특징을 감지하도록 학습합니다. 초기 레이어는 엣지·질감에 반응하고, 더 깊은 레이어는 복잡한 구조·객체·의미적 개념을 인식합니다. CNN은 시각 데이터 처리에 특히 적합해 이미지 인식 발전의 중심이었습니다. 원래 언어 처리용으로 개발된 Transformer 아키텍처는 이미지·영상 생성에 적응되어 오늘 쓰이는 많은 선도 모델의 기반이 됐습니다. 트랜스포머 기반 텍스트 이해와 디퓨전 기반 이미지 합성의 결합이 텍스트-투-이미지·텍스트-투-비디오 생성의 최근 진전 상당 부분을 이끌었습니다.
모든 AI 생성 도구가 신경망 위에 구축된다는 것을 이해하면 역량과 한계 모두를 맥락화하는 데 도움이 됩니다. 신경망은 학습 데이터의 패턴에서 학습하고 그 데이터에 잘 나타난 작업에서 뛰어나며, 새로운 조합·정확한 계산·학습에서 과소 대표된 개념에서는 어려움을 겪습니다. 이 이해는 모델의 학습된 패턴과 맞서지 않고 함께 작동하는 프롬프트를 만드는 데 도움이 됩니다.