Juhuslike inimeste nägude genereerimise süsteem põhineb NVIDIA stylegani algoritmil, aga ka NVIDIA CUDA tarkvaral. See on eelnevalt koolitatud mudel, millel on suurepärane interpoleerimis-ja lahtiharutussüsteem, mis on võimeline leidma varjatud variatsioonitegureid (näiteks määrama näo asukoha, identiteedi ja isegi rohkem kui 100 parameetrit).

Kuidas algoritm töötab?

Stylegani töömeetodit võib tõesti nimetada üsna täiuslikuks. See avab uusi võimalusi pildi genereerimise protsessi juhtimiseks.

Tegelikult algab algoritm uuritud konstantse sisendiga ja reguleerib seejärel pildi stiili, läbides iga konvolutsioonikihi üksteise järel. See on see, kuidas generaator kontrollib otseselt pildi omadusi mis tahes skaalal. 

Peamine eesmärk on leida kõik varjatud variatsioonitegurid ja tõsta kvalitatiivselt kontrolli taset.

Arhitektuur

StyleGAN määratleb Pildi kõrgetasemelised atribuudid:

  • Näo asend.
  • Inimese isiksus.
  • Sooline.
  • Soeng.
  • Freckles ja muud üksikasjad.

Seda kõike kasutades mittelineaarset teisendust modifitseeritud Varjatud vektori kaudu, mida kohandatakse afiinsete teisenduste abil veelgi erinevate stiilide ja variatsioonidega.

Müra osas on see lihtsalt ühe kanaliga pilt, mis koosneb korreleerimata Gaussi mürast. See tarnitakse igale iteratsioonile ja kohandatakse uuritud funktsioonide põhjal. Kaaluma:

V: müra kõigil kihtidel.

B: müra pole.

C: müra õhukestel kihtidel.

D: müra paksudel kihtidel.

Tulemused ja pildikvaliteet

Praegu on algoritm koolitatud väga hea kvaliteediga piltide tootmiseks. Võime öelda, et on leitud kompromiss kvaliteedi ja interpoleerimisvõimaluste vahel.

Stylegani kood

Lähtekood on salvestatud siia: https://github.com/NVlabs/stylegan.

Uus andmekogum: https://github.com/NVlabs/ffhq-dataset.

Kõik andmed on olnud üldkasutatavad alates 2019.aastast. 

StyleGAN2 teine versioon võeti kasutusele 2020.aastal.