Společnost Nvidia vyvinula novou technologii umělé inteligence, která dokáže téměř okamžitě proměnit několik desítek 2D snímků v 3D scénu.
Nová technologie se jmenuje Neural Radiance Field neboli NeRF. NeRF dokáže vyplnit prázdná místa interpolací toho, co 2D fotografie nezachytily. Je to šikovný algoritmus, který by mohl vést k pokroku v různých oblastech, jako jsou například videohry a autonomní řízení. Technologie je podle společnosti až 1000 rychlejší než konkurence.
Rychlost zpracování u Nvidie je z velké části dána akcelerací umělé inteligence pomocí jader Tensor. Ta urychlují trénování modelů i vykreslování scén. NeRF mapuje barvu a intenzitu světla různých 2D snímků a poté generuje data pro propojení těchto snímků z různých pozorovacích bodů. Kromě snímků systém vyžaduje údaje o poloze kamery.
Z výše uvedeného videa byste si mohli myslet, že k vytvoření 3D scény byly zapotřebí pouhé čtyři snímky. Na blogu je však realističtější vysvětlení, že „neuronová síť vyžaduje několik desítek snímků pořízených z více pozic v okolí scény a také pozici kamery každého z těchto záběrů“.
Společnost Nvidia ke své ukázce uvádí, že předchozí techniky mohly trvat hodiny, než se scéna natrénovala, a pak několik minut, než se cílové scény vykreslily. Ačkoli výsledky předchozích pomalejších implementací byly dobré, výzkumníci společnosti Nvidia tuto technologii mnohonásobě zlepšili. Společnost Nvidia si proto troufá označit svou technologii jako „Instant NeRF“.
Budoucnost robotiky?
Vzhledem k tomu, že se tato technika zrychluje a potřebuje čím dal tím méně zdrojů, mohla by se používat pro nejrůznější úlohy:
„Instant NeRF by se dal použít k vytváření avatarů nebo scén pro virtuální světy, k zachycení účastníků videokonferencí a jejich prostředí ve 3D nebo k rekonstrukci scén pro 3D digitální mapy,“ uvedla Isha Salian ze společnosti Nvidia. „Tato technologie by mohla být použita k výcviku robotů a samořídících automobilů, aby pochopili velikost a tvar objektů reálného světa tím, že zachytí jejich 2D snímky nebo videozáznamy. Mohla by se také využít v architektuře a zábavním průmyslu k rychlému generování digitálních reprezentací reálného prostředí, které mohou tvůrci upravovat a na kterých mohou stavět.“