Godinama je zajednica za kompjuterski vid funkcionisala na dva odvojena koloseka: na generativnim modelima (koji stvaraju slike) i diskriminativnim modelima (koji ih razumeju). Pretpostavka je bila jednostavna – modeli koji su dobri u stvaranju slika nisu nužno dobri u njihovom "čitanju". Međutim, novi rad iz Google-a pod nazivom „Generatori slika su generalisti za učenje vida“ (Image Generators are Generalist Vision Learners, arXiv:2604.20329), objavljen 22. aprila 2026. godine, ruši tu pretpostavku.