Home > Изследователски текстове и коментарни анализи > Изкуството да създаваш дийп фейкове

 

Георги Гърков

Кое е реално и кое не е? Въпрос, попадащ право в самата сърцевина на епистемиологията, но и набиращ все по-голяма практическа значимост за живота в съвременните високотехнологични общества.

Ако някога сложните и реалистични имитации на реалността са били дело на умели творци със значителни ресурси зад гърба си – художници, фотографи или артисти, в днешно време създаването на сложни образи не изисква повече от няколко реда програмен код или натискането на бутон.

С увеличаването на компютърната мощност все повече хора получават шанса да изграждат свои виртуални реалности без особени технически познания или хардуер, докато се намират вкъщи или седят пред смартфона. А по екраните им започват да се движат хора, които никога не са живели, или да се разиграват събития, които никога не са се случвали.

Популярни приложения като FaceApp или Reface вече позволяват на всеки, който пожелае, да промени вида на лицето си, или да влезе в ролята на някой знаменит филмов герой. И всеки може да си ги изтегли безплатно. При все това, колкото и удивителни да ни се струват усмивките или думите на фалшивите образи от екрана, следва да се отчете, че зад тях не се крие нищо повече от тривиална и обикновена математика.

Поради тези причини в настоящата статия ще се опитаме да обхванем, но без да навлизаме в прекомерни технически подробности, по какъв начин новите технологии съумяват да пренапишат реалността, времето и пространството. Поне на пръв поглед.

Несъвършени, но ефективни метафори

Що е то дийп фейк? Това е просто една невронна мрежа. Крайният резултат, произведен от груба компютърна симулация на човешкия мозък, която като цяло избягва да сънува електрически овце – освен ако не й кажем как да го направи.

Що се отнася до овцете по-конкретно, следва да споменем, че горната картина, с която започва статията, не е дело на някой неуморен карикатурист, трудещ се в сенките на Киберекология, а най-обикновено произведение на невронната мрежа AI Dream, което тя създаде подир въпроса ми “Сънуват ли роботите електрически овце?”

Цялото съвременно поле на изкуствения интелект стъпва на основата на този тип модели на човешкия мозък и ако човек се поразрови малко повече в научната литература, би могъл да се нагледа на тяхното удивително многообразие, както и обширните приложения, които те намират в света около нас.

Независимо дали говорим за научни изследвания върху тайните на мозъка, дистопични системи за трупане на социален кредит в някои държави, предсказания за бъдещето, или разбира се, не на последно място, десетата симфония на Бетовен – възможните приложения са сякаш неограничени.

При все това, както Хюм е забелязал навремето, “сто противоречиви мнения може да съхранят една несъвършена аналогия така, че изобретателността да се прояви в своята пълнота”.И макар и невронните мрежи да водят началото си пряко от изследванията на редица психолози и невробиолози от втората половина на миналия век, не бива да забравяме, че дори най-напредналите невронни мрежи или компютърни симулации остават поразително далеч от действителната сложност на човешкия мозък.

Ако си позволим подобно лирично отклонение, следва да отчетем, че реалният човешки мозък е преди всичко територия на безбройни и идиосинкретично взаимосвързани неврони, които едва бегло напомнят подредените графики от учебниците по невронаука или описанията на инфлуенсърите. Което предполага, че всеки неврон представлява сам по себе си една сложна система с характерна индивидуалност и променливост.За невроните в изкуствените мрежи, от друга страна, е по-подходящо да се мисли като за хомогенни единици, чиято роля е само да събират числата, получени от предишни неврони, и да ги обръщат в други числа чрез математически операции.

Източник: ML Glossary

В известен смисъл невронните мрежи са един парадигмален пример за провалите на биологичния редукционизъм пред нередуцируемата сложност на човешкия мозък. Но независимо от това, ако се абстрахираме от първоначалното им предназначение да разкрият работата на вътрешния ни космос, в останалите неща от живота те като цяло се справят доста прилично.

Невроните във всеки слой на дадена мрежа се задействат по строго определени “правила”, заложени в тях като математическа функция. Съответно в горния примерен случай, отразен на графиката, всички получени числа се умножават по теглата си и се събират, а невронът изкарва ново число, което е между 0 и 1. И да, за по-технически ориентираните читатели би станало бързо очевидно, че добрата стара линейна регресия се оказва, че е частен случай на невронните мрежи. Що се отнася до архитектурата на конволюционните мрежи, доколкото основната концепция зад тези изкуствени модели е многообразието на света да се редуцира до по-малък брой елементи, с придвижването към всеки следващ слой на мрежата, се увеличава сложността на характеристиките, обхващащи основните явления.

 

Конволюционна невронна мрежа, която се опитва да познае колко вероятно е животното на снимката да се окаже зебра, кон или куче. Мрежата започва с разпознаването на елементарните части на животното, които с всеки следващ слой се обединяват в по-мащабни характеристики. Според резултата на мрежата вероятността за зебра е 70 процента. (Източник: Google Images)

Ключово за невронните мрежи е, че подобно на истинските мозъци, те се обучават върху данни, подадени отвън, а крайният резултат, или предсказаното от мрежата, се сравнява търпеливо с действителността. Както един човек развива чрез опита си определени вярвания за нещата, които после проверява и променя при сблъсъка с реалността. Когато отклонението от действителността е голямо, мрежата променя силата на връзките между невроните, докато не се получи достатъчно близко съответствие с действителността.

Част от личен експеримент за програмиране на невронна мрежа в Tensorflow, която предсказва бъдещето на 1000 души чрез стара информация, взета за тях от предишни години. Докато сравнителна част от хората се оказват “лесно предсказуеми”, отклонявайки се с около точка и нещо от предсказанията, при други предсказанията се провалят напълно. На фигурата можете да видите предсказанията на мрежата за първите десет човека от извадката.

Това обстоятелство, както  и че живеем в сложни социокултурни системи, които непрекъснато се изменят, предполага, че  конструирането на този тип модели  не може да се подчинява на някакво общо правило или универсална рецепта. Още по-малко, да има  някаква убедителна гаранция за предсказуемост. Работата с несъвършените метафори на изкуствения интелект е в известен смисъл типичен случай на онова, което Картрайт нарича artful modeling. Такава научна дейност, при която на мястото на строгото извеждане на някакви правила от други, определящата роля очаквано има богатството на личния практически опит и надхвърлящата готовите рецепти интуиция, които прилагащият технологията е натрупал в себе си.

Изкуството да създаваш изкуство

Със сигурност би могло да се види от предните изложения, че съм почитател на лиричните отклонения, но тук идва моментът да положим казаното по-конкретно в контекста на основния въпрос на настоящата статия. А именно как въпросните несъвършени мозъчни метафори съумяват да си проправят път до нашите възприятия и да изкривят действителността пред очите ни.

Дийп фейковете и проблемът за фалшивите новини неминуемо са поредното отражение на едни хронични спорове, свързани с природата на знанието и етиката на общественото (само)управление. Не може да се отрече, че основите на всяка общност се крепят на първо време върху взаимно споделените разбирания, критерии и инструменти за разграничаването на реалното от нереалното.

Но макар и deep fake-овете да биват основателно свързвани с проблемите на дезинформацията или размиването на границите между реалното и нереалното, те изглежда предлагат и известен потенциал за по-голямо себеутвърждаване, както и за по-голяма творческа свобода.

Изкуственият интелект може да отваря широко вратата откъм нови стремежи за следене и предсказване на хората, но позволява и безпрецедентни възможности за експериментиране с творчески проекти както от хора без професионални умения, така и от такива, търсещи начини да съчетаят майсторските си умения и прозрения с технологията.

Същевременно нови концепции предвиждат възможността фалшивите лица да бъдат използвани например за да се защити самоличността на хора, които са били заснети и качени в социалните мрежи без позволение.

Картина, която невронната мрежа Big Sleep нарисува за мен по тези ключови думи: “Пещерата на Платон”

Подобно на множество други технологични развития, дийп фейковете и изкуственият интелект отправят поредно предизвикателство към определящата роля на човешкия фактор, от който зависи моралното им оправдание и значение.

Модерно изкуство или дезинформация, създаването на нови образи се свежда до проста за програмиране схема. За да подтикнеш компютъра ти да “сънува” електронни овце, е достатъчно да го накараш просто да се опита да “надхитри” себе си. Или с други думи, да пуснеш в ход т. нар. генеративно-състезателна мрежа.

Схема на генеративно-състезателна мрежа за фалшиви образи.  Източник: Revi et al., 2022

 Характерно за този тип мрежи е, че вътре в тях се обединяват две части, чиято задача е да бъдат в непрекъснато състезание помежду си, докато се учат от снимките или данните, които им се подават отвън. Или както обяснява Франсоа Шолет в своето “Въведение в дълбоките невронни мрежи”:

“Генеративните мрежи наподобяват един измамник, който се опитва да създаде фалшива картина на Пикасо. Първоначално измамникът се справя доста зле със задачата. Той разбърква някои от своите фалшификати с автентични произведения на Пикасо и ги показва всичките на някакъв търговец на изкуство. Търговецът прави оценка на автентичността на всяка картина и дава обратна връзка на фалшификатора за това какво именно прави Пикасо, за да изглежда като Пикасо. Фалшификаторът се връща в ателието си, за да подготви нови фалшификати. С течение на времето той става все по-компетентен в имитирането на стила на Пикасо, а търговецът на произведения на изкуството става все по-умел в хващането на измамите. В края на краищата двамата остават с няколко отлични имитации на Пикасо”.

Тези два компонента са съответно, от една страна, “творчески” генератор на несъществуващи образи, захранван от случаен шум, и “цербер”, който се опитва да хване измамите на генератора и да ги различи от истинските картини.

Така, с изминаването на епоха подир епоха, мрежата затвърждава все по-ясно как да разпознае определени явления от реалността, общите неща, които е успяла да открие между съществуващите картинки, подадени й от хората. И става все по-ловка в изработването на фалшификатите. Надпревара, която завършва не с един, а с двама победители.

Този човек не съществува. Един от характерните начини да разпознаете фалшив образ е като се вгледате в детайлите на по-малко очаквани места. Докато лицето е сравнително убедително, задният фон е изключително необичаен. Макар и моделът да е бил добре обучен да създава човешки лица, характеристиките на фона са били в по-голяма степен пренебрегнати. (Източник: thispersondoesnotexist)

В първите часове на обучението създадените картинки е съвсем очаквано да приличат повече на хаотична шепа от цветове и петна или като някакви произведения на абстрактното изкуство. Но си струва да се отбележи, че дори при компютрите с прилични характеристики, процесът на обучение би могъл да отнеме дни или седмици, според желаната от автора реалистичност на картините и практическите ограничения на системата.

Това представлява накратко  същността на богатството от дийп фейкове и произведения на изкуството, което все по-умело започва да ни заобикаля и да провокира нашите епистемични разбирания.

 

Използвана литература

Anderson, M. (2022, Ноември 14). A New Social Image-Sharing System Deepfakes All People by Default—Metaphysic.ai. Https://Metaphysic.Ai/. https://metaphysic.ai/a-new-social-image-sharing-system-deepfakes-all-people-by-default/, https://metaphysic.ai/a-new-social-image-sharing-system-deepfakes-all-people-by-default/
Cartwright, N. (2019). Nature, the Artful Modeler: Lectures on Laws, Science, How Nature Arranges the World and How We Can Arrange It Better. Open Court.
Chollet, F. (2018). Deep learning with Python. Manning Publications Co.
Landgrebe, J., & Smith, B. (2023). Why machines will never rule the world: Artificial intelligence without fear. Routledge.

Остави коментар