facebook
Силата на изкуствения интелект: Може ли тя да промени света?

Силата на изкуствения интелект: Може ли тя да промени света?

Всички сме чували за това колко развити са вече технологиите в днешно време. Но някои от нас не забелязват всъщност колко много са се развили от преди години. Докато други го правят. Може би Вие не сте забелязли, а може би сте, но и в двата случая мисля, че ще Ви е интересно за това, което ще говорим в темата, а именно изкуствения интелект и как той променя живота ни. За това как може би след време ще замести доста голяма част от хората и ще заема работните им места, а може би дори по-голяма отколкото предполагаме днес.

Някои от Вас може да са чували за проектите DALL-E и MidJourney. А може и да не сте, но това няма значение, в тази статия ще Ви обясня всичко, което знам за тях. Истината е, че аз съм удивен от напредъка на технологиите и точно затова реших да напиша статия за това. Смятам, че и много от Вас ще бъдат също толкова възхитени колкото мен.

Какво са DALL-E и MidJourney?

DALL-E и MidJourney са програми с изкуствен интелект, които създават изображения от текстови описания.

Dall-E е разкрита от OpenAI на 5 януари 2021 г. Тя използва версия за обучение с 12 милиарда параметри на трансформаторния модел GPT-3, за да интерпретира входовете на естествен език и да генерира съответните изображения.

Midjourney е независима изследователска лаборатория, изследваща нови среди на мислене и разширяване на въображението на човешкия вид. Алгоритъма, който създадоха работи по подобен начин на алгоритъма на DALL-E. Някои дори биха казали, че работи и по-добре, но Вие ще имате сами възможността да прецените това.

Когато говорим за изкуствен интелект, за какво точно говорим?

Изкуственият интелект е процес на програмиране на компютъра да взема решения за себе си. Това може да стане чрез редица средства, включително, но не само: машинно обучение. Тези програми обикновенно се програмират на Python и най-често изполват вече готови библиотеки подобни на TensorFlow, NumPy, OpenCV и други.

Ще заместят ли дизайнерите?

След като наскоро MidJourney пуснаха бета тест и много хора сега имат възможността да тестват системата и да видят действително колко бързо работи тя и колко красиви изображения генерира, много хора започнаха да се питат, дали всъщност тези програми няма да започнат наистина да заместват хората и да заемат работните им места.

За да разберете какво точно имам предвид сега ще се прехвърлим при DALL-E, а после и при MidJourney, за да може сами да видите с очите си за какво става въпрос.

Ще видите всъщност колко лесно е човек да се сдобие със снимка каквато или приблизително каквато иска, без да има каквито и да било познания по графичен дизайн, композиция, цветове и така нататък.

Като за начало, отиваме на страницата на DALL-E и кликаме “вход”, за да влезем в системата.

DALL-E

Вход в страницата на DALL-E

 

Имайте предвид, че Вие няма да имате възможността да влезете, защото нямате акаунт. За да си направите акаунт, трябва да се запишете за списъка им с чакащи. При тях нещата са малко по-сложни отколкото при MidJourney. Там е по-лесно, защото всеки има право на 25 безплатни генерирания, докато при DALL-E, трябва да те одобрят.

Ако Вие сте човек, на който вече му е станало интересно и искате да се запишете за участие в проекта на DALL-E, може да го направите като влезете в сайта им и попълните формата за кандидатстване. След като попълните формата е необходимо известно чакане от Ваша страна. Може да отнеме от 1 ден до 1 година, няма обявени срокове за одобрение. При мен отне около няколко месеца.

Нека се върнем на DALL-E. Влезли сме в системата. Тя изглежда ето така:

 

DAll-e-начална-страница

 

В полето, което виждате, можем да напишем каквото пожелаем и програмата ще ни го нарисува. Вижте отдолу какви невероятни генерации е направила в даден момент от времето.

 

DALL-E-INCREDIBLE-ARTS

 

Рибката в аквариума е създадена с изречението “3D render of a cute tropical fish in an aquarium on a dark blue background, digital art”, а сладурското чудовище вдясно е създадено с “A photo of a white fur monster standing in a purple room”. Невероятни художествени изпълнения, независимо от каква гледна точка се опитваш да видиш нещата. Поне мое мнение.

А сега нека да видим ние какво ще можем да измислим. Винаги се опитвам да тествам приложенията, независимо какви са те, по възможно най-простия начин. А именно като им дам възможност да покажат въображение. Затова и смятам да започнем с нещо много малко. Например с думите:
“Черна котка с червени очи, която стои пред храст в тъмното”. Накрая на изречението смятам да добавя и думичката “vaporwave”. Много от Вас сега ще се запитат какво означава това. Vaporwave е музикален жанр и стил на визуално изкуство, който се появява в началото на 2010-те години. Характеризира се с носталгична естетика, която черпи от поп културата на 80-те и 90-те години, често с елементи на дигитално глич изкуство. Музиката често се описва като “хипнагогична” или “подобна на сънища” и се свързва с възхода на интернет културата и мем културата.

Да видим какво ще стане, че нямам търпение. Значи да преговорим, пишем следното – “Черна котка с червени очи, която стои пред храст в тъмното”, но на английски, защото алгоритъма още не говори български. На английски ще изглежда по-този начин: “A black cat with red eyes standing in front of a bush in the dark, vaporwave”. Нека видим какво ще получим.

Снимката се генерира…, генерира се…,

 

DALL-E-LOADING

 

Бум, бам имаме снимки на котка с червени очи в тъмното пред храст:

 

Screenshot 2022-08-24 at 20-52-21 DALL·E

 

Малко не ми е хванало идеята за vaporwave-а, но какво да се прави, все пак е тестов софтуер.

 

DALL·E 2022-08-24 20.53.53 - A black cat with red eyes standing in front of a bush in the dark, vaporwave

 

Като я гледам тая котка и на мен ми идва да се разплача. Все едно е тъжна, не знам защо. Може да не е хапвала тази вечер. Ако е котката на най-добрия ми приятел, може и да не е, особено ако той е на почивка и ме е оставил пак аз да я храня.., но това е друга тема.

Нека пробваме същото, но добавяйки “pixelart” накрая. И ако някои ме попита какво е “pixelart”, мога да му обясня, но тьй като не сме в курс по изкуствознание, няма да го направя тук, може да ми пише на лично. Всъщност си нямам на представа дали в курсовете по изкуствознание обясняват такива неща, никога не съм участвал в такъв курс.

Хора получи се нещо жестоко яко. Поне този път ме разбра за пикселизирането и картинките според мен станаха много яки. Вие какво мислите?

 

Screenshot 2022-08-24 at 20-57-47 DALL·E

 

Съсвем спокойно някой с интерес в създаването на игри може да ползва картинките за някакъв бос в играта или нещо такова, особено ако е пиксел 2d игра със сценарии и разговори. Ще стане жестоко!

 

EDITEDCAT

 

Робе? Slave, master, това не го ли забраниха да се използва попринцип? Както и да е, ако някой се оплаче ще променя картинката, за сега нека приемем, че е ок.

Хаха, майтапа настрана, но приложението е невероятно ако се замислите. Имайте предвид, че генерацията на тези изображения не отнема два часа, а само петнадесет секудни, в най-лошия случай ако изискването е прекалено сложно – една минута. Представяте ли си дали човек може да Ви нарисува такова нещо за по-малко от две минути? И дори, и да може дали ще Ви таксува толкова, че да Ви е полезно колкото ще Ви е сега, когато почти нищо няма да струва генерацията на подобно изображение.

Аз лично много се кефя, за Вас не знам. От друга страна е и притеснително, защото наистина има шанс да замени много хора и да ги лиши от работните им места, а това определено не е нещо, което се загърбва с лесна ръка. Никога не е приятно, когато технологиите лишават хора от препитанието им. Случва се постоянно около нас, понякога е за хубаво, друг път за лошо, но истината е, че напредъка не може да спре и няма, затова това, което можем да направим е да се развиваме заедно с него.

А сега нека след като приключихме с теста при DALL-E, да преминем към същия тест при MidJourney, за да видим и тяхната система как ще се представи.

MidJourney

За целта MidJourney за разлика от DALL-E ползват по-интересен похват. Написали са програмата и към нея са добавили Discord бот, който подава командите към сървъра им. Интересен метод, чрез който позволяват на много хора да тестват услугата, а и не само. Все пак това е изкуствен интелект, който се учи от информацията, която му се подава, така че имайте предвид, че това също е и много умен ход от тяхна страна, защото по този начин техния бот ще се сдобие с много по-голяма информация, много по-бързо отколкото изкуствения интелект на DALL-E.

За тези от Вас, които не знаят какво е Discord бот – това е програма, която работи на сървър и отговаря на команди или събития от потребители на Discord. Има много езици, които могат да се използват за писане на discord ботове, но някои от най-популярните включват JavaScript, Python и C#.

А сега, за да не Ви отегчавам допълнително, нека да започваме.

Като за начало както и преди трябва да влезем, за да ползваме бота. За целта отиваме на адреса на бота. Вие също може да го направите, като приемете поканата в Discord, ако имате акаунт.

След като влезете в Discord ще видите, че има най-различни канали. Влезте в канала на MidJourney, там ще видите стаи с имена – “newbies 58”, “newbies 88”, и така нататък.

midjourney

Ако желаете да тествате приложението може да го направите без да чакате като при DALL-E. Също така не е нужно да плащате каквото и да било, имате цели 25 генерации напълно безплатно.

Но аз като един луд човек болен до мозъка на костите си по новите технологии и най-вече, когато са свързани по някакъв начин с художествения талант, вече съм си купил абонамент, за да мога да го тествам без да ми се налага да чакам генерациите на останалите хора.

Затова като предния път, влизаме при бота и започваме със същата команда, която въведохме при DALL-E. А именно: “A black cat with red eyes standing in front of a bush in the dark, vaporwave”.

Нека да видим, кой е по-добрия изкуствен интелект, DALL-E или MidJourney.

 

 

Кликаме на “Direct Messages”, защото можем да си чатим с бота директно, когато имаме абонамент. И се появява чата, който ще използваме, за да си пишем с робота.

 

midjourney2

 

Тук се появяват някакви картинки, защото вече съм си играл, сами може да предположите, че когато си купя играчка, започвам да си играя с нея веднага като малките деца, няма как да чакам да ми хрумне да пиша статия за това и тогава за първи път да вляза, просто няма как да стане.

Пишем, пък да видим какво ще стане. Тук за разлика от DALL-E, преди изречението, с което обясняваме какво искаме да ни се нариусва, трябва да напишем командата – “/imagine”. Така казваме на Discord бота, че искаме генериране на картинка.

Започваме…

 

Screenshot 2022-08-25 212933

 

Започва се хора, зарежда…

 

Screenshot 2022-08-25 213037

 

Зарежда…

Бум бам имаме картинки и то 4 на брой, които са много яки, защото какво? Защото са в стил vaporwave!

 

tanchev_A_black_cat_with_red_eyes_standing_in_front_of_a_bush_i_3173bcb4-68d1-4306-805d-1dadddb433bc

 

Не е ли точно както си го представяме, котка точно като от сънищата? Мисля, че по отношение на vaporwave-а MidJourney се справи по-добре отколкото DALL-E, поне лично мнение, не знам Вие как мислите по въпроса. Все пак стила е свързан точно с това да пресъздадеш нещо, но не точно както е в реалния свят, а малко илюзорно, като нещо несъществуващо, като да го виждаш ама да не си сигурен какво виждаш и все пак дълбоко в себе си да знаеш – ТОВА Е КОТКА, ПРОСТО КОТКА.

Другото, което ми хареса е, че въображението на MidJourney е по-голямо. DALL-E направи всички котки с кървясали, препушили червени очи. Докато MidJourney взе текста и го превърна в нещо, което искаше той. Всички котки са с различни очи ако се загледате.

Тук сега идва най-интересното. Можем да си харесаме картинка и да я направим много детайлна и много красива. За Вас не знам, може би се спирате на номер едно и две като мен, предполагам? А може би на Вас са Ви допаднали още по-абстрактните три и четири? Няма значение хора, аз водя парада, така че ще разширим нашите картинки номер едно и номер две, пък да видим какво ще стане.

Броенето между другото е отляво, надясно и отгоре, надолу, за тези от Вас, които се чудат.

За тази цел трябва да кликнем на бутоните, които ни изкочиха в Discord.

 

Screenshot 2022-08-25 214704

 

Бутоните започващи с “V”, създават нови версии на изображението от това, което преди това се е било генерирало и подобни на него. С този бутон казвате на робота, че искате още една генерация от четири картинки подобни на тази. Бутоните започващи с “U”, казват на робота: искам тази снимка, но по-детайлно.

Кликаме на бутоните “U1” и “U2”, за да увеличим снимките, които ми харесаха на мен.

 

Screenshot 2022-08-25 214930

 

Доста скоро започва генерация и картинките започват да се появяват.

 

Screenshot 2022-08-25 214945

 

Бум бам имаме картинки, които са вече по-детайлни и от преди.

 

tanchev_A_black_cat_with_red_eyes_standing_in_front_of_a_bush_i_54d888f5-e1be-4b0e-84cd-1a783315b397

tanchev_A_black_cat_with_red_eyes_standing_in_front_of_a_bush_i_da29c697-a760-483a-b814-dfe3fc661a8c

 

Можем още повече да ги увеличим и да станат още по-детейлни, но за целите на статията няма смисъл. Мисля, че всички сме на едно мнение за това, че в категория №1 MidJourney се справи доста по-добре от DALL-E, дори без уголемяването, което при DALL-E го няма като вариант така или иначе.

Все пак, за да сравним качвам първите четири картинки от едната апликация и първите четири от другата, за да видите сами разликата ако вече от четене Ви се е размазал погледа и сте я забравили.

 

DALL-E-Creation

tanchev_A_black_cat_with_red_eyes_standing_in_front_of_a_bush_i_3173bcb4-68d1-4306-805d-1dadddb433bc

 

Мисля, че всички виждаме разликата при първото състезание нали? Мисля, че на всички ни е ясно, кой е победителят при първия опит, а именно MidJourney, нали?

 

DALL·E 2022-08-24 20.53.53 - A black cat with red eyes standing in front of a bush in the dark, vaporwave

 

Нормално, и аз бих плакал ако загубя с такава фрапантна разлика. Ок стига толкова шеги, остава ни още едно състезние, което аз лично очаквам с голям кеф и нетърпение. Именно – състезанието за PixelART.

Пускаме същата команда, която пуснахме в DALL-E, за да видим с какво ще ни изненада алгоритъма на MidJourney.

 

tanchev_A_black_cat_with_red_eyes_standing_in_front_of_a_bush_i_ba317187-7617-4e22-b039-bdf377da2e0b

 

Тук все пак смятам, че DALL-E печели, защото очевидно алгоритъма на MidJourney няма ни най-малка представа каква е моята идея за изображение в стил “pixelart”. Но какво да се прави, все пак няма перфектни неща, поне за момента, но да не забравяме, че и двата алгоритъма са едва в своят зародиш и има още много преди да са перфектни в това, което правят.

Играта е 1 : 1. Ако трябва да съм откровен мисля, че и двата алгоритъма са доста добри, особено имайки превдид, като отново удебелявам времето, за което успяват да се справят в генерирането на картини. Имайки предвид детайла, който влагат и двете приложения в работата си бих казал, че ако нещата продължават да се развиват по този начин много дизайнери ще останат без работа. Причината не е, защото човек не е по-добър, той винаги ще е по-добър по мое мнение, но просто човек работи за пари. А тези машини, тези алгоритми те просто работят. Те нямат нужда от вода, нямат нужда от храна, нито от сън, имат нужда само от процесорна памет, а те имат в предостатъчни количества.

Имайте предвид, че нещата, които тествах са много простички, но тези приложения са способни на много повече. Имат свойствата да генерират и други видове изображения; лога, флаери по зададени параметри с различни ширини и височини, снимки дори, които изглеждат близко до реални, снимани с фотоапарат.

 

Примерно може ли да си представите ако напишем същото при MidJourney, но отзад на снимката напишем “hyper realistic highly detailed”? Искате ли да видите?

 

tanchev_a_black_cat_with_red_eyes_standing_in_front_of_a_bush_i_be45a86c-b2a3-4465-ba1a-1d0cc73322e7

 

DALL-E също не изостава при високите дейтали, при мимикрия на снимки от фотоапарат. Даже горната снимка на MidJourney е по-художествена отколкото реалната на DALL-E отдолу.

 

DALL·E 2022-08-25 22.34.46 - Picture of a black cat with red eyes standing in front of a bush in the dark, hyper realistic highly detailed 4k

 

И да това отгоре не е истинска снимка на котарак в тъмното ако някой от Вас започне да се чуди.

Общо взето се надявам статията да Ви е харесала, получи се малко по-дълга отколкото би ми се искало и отколкото очаквах да стане, но пък какво да се прави явно си е имало за писане, нали така? Ако статията Ви е харесала, може да я споделите в някоя социална мрежа, току виж съм станал известен.