א קוק אויף די נייע על גענעראַטיווע קונסט

על גענעראַטיווע קונסט איז אַ טיפּ פון קונסט, אין רובֿ קאַסעס וויזשאַוואַל, וואָס איז באזירט אויף קוואַפּעריישאַן צווישן אַ מענטש און אַן אָטאַנאַמאַס סיסטעם. אַ "אָטאַנאַמאַס סיסטעם" איז דיפיינד ווי אַ אַרטיפיסיאַל ינטעלליגענסע ווייכווארג, אַלגערידאַם אָדער מאָדעל וואָס איז ביכולת צו דורכפירן קאָמפּלעקס אַפּעריישאַנז אָן די נויט פֿאַר פּראָגראַמיסט ינטערווענטיאָן.

פֿון די טשודנע דזשאַקסטאַפּאַזישאַנז פון בילדער באשאפן דורך דאַל-E מיני צו די NFT מאַרק, בילדער דזשענערייטאַד דורך אַי אַלגערידאַמז זענען ינקריסינגלי אין די מיינסטרים פאַנטאַזיע. אין פאַקט, צוויי וויכטיק פּראַדזשעקס אויף דעם טעמע וואָס פאַרדינען צו זיין אַנאַלייזד זענען: מידדזשאָורניי און DALL-E2.

פון קורס, די נייַעס האט אויך געמאכט זיין וועג צו טוויטטער. קאָמענטאַר אויף אים, צווישן אנדערע, טשאַרלעס האָסקינסאָן, וואָס האָט געשריבן:

אַי דזשענערייטאַד קונסט. איך איז געווען ביכולת צו מאַכן דעם בילד אין בלויז אַ ביסל מינוט. איך קען נישט ימאַדזשאַן ווי מערקווירדיק דעם טעכנאָלאָגיע וועט זיין אין 3 יאָר pic.twitter.com/jOToCZj7ki
- Charles Hoskinson (@IOHK_Charles) 1 פעברואר 2023

על גענעראַטיווע קונסט: פרי יקספּעראַמאַנץ און פֿעיִקייטן

ווייל פארשטאנען וואָס גענעראַטיווע קונסט איז, עס איז וויכטיק צו ונטערשטרייַכן איינער פון זייַן ערשטן פּרינסאַפּאַלז: randomness. וואָס איז אַ פונדאַמענטאַל פאַרמאָג פון גענעראַטיווע קונסט.

אין פאַקט, דיפּענדינג אויף די טיפּ פון ווייכווארג, די אָטאַנאַמאַס סיסטעם איז ביכולת צו פּראָצעס רעזולטאַטן וואָס זענען שטענדיק אַנדערש און יינציק יעדער מאָל ווען די דזשענערייט באַפֿעל איז עקסאַקיוטאַד, אָדער עס קענען צוריקקומען אַ בייַטעוודיק נומער פון רעזולטאַטן אין ענטפער צו באַניצער אַרייַנשרייַב.

די ערשטע יקספּעראַמאַנץ אין גענעראַטיווע קונסט קומען צוריק צו די 1960 ס מיט די יקספּעראַמאַנץ פון האראָלד כהן און זייַן אַאַראָן פּראָגראַם. כהן ערשטער געוויינט סטאַנדאַלאָנע ווייכווארג צו דזשענערייט אַבסטראַקט אַרטווערקס ינספּייערד דורך פּאָפּ קונסט סילקסקרינעס. כהן'ס ווערק זענען איצט אויסגעצייכנט אין דער טאַטע-גאַלערי אין לאָנדאָן.

אן אנדער אַטריביוט פון גענעראַטיווע קונסט, אָבער וואָס איז ווייניקער און ווייניקער אַ פּריראַגאַטיוו, איז די יבערכאַזערונג פון פּאַטערנז אָדער אַבסטראַקט עלעמענטן צוגעשטעלט דורך די פּראָגראַמיסט און ימפּלאַמענאַד אין די ווייכווארג קאָד.

אין אַדישאַן, די אַנטוויקלונג פון ינקריסינגלי קאָמפּליצירט נעוראַל נעטוואָרקס אַפּערייטינג אויף טעקסט-בילד פאַרבאַנד האט ענייבאַלד די אַנטוויקלונג פון דזשענעראַטיוו מאָדעלס וואָס זענען ביכולת צו שאַפֿן ינקריסינגלי רעאַליסטיש און פּינטלעך בילדער. דער בעסטער באקאנט ביישפּיל פון דעם קאַטעגאָריע פון גענעראַטיווע קונסט איז דאַל-ע.

Dall-E איז אַ מולטימאָדאַל נעוראַל נעץ באזירט אויף די גפּט-קסנומקס טיף לערנען מאָדעל פון OpenAI, די זעלבע פירמע וואָס אויך לעצטנס דעוועלאָפּעד טשאַטגפּט, די טשאַטבאָט לאָנטשט אין נאוועמבער 2022 און אָפּטימיזעד מיט "אויפֿפּאַסן" און ריינפאָרסמאַנט לערנען טעקניקס.

צוריק צו Dall-E, מיר זען אַז די סיסטעם איז טויגעוודיק צו דזשענערייט בילדער פֿון אַ טעקסט באַשרייַבונג, גערופן אַ "פרעמד," באזירט אויף אַ דאַטאַסעט פון טעקסט-בילד פּערז.

דער ערשטער ווערסיע פון Dall-E, וואָס איז געווען דערלאנגט צו דעם ציבור אין יאנואר 2021 און פארבליבן די פּריראַגאַטיוו פון אַ קליין נומער פון פּראָפעססיאָנאַלס אין דעם פעלד, רעפּריזענטיד אַ פאַקטיש רעוואָלוציע אין טערמינען פון דעם טיפּ פון דזשענעראַטיוו מאָדעל, סערפּאַסינג די ינאָווויישאַנז פון GPT- 3 זיך.

אויך וויכטיק איז דער פאַקט אַז די אַקיעראַסי פון די רעזולטאַטן פּראַסעסט דורך Dall-E פּרוווד צו זיין די שליימעסדיק פאַרנעם פֿאַר אן אנדער OpenAI לייזונג: CLIP (קאָנטראַסטיווע שפּראַך-בילד פאַר-טריינינג).

אַ בילד קלאַסאַפאַקיישאַן און ראַנגקינג נעוראַל נעץ טריינד אויף דער באזע פון טעקסט-בילד אַסאָוסייישאַנז, אַזאַ ווי קאַפּשאַנז געפֿונען אויף דער אינטערנעץ. דאַנק צו CLIP ס ינטערווענטיאָן, וואָס ראַדוסאַז די נומער פון רעזולטאטן פארגעלייגט צו דער באַניצער פּער פּינטלעך צו 32, Dall-E איז געפונען צו צוריקקומען באַפרידיקנדיק בילדער אין רובֿ קאַסעס.

מידדזשאָורניי: פּלאַן, מענטש ינפראַסטראַקטשער און קינסטלעך סייכל

ווי דערוואַרט, מידדזשאָורניי איז אַ וויכטיק פּרויעקט וואָס איז טייל פון די ימערדזשינג Al Generative Art באַגריף. ספּאַסיפיקלי, Midjourney איז אַ פרייַ פאָרשונג לאַבאָראַטאָריע וואָס יקספּלאָרז נייַע מיטל פון טראכטן און יקספּאַנדז די ימאַדזשאַנאַטיוו כוחות פון די מענטשלעך מינים.

ניצן עס איז פּשוט: ערשטער אַ חשבון מוזן זיין באשאפן אויף דיסקאָרד, אַ פּלאַטפאָרמע וואָס האָסץ פאַרשידן קהילות, ווו מידדזשאָורני איז איינער פון זיי. אין דער אַפּלאַקיישאַן זענען די פאַרשידן טשאַטראָאָמס אין וואָס איר קענען אַקטיוולי אָנטייל נעמען אָדער נישט אין דיסקוסיעס.

עס איז וויכטיק צו פונט אויס אַז צו פּרובירן ניצן אַרטיפיסיאַל ינטעלליגענסע פֿאַר די ערשטער מאָל, איר מוזן גיין צו די "נײַער" טשאַנאַלז, ווו 25 פריי רענדערז זענען בנימצא.

איין רעזולטאַט קאָראַספּאַנדז צו דער דור פון פיר פאַרשידענע וועריאַנץ דזשענערייטאַד פֿון דער זעלביקער טעקסטשאַוואַל אַרייַנשרייַב.

אזוי, די 25 רענדערז אָפּשיקן צו 25 פּראַסעסינג דזשאָבס געטאן דורך די Midjourney Bot. דעריבער, דזשענערייטינג די בילד ריקווייערז ינטעראַקטינג מיט די מידדזשאָורניי באָט דורך אַ טעקסט אָנזאָג גערופֿן אַ "שפּיץ," אין וואָס עס וועט זיין טערמינען וואָס דיסקרייבינג די בילד וואָס דער באַניצער האט אין זינען.

איר קענען לייגן ווי פילע דעטאַילס ווי איר ווילט, די וויכטיק זאַך איז צו טיילן די טערמינען מיט אַ קאָמע. אַמאָל די רענדערינג איז פאַרטיק, דער קאָמפּיוטער קערט פיר פאַרשידענע בילדער באזירט אויף די דיסקריפּשאַנז צו קלייַבן פון.

אין אַדישאַן, אַמאָל די פּראָגראַם איז פאַרטיק רענדערינג, איר קענען יבערגעבן דיין פּרעפֿערענצן באזירט אויף די בילדער און, אויב איר ווילט, האָבן פיר מער ווערסיעס דזשענערייטאַד ווידער.

DALL-E 2: די נייַע אַי סיסטעם פֿאַר אַרטווערקס

אין אַדישאַן צו Midjourney, DALL-E 2 איז אויך די נייַע אַי סיסטעם וואָס קענען מאַכן רעאַליסטיש בילדער און אַרטווערקס פֿון אַ נאַטירלעך שפּראַך באַשרייַבונג. ניט בלויז דאָס, DALL-E 2 קענען אויך פאַרבינדן קאַנסעפּס, אַטריביוץ און סטיילז.

די שטאַרקייט פון די נייַע אַי סיסטעם איז אויך ביכולת צו יקספּאַנד בילדער ווייַטער פון וואָס איז אין דער אָריגינעל לייַוונט, קריייטינג נייַ יקספּאַנסט חיבורים. אין אַדישאַן, עס קענען מאַכן רעאַליסטיש ענדערונגען צו יגזיסטינג בילדער פֿון אַ נאַטירלעך שפּראַך קעפּל און קענען לייגן און באַזייַטיקן עלעמענטן מיט שאַדאָוז, ריפלעקשאַנז און טעקסטשערז.

די קייפּאַבילאַטיז פון DALL-E 2 אויך אַרייַננעמען גענומען אַ בילד און קריייטינג עטלעכע ווערייישאַנז פון עס ינספּייערד דורך דער אָריגינעל. DALL-E 2 האט געלערנט די שייכות צווישן בילדער און די טעקסט געניצט צו באַשרייַבן זיי.

עס ניצט אַ פּראָצעס גערופן "דיפיוזשאַן," וואָס סטאַרץ מיט אַ מוסטער פון טראַפ - דאַץ און ביסלעכווייַז אַלטערט דעם מוסטער צו אַ בילד ווען עס אנערקענט ספּעציפיש אַספּעקץ פון דעם בילד.

אַזוי, נאָך OpenAI ינטראָודוסט DALL-E אין יאנואר 2021, איצט די נואַסט סיסטעם, DALL-E 2, דזשענערייץ מער רעאַליסטיש און פּינטלעך בילדער מיט פיר מאָל די האַכלאָטע.

DALL-E 2 סטאַרטעד ווי אַ פאָרשונג פּרויעקט און איז איצט בנימצא ווי אַ ביתא ווערסיע. זיכערהייט מיטיגיישאַנז וואָס די סיסטעם האט דעוועלאָפּעד און האלט צו פֿאַרבעסערן אַרייַננעמען: באַגרענעצן די סיסטעם ס פיייקייט צו דזשענערייט היציק, האַס אָדער דערוואַקסן בילדער, און לערנען-באזירט פאַסעד דיפּלוימאַנט.

מקור: https://en.cryptonomist.ch/2023/02/02/ai-generative-art/