AIは1千万枚もの高画質画像と言葉の繋がりを学習しました。
グラフィックボードで知られるNVIDIAが、たった3つか4つの単語で文を作るだけで、写実的な画像を生成する人工知能「GauGAN2」を開発しました。千の言葉で説明するような景色が、単語を入れるたびに変化し、望んでいる情景を生み出すことができてしまいます。
以前は、超簡単なラクガキから超リアルな画像を生成する「GauGAN」にビックリしましたが、テキストでの画像生成を追加&統合してきたんですね。
単語を打ち直すたびリアルタイムで変化
タイピングは英語で行ないますが、たとえば最初に「夕暮れの砂浜」と打って、気に入らなければ「岩場の浜辺」や「午後の砂浜」、「雨の砂浜」など打ち直すたびにリアルタイムで画像が変化します。動画でも見て取れますが、まるで天地創造神にでもなったかのようです。
「セグメンテーション・マップ」という窓を開くと、物の位置関係を見ることができ、空や木や岩や川などのラベルを選びつつ、落描きモードを併用して追加や微調整ができるように。これでもっと理想的な画像が作れるようになります。
不要な部分をマスキングし、そこにテキストで新たなイメージを追加することも可能です。まずはこちらから、β版をイジってアレコレ作ってみましょう。サイコロのアイコンを押すと、ランダムな画像も生成できます。
もしかすると、PCの設定次第では音声入力でもテキスト化が可能なんだと思いますが…もしこれ以上進化したら、妄想した脳波で画像生成が可能になっちゃうかもしれませんね。
Source: YouTube (1, 2) via NVIDIA (1, 2) via PC Watch
からの記事と詳細 ( 絵心ゼロでもOK!NVIDIAのAIが3~4単語の文章から写実的な画像を生成できるようになる - ギズモード・ジャパン )
https://ift.tt/3DmzlE9
科学&テクノロジー
No comments:
Post a Comment