生成系AI(Generative AI)は、人間のようなオリジナルの出力を生成するためのアルゴリズムを使用して設計された人工知能の一種です。これには、テキスト、画像、音楽、音声、あるいはその他の形式のデータが含まれます。生成系AIは新しいデータを「作り出す」ため、データ生成という点で区別されます。
生成系AIの最も一般的な形式の一つは、生成的敵対ネットワーク(GAN)です。GANは2つの部分、生成ネットワークと識別ネットワークから成り立ち、お互いに競争しながら学習します。生成ネットワークは新しいデータを生成し、識別ネットワークはそのデータが本物(つまり、訓練データセットから取得したデータ)か偽物(つまり、生成ネットワークが生成したデータ)かを判断します。このプロセスを繰り返すことで、生成ネットワークは徐々に本物に見えるデータを生成する能力を向上させます。
また、生成系AIの別の一般的な形式は、変分オートエンコーダ(VAE)です。VAEは、入力データを圧縮表現(通常は低次元)にエンコードし、その圧縮表現から元のデータを再構成(デコード)します。このエンコードとデコードのプロセスにより、VAEは新しいデータを生成します。
生成系AIの主な利用例は、画像生成、テキスト生成、音声合成、スタイル変換、画像の超解像度など、多岐にわたります。たとえば、AIが文章を生成したり、新しい画像を作成したり、ユーザーの指示に基づいて音楽を作成したりする場合などです。この技術はまた、ディープフェイク(人工知能が生成した信憑性のある偽のデジタルコンテンツ)の作成にも使われます。
なお、このような生成系AIは、大量のデータを学習することでパターンを理解し、それに基づいて新しいデータを生成します。そのため、質の高い出力を得るには大量の訓練データが必要で、生成された結果が常に完全に信頼できるわけではありません。