選択した場所の風景やアップロードした画像に AIがピッタリくる音をその場で探してくれるウェブサービス 『Imaginary Soundscape』の最新版を公開

モデルとサウンドライブラリーを拡張した高精度エンジンをライセンス販売

AIの活用による創造性の発展に取り組む株式会社Qosmo(本社:東京都目黒区、代表取締役社長:徳井直生、以下「コズモ」)は、マルチモーダル深層学習技術を応用した自社アルゴリズムを活用し、入力された画像に適切なサウンドクリップを見つけてくれるウェブサービス、『Imaginary Soundscape』(イマジナリー・サウンドスケープ)の最新バージョンを日英両言語にて無料公開しました。また、本サービスのコア技術である「Img2Sound(イメージtoサウンド)」エンジンのライセンス提供を開始しました。本製品は5月11日〜13日に東京ビッグサイトで予定されている第6回 AI・人工知能EXPO【春】のQosmoブースに出展予定です。

Imaginary Soundscape ウェブサイト https://www.imaginarysoundscape.net/

new imaginary soundscape

写真:Imaginary Soundscape サイトトップページ

■ Imaginary Soundscapeとは

人は一枚の風景写真から、例えば海辺の写真からはさざなみの音を、渋谷のスクランブル交差点の写真からは信号の音など、その場にいたら聞こえるであろう音を想像することがあります。本プロジェクトでは、そのように人が無意識にも想像する行為を、AIを使って外部化したウェブサービスです。ユーザーが選択した画像に基づき、6万個以上のサウンドクリップを含む音声ライブラリーの中からAIが最も合っている音を選び出します。また、Googleストリートビューモードでは、世界中のどこでも好きな場所を歩き回りながら、AIがその場で「想像した」サウンドスケープを体感することができます。本プロジェクトは2017年の開始以来高い注目を集め、これまでに全世界から50万人近くのユーザー様にご利用を頂いています。

35bd1fb3db0eb971a1f6bc25115ff8bd

ストリートビューの写真に合った環境音を見つけてくれるGoogleストリートビューモード

■ 最新版でアップデートされた機能

今回のアップデートにおいては、モデル精度の向上、音声データベースの拡充、UIの向上の3つの変更を加えました。識別モデルをベースにしたモデルから、コントラスティブ学習によるマルチモーダルなモデルに変更しました。また、マッチングの対象となるサウンドデータのライブラリを大幅に拡充しています。これにより今までよりも多様なニュアンスの違いに対してマッチングの感度を高めることができました。 また、初めて利用するユーザー様にも親しみやすいようにインターフェースを向上し、これまでの英語表記に加え、日本語の翻訳も付け加えました。

■ 「Img2Sound(イメージtoサウンド)」エンジンのライセンス提供

この度の新バージョンの開発完了により、本技術の完成度が一定水準に達したことを受け、Imaginary Soundscapeのコア技術である「Img2Sound(イメージtoサウンド)」エンジンのライセンス提供を開始しました。 Img2Sound(イメージtoサウンド)エンジンは、深層学習アルゴリズムによって構築された、画像と音声のそれぞれを多次元の抽象的なベクトル表現に置き換えるための事前学習モデルから構成されます。関連性の高い画像と音声がマッチングされるよう、この2つのベクトル空間をコントラスティブ学習(Contrastive Learning)と言われる手法を応用した比較学習を行うことで、異なる2種類のモダリティー(ここでは画像と音)の類似性を定量化することを可能にしています。本技術はテキストと音、ビデオと音、など様々な種類のメディアを関連付ける事ができる応用性の高い技術となっており、これまでにも弊社ではクライアント企業様の製品・サービス・プロジェクトへのマルチモーダルAI技術の導入支援を行ってきました。

Imaginary Soundscape 技術解説ページ(旧バージョン技術に関してのみ記載、近日アップデート予定) https://qosmo.jp/projects/imaginarysoundscape/

768c4c9478483e34b35dda5054ac253c

図:Img2Sound(イメージtoサウンド)システム概念図

■ 過去の作品展示・受賞履歴

2017

深層学習に関する有力な国際会議 NeurIPS: Machine Learning for Creativity and Designに論文が採択

2018

Media Ambition Tokyo 2018にて“Imaginary Soundwalk” を出展 ※本ウェブサービスの仕組みを応用したサウンドインスタレーション

「Experiments with Google — AI Experiments」に掲載

「Favorite Website Award(FWA) Site of the day」を受賞

■ AI Expo2022春にて展示予定

コズモは、5月11日〜13日に東京ビッグサイトで開催される第6回 AI・人工知能EXPO【春】に出展予定です。本作品及び他の音楽・音関連の最新技術を体感いただける展示を予定しておりますので、ぜひお立ち寄りください。

ご依頼・ご相談などはこちらよりお問い合わせください

お問い合わせ