趣味バンドマンの何でもブログ

趣味でバンドマンやっている私が役立ち情報や話題の話、日々の活動を語るブログです

検証実験:AWAの自動音声認識機能は曲が短くても大丈夫?

f:id:take5maroon5:20190821212026p:plain

当ブログでは以前にAWAの自動音声認識機能についてふれていました。

 

www.seekcalling.com

 

今回操作をしていまして、ふと思った事があります。

 

それは、「この機能、どこまで短くても反応してくれるのだろうか?

 

そこで今回は自動音声認識機能がどこまで短くても反応してくれるか検証してみます。

 

 

実験方法その1:各パートだけ

 

まず、曲を用意します。

 

そうですね、今手元にこの曲があったので、こちらを使ってみます。

 

www.youtube.com

 

UVERworldの「colors of Heart」にします。

 

こちらの曲の音源をCubaseに取り込みます。

 

f:id:take5maroon5:20190822212058p:plain

 

 こちらの画面からイントロ、Aメロ、Bメロ、サビをそれぞれ分け、各パートだけを再生、それを自動音声認識機能に取り込みさせて、楽曲を表示できるかを検証してみます。

 

 

f:id:take5maroon5:20190822213358p:plain

 

こんな感じに分けてみました。

 

ちょっと見づらいのですが、14個ほどのセクションを分けてみました。

 

 

f:id:take5maroon5:20190822213244p:plain

 楽曲があるのは確認済みです。

 

では早速実験開始です。

 

実験1結果

 

すべてのセクションで読み取りができました。

 

時たま、シングル盤アルバム版とで違った結果の読み取りをしておりましたが、間違いなくこの曲の読み取りができました。

 

結果としては、各セクションの読み取りは問題なくできるということが判明しました。

 

では、次の実験をしてみようと思います。

 

実験方法その2:8小節分のみ

 

曲はコード進行がきまっており、そのコード進行を4小節分、または8小節分繰り返すことでAメロ、Bメロと形成していきます。

 

この曲は展開がちょっとややこしいのですが、8小節分読みとらせ、曲の判定ができるかを検証します。

 

なお、上の画像でわけたセクションのうち、8小節未満のセクションは除外します。

 

実験2結果

 

すべてのセクションで読み取りができました。

 

スマホをスピーカー近づけて、スマホの操作をしつつ再生停止の操作をしていて気づいたのですが、セクションによっては4小節以内には判定していたのです。

 

4小節というと、これぐらいです。

 

www.dropbox.com

 

時間にしてたった5秒もあれば特定できるようです。

 

さすがにこれだけでおわったらおもしろくないのでちょっと意地が悪い実験をしてみます。

 

実験方法その3:2小節分のみ

 

4小節分以内で特定できるのなら、4小節分でやっても意味がないので一気に2小節に飛びます。

 

ちなみに2小節分は、これだけです。

 

www.dropbox.com

 

こんなに短くて読み取りできるのでしょうか?

 

では実験開始!

 

実験3結果

 

読み取りできませんでした!

 

f:id:take5maroon5:20190819232208p:plain

すべてのセクションで頭2小節分再生しましたが、ダメでした!

 

すくなくとも、今回の実験では自動音声認識機能は最低5秒以上あれば読み取りができることが判明しました。

 

しかし、5秒もあれば解析できるのはすごいですね!

 

おまけ

 

この実験の最中、面白半分で実は2小節分のリピート再生をしていました。

 

音源にするとこんな感じになりました。

 

www.dropbox.com

 

こちらのよみとらせたところ、なんと普通に読み取ってくれました!

 

なら他のパートもと思い、セクション2もリピート再生させたところ、いくらやっても読み取りが出来ませんでした(-_-;)

 

サビよりイントロの方が精度が高いということなのでしょうか?

 

ちょっと良くわかりませんね(-_-;)

 

まあ、普通は2小節分だけリピート再生するなんてことやらないので、滅多に出会えないとは思いますが・・・。

 

 

 

まとめ

 

AWAの自動音声認識機能がどれだけ判定能力があるか実験してみましたが、いかがでしたでしょうか?

 

 

2小節以内で特定できるのはすごいですね。

 

みなさんも面白半分でやってみてもよいかもしれませんね。

 

 

awa.fm