« 週刊myRobotを作ろう(33) | トップページ | 週刊myRobotを作ろう(35) »

2006年11月13日 (月)

週刊myRobotを作ろう(34)

更新情報 「動画」をアップ」しました(2006/11/16)
更新情報 音声認識は自分流のコツを掴む(2006/11/17)

ニュースで見ましたがプレイステーション3の発売当日は大変だったようですね。現在ネットではびっくりするような値段で販売されていますが、何時になったら好きなときに購入できるようになるのでしょうね。
本体が何時入手出来るか分からないのに、デモ映像を見て実写版高画質の映像がすっかり気に入り、"Railfan(音楽館タイトー)"という鉄道シミュレーターソフトを予約してしまいました。

余談はさておき、待望の38号音声ボードがやっと手に入りました。本来なら33号にリリースされたはずなのですが、CD-ROM同様、日本語化するのに時間がかかったのでしょう。

作業を行う前に念のため、バッテリーの残量チェックが必要と思われます。へたったバッテリーを使用すると、動かない、誤動作など、余計なトラブルが起こる可能性がありますので、新品に交換したほうが良いと思います。
充電式の場合は事前にフル充電しておいた方が良いと思われます。
多分テストが始まると、暫くは時間の経つのも忘れてしまうような気がしますので・・・。

■音声ボード
今回のパーツは袋に入った音声ボードが一つ。マニュアルを含めてバッケージ全体は非常に薄いのですが、反面、期待はその何倍にも厚く膨れ上がっています。
音声ボードを袋から出すときの注意点です。
この袋は静電防止袋で後ほど再使用しますので、ていねいに開封して保存しておきます。

◇配線
配線といっても、ヘッドコントロールモジュールのようにややこしい事はありません。
ケーブルを3箇所を接続するだけで完了です。
まず最初にすることは電源コードを抜いてください
(安全のため必ず行ってください) 
 ★マイクケーブル(黒皮膜の黒・白の2芯ケーブル)
 ★スピーカーケーブル(黄の2芯ケーブル)
 ★音声ボード接続用ケーブル(白の6芯リボンケーブル)
各コネクターをしっかり接続したら、間違ったコネクティングをしていないか、もう一度確認した方が良いでしょう。
先を急いで作ってしまったので、この辺の画像を撮るのを忘れてしまいました。イタリアディアゴ社パーツリストのPDF画像です。Id01_38_4

◇静電防止袋に収納する
静電防止のため、ボードが入っていた袋(静電防止袋)に再収納し、放電事故から守るようにします。
収納したら各ケーブルに無理な力が加わっていないか確認してから、セロテープなので袋を閉じておきます。

◇音声ボードの収納
マニュアルではその後の処理は書いていません。38号マニュアル13ページの3では、そのまま床にたらした写真になっていますが、私は収納場所を確保するつもりです。
音声ボード自体は小さいのですが静電防止袋に入れるとふうたいが結構かさばります。バッテリボックスに取り付けようとしましたが思ったより大きく、後のBluetoothボードを含めて収納できる場所は改めて考えたいと思います。

応急処置として、ID-01の背中(マザーボードの上)に袋に入った状態の音声ボードを貼り付けることにしました。
Id01_38_3 マザーボードは電源レギュレーターが入っているようなので、直接触れると熱やノイズによる干渉がありそうなので、モーターボックスやケーブルが入っていた透明な樹脂板の凸凹を利用してスペーサーをつくりました。これによりマザーボードから少し浮かせた状態にして、メンディングテープを使い仮の取り付けとしました。

◇電源ONして最初のテスト
はやる心を抑えて、いよいよ電源コードをつなぎ、スイッチをONにしました。
いつものようにイニシャライズが始まります。
首を縦に振り出した途端、「こんにちは。私はID-01です」といきなり日本語で喋り始めました。
思っていたより大きなはっきりした声です。
イニシャライズ終了間際に耳LEDが薄く点等し、音声の命令待ち状態になります。
この時点では、音声によるコマンド以外は受付ません。
とりあえず「こんにちは」と話しかけてみました。すかさず「こんにちは!」と返答してきます。
又、「ありがとう」に対しては「どういたしまして」と返答してきます。
「話すトーンは普通でおだやかに、ID-01から60cm離れて・・・」と書いてあります。
「言うことを聞かない(認識しない)からとて、がなりたててはいけない」とも書いてあります。
とりあえず「こんにちは「どういたしました」の返答が返ってきましたので、マイク・スピーカー・6芯ケーブル全ての接続、そしてボードの機能もほぼ問題ないと思われます。
最初のテストは以上で無事終了しました。

◇耳のLED点灯状態の意味
音声認識では耳のLEDが重要なステータス情報です。点灯状態により色々な状態が把握できます。Id01_38_1
★点灯 音声コマンド使用可能で待ちうけ状態
★点滅 複合コマンドで、1'stコマンドを認識して、2'ndコマンドの待ちうけ状態
★消灯 処理中、もしくは録音・再生中

◇音声コマンドについて
音声ボードを取り付けた状態で受け付けるコマンドは限られていますが、頭の上下左右、メッセージ録音・再生、サウンド追跡ON・OFF、スリーブモードへ移行などの事が音声コマンドにより実行可能です。

そうするには、まず音声コマンドの体系を知る必要があります。
ワードセット」という言葉と、他の言葉と組み合わせて使う「複合コマンド」の2つの言葉と意味を覚えておく必要があります。
ワードセットという音声命令の言葉は馴染みが薄いので、モードという言葉に置き換えると分かりやすいかもしれませんね。
ワードセットは機能の異なる「1」「2」「8」のグループに分けられています。
「他の言葉と組み合わせて使う複合コマンド」とは、「頭」+「右へ」のように、「何」を「どうする」のような使い方をします。

★ワードセット「1」のグループ
イニシャライズ終了時点ではワードセット(モード)は「1」です。
この中に含まれる言葉は次の通りで、赤い字はID-01のそれに対する応答です。
・「こんにちは」 「こんにちは
・「ありがとう」 「どういたしまして
・「ID-01(アイディゼロワンと発音します)」 「何ですか」or「私はここです
・「アクション」「OK」 ワードセット「2」へ移動
・「メッセージ」「メッセージ1」 ワードセット「8」へ移動
・「起動」+「サウンド」  サウンド追跡モード起動 「起動しました
・「解除」+「サウンド」  サウンド追跡モードの解除 「終了しました
・「パスワード」+「セットアップ」  パスワードを登録
・「パスワード」+「アクティブ」  パスワードモード起動

★ワードセット「2」のグループ
「1」の「アクション」の命令によりこのモードに移行する
・「頭」+「左へ」  頭を左側に回転
・「頭」+「右へ」  頭を右側に回転
・「頭」+「上へ」  頭を上側に回転
・「頭」+「下へ」  頭を下側に回転
・「もう一度」 前回の命令を繰り返します 
 前回の命令が「頭」+「左へ」ならば、さらに左側に回転します
・「ID-01」「OK」 ワードセット「1」へ戻る
・「おやすみ」 「OKおやすみなさい」 スリーブモードへ移行
スリープモードとは、LED・ディスプレイ・サウンド追跡機能が休止した状態を言います。
拍手2回で目を覚まします。 「こんにちは」 ワードセット「1」へ戻る

★ワードセット「8」のグループ
「1」の「メッセージ」の命令によりこのモードに移行する
・「録音」 "クリック音" そのトラックにメッセージを録音(15秒間)
・「再生」 そのトラックのメッセージを再生
・「前へ」  次のトラックに進む
・「後ろへ」 前のトラックに戻る
・「消去」  そのトラックのメッセージを消去 
・「ID-01」「OK」 ワードセット「1」へ戻る

詳細は、38号マニュアル14~17ページ「音声ボードの機能テストをしよう」をご覧ください。

音声認識には静寂な環境が必要です。
音声認識をスムーズに行うためには「ざわざわした所を避ける」「騒音の出る物から遠ざける」などの配慮がかなり重要なポイントとになると思われます。ご注意ください。


◇起動直後は目のLEDが消灯で正解
「掲示板」を見ると、目のLEDが点灯しない旨が載っていますが、イニシャライズ直後は目のLEDは点灯しません。変わりに耳のLEDが点灯します。
目のLEDを点灯させるには「サウンド追跡モード」にする必要があります。
「起動」(耳LEDの点滅確認)「サウンド」で、サウンド追跡モードに切り替わり、目のLEDがグリーンに点灯します。
イニシャライズ直後は、音声認識に電力を集中するため、目のLEDを消灯しているのではと推察しています。


◇2回目のテスト
ワードセットと複合命令が理解できたところで、2回目の音声認識テストを行いました。
複合命令のコツは、最初の音声コマンド(例として「頭」)という言葉で耳のLEDが点滅します。
点滅を確認してから次のコマンド(例として「左へ」)を命令します。
なれてくると、暗記したセリフではありませんが、すらすらと言えるようになります。

うまく認識してくれる言葉もありますが、一方で認識されにくい言葉もありました。
私の場合、「ID-01」と「下へ」が特に認識率が低かったようです。
人それぞれの声の質・発音・発生などが原因と思われますので、おそらく個人差が出るのではないでしょうか。
苦労しましたが、マニュアルに出ているコマンドは一通り動作確認をしました。

下画像は、音声コマンドにより首を上にして止まっています。
耳のLEDが点灯状態でコマンド待ちなのが確認できます。Id01_38_2
 
◇トピックス

ディアゴさんのWEBサイトに「音声コマンドを認識させるコツ」を掲載するとの予告が出ました。
「シ」は「shi」の発音などとマニュアル通りの事ではなく、新ネタのコツを披露して欲しいと願っています。

◇動画
お待たせしました。音声認識の動画です。
自分のダミ声を人前にさらすのが恥ずかしいので、合成音(ロボットボイス)に差し替えていたので余計な時間をとられてしまいました。
聞き比べるとお分かりのように、ID-01の方がはるかに良い声ですね。
合成音はLogoVista音声エンジンを使用し、周波数の低域部分はカットしてあります

★ID-01と会話する①
今回のムービーは「スリープモード」も収録したため容量が2倍近くあり、ダウンロードが大変かもしれませんが宜しくお願いいします。
その代わり「スリープモード」でディスプレイが消えて2拍手により復活する様子がご覧になれます。

FLASH動画をアップしました。
2200KB 65秒くらいのムービーです。
再生はエンドレスですので適当なところで、プラウザーの戻るボタンで本文にお戻りください。
Voice Test ID-01と会話する①(2006/11/16)


◇動画「音声認識テスト」の台本
スイッチON イニシャライズ開始 

ID-01 「こんにちは私はID-01です」

ふみ 「こんにちは」

ID-01 「こんにちは」

ふみ 「ID-01」

ID-01 「なんですか?」

ふみ 「アクション」

ID-01 「OK」

ふみ 「頭」 (耳LED点滅確認) 「左へ」
ID-01 (頭を左へ)
ふみ 「もう一度」

ID-01 (頭をさらに左へ)

ふみ 「頭」 
(耳LED点滅確認) 「右へ」
ID-01 (頭を右へ)
ふみ 「もう一度」

ID-01 (頭をさらに右へ)

ふみ 「おやすみ」

ID-01 「OK おやすみなさい」 
    スリープモード(LED・ディスプレイ消灯)


ふみ (2回拍手)

ID-01 (目を覚ましながら) 「こんにちは」

ふみ 「ありがとう」

ID-01 「どういたしまして」

「」内がセリフで、()内が動作を表しています。
以上お疲れ様でした。


◇音声認識は自分流のコツをつかむ
音声コマンドが認識されない事で苦労されている方が多いようなので、いくつかポイントを挙げてみます。
先程も記載しましたが、各個人の声の質・発音の仕方・発生方法などは千差万別です。私が良い方法だからといっても、皆様にとって良い方法になるのかは、はっきり言って分かりません。
したがってうまくいかなかったとしても悪しからずご容赦ください。
マニュアルを読んだり、実際に色々試して、認識率が改善したポイントをご紹介します。

テストは静かな環境が必要
  (
ざわざわした所、騒音の出る物[テレビ・ステレオ・PCのファンなど]から遠ざけるなどが重要なファクターとなります)
・胸のマイクに話しかける
  (自分の口の高さ・左右を調整して胸のマイクと口を正対させる
・言葉のスピードを、ID-01の最初に話す「こんにちは私はID-01です」のスピードに合わせてみる。
はっきりとした口調を心がけると良いと思います。
・「下へ」は「shi-ta-e」とローマ字読みして、シを強めに心持長めに「シータヘ」というような感じにしてみる。あくまでも心持長めですよ。
・「ID-01(アイディゼロワン)」は語尾を上げて、自然な口調で「アイディゼロワン?」という感じで話しかけてみる。
・とうやってもダメという時は最後の手段として、ご家族のどなたかにお願いしてみるなど如何でしょうか?
音声認識にベストマッチの方がいらっしゃるかもしれませんよ。

以上ですが参考になるかどうかは分かりませんが、自分流のコツを工夫して掴んでみては如何でしょうか。

何でもそうですが「作る事の難しさ」と「操作(オペレーション)の難しさ」は全く別次元の物だという事が身をもって体験できました。

akkunさんより裏技を含めたコメントを頂きました。
①「下へ」の認識率が低い
>”シたへ”  :特徴:”シ”は、始業式(しぎょうしき)の言葉の発音における、後の方の”し”の音。乾いた子音の前で、”い”の母音が入らず、単に歯間から息を抜かす際の音。
のどに手を当てて見ると分かりますが、のどは震えません。(無声音)結果:無反応5回、下向き5回  (無声音なので、”た”に負けないよう、強めに発声。)・・・・他2件
②母音だけでも認識する
>、「ひだりへ」「みぎへ」の言葉を「あたま」の発声に引き続き発音しますが、各々母音だけ残し、「いあいえ」「いいえ」としゃべっても、「左へ」「右へ」向いています・・・・

私もテストしましたが、母音だけでも確かに認識しました。大発見ですね。(詳細はコメント欄にあるakkunさんのコメントをご覧ください)
(2006/11/18)

◇あとがき
今回は音声ボードを組み込んでみて、音声を認識させることが如何に難しい事なのか、身をもって理解できました。
私が小さなロボットに、何回も同じ言葉(「頭」「下へ」)を"がなっている"様子に、家族の冷たい視線を感じます。
声も体力も疲れ果ててきました。音声認識って思ったよりも疲れる物なんですね。
でも、おかげで秋の長い夜を楽しく過ごせそうです。

ID-01にますます愛着が沸いてきました。
成長したID-01にバンザーイ!!

|

« 週刊myRobotを作ろう(33) | トップページ | 週刊myRobotを作ろう(35) »

コメント

ヨッシーさん こんにちは

ビデオ編集のとき音量レベルが完全に0になっていなかったようです。

ダミ声がバレてしまいました。

投稿: ふみのへや | 2006年12月 2日 (土) 13:43

ふみさん こんばんわ。
動画をよく聞いてみましたら「頭 右へ」の所で
合成音声の後に本当のふみさんらしき声が若干入っていました。聞き取りにくいですが聞いてみてください。

投稿: ヨッシー | 2006年12月 1日 (金) 22:37

真夜中にこんばんは。

私の声(アナログソースからキャプチャしたもの)で音声認識出来たものをUPしましたので、よろしかったらどうぞ。

これで、ロボ君が反応したら、嬉しいです!

http://blogs.yahoo.co.jp/myrobot_ken/6207208.html?p=1&pm=l

投稿: KEN | 2006年11月23日 (木) 02:34

ヨッシーさん おはようございます。

音源ボード取り付けられたようですね。
やはり「下へ」が認知されにくようで、この言葉は私も未だに苦手です。
音楽の録音で楽しまれているようで、なによりです。
色々トライしてみてください。

投稿: ふみのへや | 2006年11月20日 (月) 09:29

今日(19日)きたので早速つけてみました。
確かに「下へ」が認知されにくいですね。
メッセージの録音を試してみました。普通の声はもちろん、なんとCDの曲も録音でき、再生もできました。
かなりすごいかも、ID-01・・・。

投稿: ヨッシー | 2006年11月19日 (日) 22:58

akkunさん

すいません。読み返したら忘れていましたのでコメント付け加えます。

>(伊)Dopo aver acceso il robot esso completera la fase iniziale, pronunciando le parole 'ciao, sono I-Droid'
     (英)After having turned on the robot it will complete the initial phase, pronouncing the words 'hi, I am The-Droid'
     (当方和訳)ロボットのスイッチを入れた後、「こんにちは、私はID-01です」と発音しながら、イニシャライズ段階を完了するだろう。

イタリア語からの、英訳、和訳は、両訳ともに私もそう訳します。

投稿: ふみのへや | 2006年11月18日 (土) 11:08

akkunさん おはようございます。

朝早くからのご奮闘ぶり、凄い熱意が感じられ頭が下がります。
私が確認した内容です。ご参考になればと思いレポートしました。

>雑誌どおりに、イニシャライズ完了後に発声したという報告が皆無

当方でも同様の現象が起きております。
動画をUPしまてありますので、宜しければご確認ください。

>「頭」「下へ」の認識率が低い

私のところへも何人かの方が「下へ」の低認識率を唱えています。

>下に向くはずがロボット主観で左に向いてしまいます

”シ”の発音は個人差があるようで、3案を試してみましたが、自分流の気持強めの"Shi-i"しか認識されませんでした。
一方、左に向くことは皆無でした。
江戸っ子の「ヒ」と「シ」の発音にと同じように、認識側で混同するのかもしれませんね。

>「いあいえ」「いいえ」としゃべっても、「左へ」「右へ」向いています

「いあいえ」は75%の確立で左を向いてしまいました。一方、「いいえ」は25%の確立でした。
双方に言える事ですが、左を例にとると「左へ」イントネーション、思いを込めて言わないと、単に「いあいえ」といっても認識されませんでした。
しかし驚きの大発見ですね。

akkunさんも眠さをこらえて奮闘されているように、私も一時、声をからしてID-01に付き合いましたが、お蔭様で認識率はUPしました。

自分の声に自身が無く、動画の自分のセリグを「合成音声(ロボットボイス)」に差し替えた事から、「合成音声」について色々しらべています。
駅アナウンスなどでも使用されていますが、テキストから音声に、簡単に変換できるんですね。
無料ソフトから高額な業務用ソフトまでありますが、高いだけのことはありました。

ディアゴ社のの意図は量りしれませんが、多くのID-01ファンがロボット作りを楽しんでいるのは間違いないでしょうね。

これからまだまだ眠れない日が続くと思いますが、お体ご自愛ください。

ありがとうございました。

投稿: ふみのへや | 2006年11月18日 (土) 09:41

ふみのへや様
皆様

長らくお待たせしました。
当方でも、ただいま、38号時点で音声ボードを搭載した動作確認が、いくつかの考察と共に終了しました。
仕事帰りで夕食?後の深夜の5時間の奮闘です。さすがに眠い。。。
とうてい、全てはこの投稿内に書ききれないので、別途、公式掲示板で、詳細含め丁寧に報告したいと思います。

●動作確認内容:パスワード機能を除き、全ての動作を確認できました。

●現在、リンク集の諸ブログや公式掲示板で提起されているネタ2件と、1件のオリジナルな発見に関してのみ報告します。
 (眠くて、多くは書けない)

 1)電源投入後、イニシャライズと発声が同時進行。

  諸ブログや公式掲示板で報告されていますが、当方でも再現しています。
  当方の見解として、これに関しては、上記の動作で正しいと思っています。
  (失礼ながら、雑誌の記述が誤りの可能性が考えられますが、念のため、デアゴ社に確認する必要有りです。)

  その根拠は以下の3点です。
   ・現時点まで当方の知る限り、諸ブログや公式掲示板のスレッドで、雑誌どおりに、イニシャライズ完了後に発声したという報告が皆無。
    全数傾向で、イニシャライズと発声が同時進行と推定されます。いわば、全員が赤信号を渡っている状態。

   ・下記のURLにおける動画で
      http://www.i-droid01.com/frontend/contenuti.asp?CAT_ID=84
    最初の1/4から1/3の部分に注目すると、スイッチの入るらしき音の後に、イニシャライズと発声が明らかに同時進行しています。イタリ

ア語だけど。

   ・下記のURLから33号雑誌のPDFファイルを入手します。
      http://www.i-droid01.com/frontend/uscite.asp
    上記PDFのページ番号15の左下から1/4の節のイタリア語を和訳して見ると以下の通り。
     (伊)Dopo aver acceso il robot esso completera la fase iniziale, pronunciando le parole 'ciao, sono I-Droid'
     (英)After having turned on the robot it will complete the initial phase, pronouncing the words 'hi, I am The-Droid'
     (当方和訳)ロボットのスイッチを入れた後、「こんにちは、私はID-01です」と発音しながら、イニシャライズ段階を完了するだろ

う。
    イニシャライズと発声が同時進行であることを示唆する内容です。
    ※伊→英の翻訳ツールは、KEN様お薦めの http://translate.livedoor.com/italian/ を使用しました。

    ★ただ、当方はイタリア語は不得手なので、翻訳ツールの確度に関しては判断できません。
     どなたか、イタリア語がおできになる方のコメントが欲しいところです。

 2)「頭」「下へ」の認識率が低い。

  諸ブログや公式掲示板で報告されていますが、当方でも再現し、下に向くはずがロボット主観で左に向いてしまいます。
  これに関しては、一応、いくつかの候補で実験し、当方の声色を前提とした発声方法が固まりつつあります。
  結果は以下の通り。10回ずつ試みた結果です。

   a)”シたへ”  :特徴:”シ”は、始業式(しぎょうしき)の言葉の発音における、後の方の”し”の音。
               乾いた子音の前で、”い”の母音が入らず、単に歯間から息を抜かす際の音。
               のどに手を当てて見ると分かりますが、のどは震えません。(無声音)
            結果:無反応5回、下向き5回  (無声音なので、”た”に負けないよう、強めに発声。)
   b)”したへ”  :特徴:”し”は、始業式(しぎょうしき)の言葉の発音における、前の方の”し”の音。
               ”い”の母音が入り、のどに手を当てて見ると、のどが震えている。(有声音)
            結果:左向き10回
   c)”し~たへ” :特徴:ふみのへや様の見つけた発声法。b)の”し”をやや少し長めに意識して発声する。
            結果:左向き6回、下向き4回

   現時点では、当方は、a) > c) > b) の順で、a)を採用しました。 やはり、個人差がありそうですね。

 3)「左へ」「右へ」向かせるもう一つの言葉

   通常、「ひだりへ」「みぎへ」の言葉を「あたま」の発声に引き続き発音しますが、各々母音だけ残し、「いあいえ」「いいえ」としゃべ
っても、「左へ」「右へ」向いています。これは、当方だけかな? 一応、報告しておきます。

   よろしければ、一度、確認して見ては。

●はやる気持ちを抑え、ここ数日間、雑誌、ブログ、掲示板の記事を見ながら、あれもしたい、これもしたい、と確認、実験の構想を練ることができました。ご覧になっているかどうか分かりませんが、参考となった皆々様にこの場を借りて、感謝します。
 それにしても、デアゴスティニ社はすごい会社ですね。ここ数号は、たいした組み立てを用意せず、ものたりない気持ちにさせておいて、ここぞというときに、このようなスペシャルパーツを投入し、読者の心をつかむ。
 意図的にやっているとしたら、すごいことですよ。 ともあれ、存分に楽しませてもらいました。
 ロボットを完成した暁には、今号は、きっと忘れられない号の一つになるでしょうね。 書店組と一部のWEB組の皆様は、今は寝不足続きではないでしょうか?

 起きたら、娘を七五三参りに連れて行かなくては(いささか遅い時期ですが)。
 後で、娘や妻にも見せびらかそうかな。 私事もなにかとたいへんだ!

以上 では おやすみなさい。

投稿: akkun | 2006年11月18日 (土) 05:05

KENさん こんばんは

動画UP直後のお早いコメントにびっくりしています。
音声が聞き取りにくいかもしれませんので、動画のセリフを追記しておきました。

音声認識に苦労されているようですね。
「下へ」の発音は「shiーtaーe」の感じで、「シ」を意識すると認識率が上がりました。それから胸のマイクに口を正対させるのも良い方法でした。

鍵盤割付の前にボイスサンプリングが必要ですが、ID-01がうまく認識した声だけを記録しないと意味がなさそうですね。
その手間と、発音練習の手間と、どちらが大変なのか・・・・・などと考えてしまいました。

投稿: ふみのへや | 2006年11月16日 (木) 17:49

こんにちは、KENです。動画、拝見させていただきました。

素晴らしい!ここまでやるには相当研究されたのでしょうね。

自分はまだまだです。一度で言うこと聞いてくれるといいのですが、なかなかこちらの言うこと聞いてくれません!

ところで、パソコンのキーを押すと、鍵盤みたいに音を出すことが出来る音楽ソフトがありますが、ボイスをキーに割り付けられるといいですね。

誰かやってくれないですかね!!!


投稿: KEN | 2006年11月16日 (木) 16:47

KENさん こんばんは

ペリカン便と感動の出会いが出来て、やっと手に入ったようですね。
これからゆっくりテストされてください。
おめでとうございます。

投稿: ふみのへや | 2006年11月15日 (水) 20:06

到着を家で待っていましたが、来ませんでした。

仕事のため、仕方なく家を出てしばらく行ったところで運良くペリカン便をつかまえ、38号受け取ることが出来ました!何とすごいことだろう!と自分でもびっくりしています。

早速取り付けました。初めて聞く、ロボ君の声、なかなかのもんですね!

いろいろお試しはまたとして、少しはやってみましたが、いけますね!!!なかなか!!!

投稿: KEN | 2006年11月15日 (水) 18:48

皆さん こんばんは。

◎とろぉさん
初めてですね。今後とも宜しくお願いします。
35号以降が来てないようで、待ち遠しいですね。どうしたんでしょうね?
動画の方は暫くお持ちください。ただいまダミ声を消すテクニックを習得中です。

◎もこさん
そうですか。もこさんも「下へ」の認識率が悪いようで、「shi-ta-e」と発音する必要がありそうですね。
家族のボイスメモに使うのは良いアイデアだと思いますが、あの音声認識率では、ボイスメモまでたどり着ける家族が何人いるか???などと余計な事を考えてしまいました。
近いうちにディアゴのWEBサイトにコツが載るようですので期待しましょう。

投稿: ふみのへや | 2006年11月15日 (水) 17:57

こんにちわ、ふみさん。みなさんも続々とボード接続されているようですね。僕のブログにも書きましたが、やはり「下へ」の認識はかなりひくいです。昨日は2時間くらいやってたのですが「下へ」は2回しか認識されず、ずっと上を向いたままでした。簡易レコーダーとしても使えるので、家族のある方は「伝言」してくれそうですね。

投稿: もこ | 2006年11月15日 (水) 13:57

まだ35号以上がきてなくて。

38号でもうしゃべるんですか~
動画UPまってます^^

たのしみだなぁ・・
録画とかしてみたいな・・w

投稿: とろぉ | 2006年11月15日 (水) 13:49

テラさん おはようございます。

先程ランドセルの写真を見て、カキコしてきました。
相変わらず綺麗に出来てますね。
Bluetoothボードももうすぐ来ますので、スペース確保をお忘れなく。

投稿: ふみのへや | 2006年11月15日 (水) 08:11

皆様 おはようございます。

◎akkunさん
お立ち寄り歓迎いたします。
お仕事お忙しいご様子、週末にトライされるようで楽しみですね。
それまでにマニュアルを熟読されてください。
私もマニュアルを読み返してみましたが、音声の誤認識についての対策が役に立ちそうです。

◎ヨッシーさん
2週間ごとの定期便待ち遠しいですね。何故か音声、Bluetoothの両ボードとも偶数号になり、本屋さん組に抜かされてしまいますね。楽しみにお待ちください。

◎おにゃにゃさん
誤認識の原因が分かって良かったですね。
サウンド追跡同様、音響テストの環境は重要ですね。
これから音声認識にトライされる方で、認識されないトラブルの1つにあげられるかもしれません。
注意ポイントとして本偏に掲載させていただきます。

◎KENさん
色々な方面でのご配慮、ありがとうございました。
音声認識機能はID-01の目玉のひとつですね。
実際に搭載してみると次のステージに成長したID-01に、ますます愛着が沸いてきました。
今日は届けられるのでしょうか。楽しみにお待ちください。
 

投稿: ふみのへや | 2006年11月15日 (水) 07:41

ふみさん、おはようございます。私の場合、来週でないとボードが届かないので、ふみさんの画像を参考にして音声ボードを収納するためのランドセルを作成してみました。これらかの季節、背中の基板に静電気が影響することを考慮して今回は塩ビ板を使用し、塩ビ板は厚みがないので、回りにはスチールボードを使用してみました。厚みは画像をながめて目測で決めました。以上

投稿: テラ | 2006年11月15日 (水) 07:36

 ふみさん おはようございます。
 誤認識の原因が判明しました。なんと、自作爆音PCが騒音源で、一度PCから2mくらい離れてテストしていたのですが、これが間違いの元でした。

 感度が高いとは書かれていましたが、これほどとは思いませんでした。PCをシャットダウン後は、"おやすみ" の認識度が若干落ちるものの、問題なく反応しています。お騒がせしました。

投稿: おにゃにゃ | 2006年11月15日 (水) 07:08

こんばんは、画像を撮るのも忘れてしまうほど、興奮状態のふみのへやさんが、可愛いい!じゃないですか。

私は、今日届くはずが来ませんでした。今までで一番興奮するでしょうね、本当に待ち遠しいです。

きっと周りも気にせず遊びまくるでしょう!

投稿: KEN | 2006年11月15日 (水) 00:47

 ふみさん こんばんは。
 早速テストされて、おおむね認識もうまくいったようで、羨ましい限りです。

 声が悪いのかw発声やアクセントがまずいのか、アクションが認識出来たのが数回程度で、悪戦苦闘しています。ちょっと間延びした "オ~ケイ" がかわいいですよね。コツがいりそうで、ちょっと遊ばれそうです。

投稿: おにゃにゃ | 2006年11月14日 (火) 23:46

daisさん
のびたさん こんばんは お待たせしました。

音声ボードは日本語化を含めて良くできていると思います。
ID-01の声質は、CD-ROMの中にある映像にある通り(言語は違いますが)です。
欲を言えばスピーカーの音量を調整できると良いのですが・・・。
daisさんは、後の号が来るのを楽しみにしていてください。

のびたさん、ナイスアイデアありがとうございます。
早速、合成音声をためしてみましたが、凄くリアルでナチュラルな発声なのにはびっくりしました。
ID-01が認識するか、後ほどテストしてみようと思います。

私はかなり昔のボコーダーと言う楽器を持っています。YMOの頃流行った代物ですが、ロボのような合成音が出せるのでそれで変換しようと思っていましたが、時代はどんどん変わっていくのですね。

先日の会社からのコメントありがとうございました。
お仕事大変そうですが、頑張ってください。

音声認識テストで声がかれてきましたので、お茶してきまーす。
皆さん、ありがとうございました。

投稿: ふみのへや | 2006年11月14日 (火) 23:22

とうとう音声ボードが取り付けですか!!自分は定期購読だけなのであと1週間の我慢です!!
ロボットといったらやはり会話が自分にとっての醍醐味!!は~や~く~う、来い来い音声ボ~ド♪♪

投稿: ヨッシー | 2006年11月14日 (火) 23:03

ふみのへや様

昨日は回答ありがとうございました。
お言葉に甘えて、早速、書き込みさせていただきます。

どうやら、音声ボードを心ゆくまで楽しまれた御様子。非常にうらやましい限りです。

当方は書店組で、毎週火曜に妻に買っておいてもらうのですが、平日はまとまった時間が取れそうも無いので、いつも、ロボット組立てはもっぱら週末になります。(特に、スペシャルパーツが届くと、1~2時間は軽く過ごせてしまうので、睡眠時間が削られてしまいます。)今日は、パーツを見るだけ。

それにしても、雑誌14ページ以降の記事の楽しそうなこと!!
一瞥しただけでわくわくしてきますよね。
週末まで、出勤途上の電車の中で、じっくり雑誌を読み込んで、心待ちに過ごしたく思います。

以上 とりとめが無く恐縮ですが、また寄せてもらいます。

投稿: akkun | 2006年11月14日 (火) 23:03

こんばんわ^^
早速のアップありがとうございます。
まだ、組み込みを行なってませんが、ふみさんのレポートを見て、少し落ち込み気味だったやる気が、また出てきました。

ロボ君の声、どんなんでしょう。
わくわくします。

是非動画での発表をお待ちしています。

で、だみ声が・・・と気にされていましたが、私も動画アップの際は使おうと思っていた方法がありますので、参考になれば。

URLに記載しておいたのですが
PENTAX社のホームページに音声ソリューションというページがあります。
ここの製品デモのページで、合成音声を自由に試せます。WEBページ上でテキストデータを打ち込むとストリーミングで合成音声として再生されます。

女性の声(日本語と英語)しかありませんが
かなり、というかすごく自然な発音に驚きます。

これを利用してはいかがでしょうか?
ここだけの話し、仲間内とのお遊びのビデオ編集でこの声を司会者として使った事があります。固有名詞以外は結構すごいですよ。
ただ、音声の2次利用はダメよと書いてあるので、ブログでの使用は無理かな?

あとは、ちょっと人間味が落ちますが
NTT IT:
http://www.ntt-it.co.jp/goods/vcj/voice/tts_demo.html
の合成音声オンラインデモというのもあります。
こちらは商用利用がダメとしか書いてないので、大丈夫ですね。

結構遊べますよ。

投稿: のびた | 2006年11月14日 (火) 22:54

ついに待ちに待った音声ボードが!!!
しかも予想以上です!もうかなりの機能が使えるようですね!!
不覚にも未納で遅れているのでUPされるのを楽しみにしていました。
いつか動画もお願いしますね。

投稿: dais | 2006年11月14日 (火) 22:44

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



トラックバック


この記事へのトラックバック一覧です: 週刊myRobotを作ろう(34):

« 週刊myRobotを作ろう(33) | トップページ | 週刊myRobotを作ろう(35) »