OpenFrameworksという3Dの映像表現用のオープンソースライブラリがあるようです。便利そうなので、後でソースを見てみます。

音声合成のWebサービスVoiceText Web API

音声合成ソフトウェアVoiceTextを提供しているHOYAサービスが、VoiceText Web APIというHTTP経由で簡単に音声合成できるサービスを最近公開してくれました。

現在はベータテスト中ということで、無償で利用することができます。ということで、早速Pythonから叩けるようにしてみました。voicetext4pyというレポジトリ名でGitHubに公開しているので、ぜひ皆さんにも使っていただきたいです。ロボットやアバターを喋らせましょう!

まずは下記アドレスから、API利用登録を行ってアクセスキーを取得してください。

https://cloud.voicetext.jp/webapi/api_keys/new

次にvoicetext4pyに必要なライブラリをインストールしてください。OSX MervericsとUbuntu 12.04で動作確認を行っています。

OSX

$ brew install portaudio
$ sudo pip install -U requests
$ sudo pip install -U PyAudio --allow-external PyAudio --allow-unverified PyAudio

Ubuntu

$ sudo apt-get install python-pyaudio
$ sudo pip install -U requests

あとは、GitHubからソースコードをクローンしてくれば、ipythonのREPLで音声合成が楽しめるようになります。YOUR_API_KEYにあなたの取得したアクセスキーを入力してください。

$ git clone git@github.com:youtalk/voicetext4py.git
$ cd voicetext4py
$ ipython -i voicetext.py -- --user YOUR_API_KEY
>> vt.speak('こんにちは。')
>> vt.speaker('takeru').emotion('angry').speak('こんばんは。')
>> with open('greet.wav', 'wb') as f:
.... f.write(vt.to_wave('おはよう。')

実はこのVoiceTextは、大学院時代に僕が研究開発していたアクトロイドのHRIシステムでも利用していました。音声合成の品質は非常に高く、違和感の少ない会話ができます。

ただ、そのときのライセンス料金が非常に高かったことを覚えています(車が買えるくらいです)。しかも、そのときはLinuxのC言語用ライブラリとして提供されていて、プログラミングの手間がかなりかかりましたし、今回みたいにMacでもLinuxでも動くみたいな汎用性あるプログラムは作れませんでした。今回のWeb APIは期間限定だろうとはいえ無償ですし、HTTPでOS非依存に簡単に叩けます。いやぁ、いい時代になりました。

そのうちPythonパッケージ化やROSパッケージ化したいですね。やり方を学ばねば。

孫社長は「日本の製造業の労働人口1000万人を1億人に増やしたい」と指摘。「もし日本が産業用ロボットを3000万台導入することができれば、ロボットは1日24時間働くので1台で3人分、9000万人分の労働人口に匹敵する」と持論を展開した。
Java 8 には、並行プログラムをはじめとする各種プログラムの作成を容易にする、新しい言語機能と追加クラスが組み込まれています。この記事で、CompletableFuture や Stream などの Java 8 の機能拡張によって実現された、この言語の新しい強力な並列処理サポートについて学んでください。