Googleは、DNN(Deep Neural Network)を用いているオープンソースの音声認識システム「Kaldi」と、同社が提供する機械学習ライブラリ「TensorFlow」とを統合したことを発表しました。
この統合により、Kaldiを使用している自動音声認識(ASR)などの開発者は、TensorFlowを使用して、Kaldiの音声認識パイプラインにDeep learningモデルを展開することができます。
統合することで、自然言語モデルをトレーニングするASRの場合、開発サイクルが一桁も短縮されたと報告します。
TensorFlowでKaldiを使い始めるには、Kaldi repoをチェックし、TensorFlowで実行しているKaldiセットアップの例をご覧ください。
関連
Microsoft Research、自然言語の音声認識システムの精度をさらに向上と報告。昨年と比べエラー率約12%削減の5.1%を達成 | Seamless