Google、DNNを用いるオープンソース音声認識システム「Kaldi」と同社機械学習ライブラリ「TensorFlow」とを統合。強力な自動音声認識(ASR)システム開発へ

Googleは、DNN(Deep Neural Network)を用いているオープンソースの音声認識システム「Kaldi」と、同社が提供する機械学習ライブラリ「TensorFlow」とを統合したことを発表しました。

この統合により、Kaldiを使用している自動音声認識(ASR)などの開発者は、TensorFlowを使用して、Kaldiの音声認識パイプラインにDeep learningモデルを展開することができます。

統合することで、自然言語モデルをトレーニングするASRの場合、開発サイクルが一桁も短縮されたと報告します。

TensorFlowでKaldiを使い始めるには、Kaldi repoをチェックし、TensorFlowで実行しているKaldiセットアップの例をご覧ください。

関連

Microsoft Research、自然言語の音声認識システムの精度をさらに向上と報告。昨年と比べエラー率約12%削減の5.1%を達成 | Seamless

ABOUT

本サイト(Seamless/シームレス)は、2014年に始めた先端テクノロジーの研究を論文ベースで記事にしているWebメディアです。山下が個人で運営し、執筆を行っています。詳細はこちら

ページ上部へ戻る