Keras ASR with CTC を試してみた。
Automatic Speech Recognition using CTC
当初は、Automatic Speech Recognition with Transformer を試してみたけれど、
余り、loss、val_loss が改善しないので、こちらにしてみました。
注) 但し、こちらの方が、学習させるのは、軽いみたいなので、もう少し性能が良ければ...
環境:
Windows11
Python 3.10.6
tensorflow-gpu 2.10.0
GTX-1070
cuda toolkit 11.2
cuDNN SDK 8.1.0
注) GTX-1070 だと、1 epoch 20分程かかる。
GeForce RTX 2080 Ti GPU だと、5-6 分だとさ。
取り敢えず、自分で手直して試してみました。
オリジナルの儘だと、処理の継続ができましぇん。
ここまで来たか、
Web会議にNottaを起動しておくことで、リアルタイムで会議内容を文字に起します。
細かくノートを取る必要がないので、会議内容や議論に思う存分集中することができるそうな。
議事録作成の時間短縮が見込まれるAI自動文字起こしサービスを一度試してみては、どうぞね!
議事録作成の手間を大幅に軽減【Notta】
(広告)