DeepSpeechはかなり正確に音声認識をしてくれているのだけど、句読点がないのが泣き所。(;_;)
hello i'm oli welcome to oxford online english
ずらずらと並んだ英単語を見ると「英語の文字起こしなんて無理かも…」と怯んでしまいます。
気を取り直してレッスン動画でカンマの使い方を学びます。まず既に誰かが作成した字幕がついている動画を選び、その字幕を「正解テキスト」にします。
そして自作ツールで原文の字幕を作り、DeepLで翻訳します。この動画のオーリー先生はゆっくり話しているので聴きやすいです。
How To Use Commas - English Writing Lesson
原文・翻訳2本立ての字幕スクリプトのソースです:
<iframe id="ytvideo" width="560" height="315" src="https://www.youtube.com/embed/tNKBut921qM" frameborder="0" allow="accelerometer; autoplay; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>
<script src="/js/youtube.external.subtitle.min.js"></script>
<style>
.youtube-external-subtitle { margin-top: 92px; }
</style>
<script src="/js/subtitles.parser.min.js"></script>
<script>
var loadSRT = function(url, callback) {
var httpRequest = new XMLHttpRequest();
httpRequest.onreadystatechange = function() {
if (httpRequest.readyState === XMLHttpRequest.DONE) {
var subtitles = parser.fromSrt(httpRequest.responseText, true);
for (var i in subtitles) {
subtitles[i] = {
start : subtitles[i].startTime / 1000,
end : subtitles[i].endTime / 1000,
text : subtitles[i].text
};
}
callback(subtitles);
}
};
httpRequest.open('GET', url, true);
httpRequest.send(null);
};
loadSRT('/asset/2020/09-15/Input.srt', function(subtitlesEn) {
loadSRT('/asset/2020/09-15/Input2.srt', function(subtitlesJp) {
var subtitles = {
en: subtitlesEn,
jp: subtitlesJp
};
var youtubeExternalSubtitle = new YoutubeExternalSubtitle.Subtitle(document.getElementById('ytvideo'), subtitles.en);
document.getElementById('languages').addEventListener('change', function(e) {
var language = this.value;
youtubeExternalSubtitle.load(subtitles[language]);
});
});
});
</script>
<div style="text-align: right; margin-bottom: -20px;">
<select id="languages" style="font-size: 14px;">
<option value="en">English</option>
<option value="jp">日本語</option>
</select>
</div>