コーディングのポイント:
-
vttに収録されている文字列をTinySegmenterで分かち書きにする
-
1行あたりの文字数と比べて、次の節を足すと超えるときは<br>をはさむ
-
禁則文字の有無を調べ配列の要素を書き換える
- 行頭禁止の場合は前の要素の末尾に付け加える
- 行末禁止の場合は次の要素の先頭につける
vttに収録されている文字列をTinySegmenterで分かち書きにする
1行あたりの文字数と比べて、次の節を足すと超えるときは<br>をはさむ
禁則文字の有無を調べ配列の要素を書き換える
odysee Fireship 2022年10月26日より。
この1年間、英語動画の文字起こしと日英字幕の制作に取り組んでいます。だいぶ手順が確定してきたので、ここらで一つ、作業過程を図解しておこうと思います。英語情報を拡散したいと願う方々のお役に立てれば幸いです。
continue…▶どのブラウザでも、あるいは異なるソースでも同じプレーヤーで再生できるように、JavascriptのメディアプレーヤーPlyrを導入します。
continue…▶“BANNED.VIDEO"や"BIT CHUTE"の動画に文字起こし字幕をつける試みを続けていますが、話者が複数の時どう区別するか、工夫が必要になってきました。
continue…▶Telegramをざっくり見るのが日課になっていて、中には気になるビットマップ画像がいくつもある。何かの書類をスキャンしたのや画面のキャプチャなど、拡散したい英語情報がたくさんあるのに、画像なのでそのままではDeepLに持っていけない。
最初は画面を見ながら手打ちでテキストデータにしていたけど、数が増えると手打ちは不便。なので画像読み取りをプログラムでできないか調べてみました。
continue…▶