添加了一个名为--max_words_count的新单词选项,该选项将生成字幕,设置每个片段的最大单词数限制。这听起来与--max_line_width选项类似,但恕我直言,结果对读者来说更令人满意。以下是使用 .SRT 文件的一些比较:
请注意,--max_words_count作为单词的上限,但它仍然会尊重段,如果段中的剩余单词数低于 max_words_count 值,则句子末尾可以有更少的单词。即 _Segment = [word1, word2, word3, word4, word5] and max_words count = 3 =>Result = [word1, word2, word3] and [word4, word5]这不是我们可以使用--max_line_width 看到的行为连接段末尾和开头时留出更大的时间间隙:
使用--max_words_count生成的字幕看起来与我们在 Shorts、Reels 和其他短视频中看到的类似。
这是我的第一个贡献,所以请随意更改/评论/改进任何内容。
补充笔记- 使用--max_line_width将禁用--max_words_count的效果。
- 使用 Python 和 cli 手动测试并检查 .srt 和 .vtt 文件中的结果(.txt 和 .tsv 文件不会受到影响)。