Improve audio concat; cleanup temp files; add -T(temp_dir) and -P (video_pool_size) args #1

vvd170501 · 2022-10-23T11:21:07Z

No description provided.

vvd170501 · 2022-10-23T11:22:00Z

main.py

@@ -1,13 +1,14 @@
-#!/usr/bin/python
+#!/usr/bin/env python


Поменял, чтобы скрипт нормально работал в virtualenv

vvd170501 · 2022-10-23T11:24:17Z

main.py

+
+        logging.info("Trimming audio")
+        segments = AudioSegment._sync(*[audio[start:stop] for start, stop in parts])
+        trimmed_audio = segments[0]._spawn([segment._data for segment in segments])


Лучше использовать приватные методы класса, чем собирать весь аудиофрагмент за O(N^2) (каждый += создавал новый AudioSegment)

Да, спасибо, звучит как и правда хорошая оптимизация
Жалко, что приходится лезть в приватные методы

vvd170501 · 2022-10-23T11:27:37Z

main.py

+        return True
+
+
+def process_chunk(workdir, args, total_segments, id, segment):


Раньше workdir, args и segments были глобальными и объявлялись в конце скрипта, из-за этого код было сложнее понимать.

vvd170501 · 2022-10-23T20:26:52Z

main.py

+                        help='number of audio chunks to be processed concurrently', default=1)
+    parser.add_argument('-P', dest='video_pool_size', type=int,
+                        help='number of video chunks to be processed concurrently. '
+                             'FFmpeg (without hwaccel) uses optimal number of threads by default, '


Проверял с ffmpeg 4.4.2-0ubuntu0.22.04.1, количество используемых потоков равно кол-ву физических ядер процессора.
Запуск нескольких одновременно выполняющихся процессов ffmpeg не улучшает производительность, а наоборот, немного ухудшает её.

*Относится только к предпоследней стадии - trim+concat для каждого чанка.
Для разделения видео и аудио потоков и обработки аудио в каждом чанке используется 1 поток, поэтому на этих этапах нет проблем с параллельным исполнением.

Спасибо
Тоже хотел протестить, но никак не доходили руки
Кажется, когда добавлял эту опцию, тестил и использование многопоточности было оправданным
Сам ещё побенчмаркаю

ffmpeg по дефолту запускается с опцией threads=-1, поэтому звучит правдоподобно, что процесс будет занимать все ядра и будет конкурировать с другими

@vvd170501, а какой порядок улучшений времени? Остались результаты замеров?

Замерил на 30 минутах лекции в качестве 1080p60.
CPU - Ryzen 7 5800HS (8 физических ядер).
Разбиение на чанки и обработка аудио во всех случаях занимали ~8 секунд.

С одним процессом ffmpeg (5a04dcc):

$ time ./main.py -s 150 -m 50 -n 8 -p 8 -T /tmp/ramdisk/ -i ls4_30min.mkv -o lec4_trimmed.mkv real 6m10,282s user 50m56,566s sys 0m46,125s

Во время выполнения trim+concat каждое из 16 логических ядер используется на ~50%, ffmpeg использует ~1 ГБ памяти, load average (1min) ~=9.

С 8 параллельными процессами ffmpeg (c9bc294):

$ time ./main.py -s 150 -m 50 -n 8 -p 8 -T /tmp/ramdisk/ -i lec4_30min.mkv -o lec4_trimmed.mkv real 7m25,505s user 110m17,434s sys 1m48,683s

Все логические ядра загружены на 100%, используется 8 ГБ памяти, load average (1min) ~=70.

C ускорением на RTX 3060 mobile (мб попробую сделать PR, но нужно как-то добавить проверку на доступность nvenc):

$ time ./main.py -s 150 -m 50 -n 8 -p 8 -P 2 -T /tmp/ramdisk/ -i lec4_30min.mkv -o lec4_trimmed.mkv real 2m22,735s user 2m0,605s sys 0m8,618s

Improve audio concat; cleanup temp files; add -T(temp_dir) arg

79d4a43

vvd170501 commented Oct 23, 2022

View reviewed changes

Use less temp files

c9bc294

vvd170501 force-pushed the main branch from c40dbb0 to c9bc294 Compare October 23, 2022 15:23

Use separate process pool for ffmpeg trim+concat

5a04dcc

vvd170501 changed the title ~~Improve audio concat; cleanup temp files; add -T(temp_dir) arg~~ Improve audio concat; cleanup temp files; add -T(temp_dir) and -P (video_pool_size) args Oct 23, 2022

vvd170501 commented Oct 23, 2022

View reviewed changes

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Improve audio concat; cleanup temp files; add -T(temp_dir) and -P (video_pool_size) args #1

Improve audio concat; cleanup temp files; add -T(temp_dir) and -P (video_pool_size) args #1

vvd170501 commented Oct 23, 2022

vvd170501 Oct 23, 2022 •

edited

Loading

vvd170501 Oct 23, 2022

debnatkh Oct 23, 2022

vvd170501 Oct 23, 2022

vvd170501 Oct 23, 2022

vvd170501 Oct 23, 2022

debnatkh Oct 23, 2022

debnatkh Oct 23, 2022

vvd170501 Oct 23, 2022

		return True


		def process_chunk(workdir, args, total_segments, id, segment):

Improve audio concat; cleanup temp files; add -T(temp_dir) and -P (video_pool_size) args #1

Are you sure you want to change the base?

Improve audio concat; cleanup temp files; add -T(temp_dir) and -P (video_pool_size) args #1

Conversation

vvd170501 commented Oct 23, 2022

vvd170501 Oct 23, 2022 • edited Loading

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

С одним процессом ffmpeg (5a04dcc):

С 8 параллельными процессами ffmpeg (c9bc294):

C ускорением на RTX 3060 mobile (мб попробую сделать PR, но нужно как-то добавить проверку на доступность nvenc):

vvd170501 Oct 23, 2022 •

edited

Loading

С одним процессом ffmpeg (`5a04dcc`):

С 8 параллельными процессами ffmpeg (`c9bc294`):