Оптимизация PASS
С релизом 0.2.0 пайплайн будет работать с задачами, сформированными как строки таблицы. Возникают ситуации, когда задача состоит из построения одинаковой модели, но разным тестовым файлом. Для оптимизации дискового пространства и нагрузки на кластер необходимо, чтобы строились уникальные модели. Для этого надо
- переработать структуру выходных файлов
- разделить PASS_TRAIN_AND_TEST на отдельные процессы TRAIN и TEST.