Skip to content

generalização dos perfis usados para o nextflow

Após revisões dos parâmetros usados pelo nextflow.config relacionado a utilização de profiles {} precisamos atualizar como isso está funcionando no nosso pipeline. Em função de tornar o pipeline generalizável para outros projetos, além de tentar criar uma maior customização dos parâmetros para o usuário seria interessante implementar o seguinte:

  • Criar uma file .JSON para cada um dos perfis com parâmetros default baseados em cada um dos projetos. Por exemplo: O projeto dos ratos vai envolver utilizar o genoma inteiro, enquanto o dos humanos vai envolver utilizar apenas o genoma mitocondrial; A depender do projeto e do tipo de desenho do estudo, o parâmetro de modelo a ser utilizado e também de modificações será diferente; num futuro próximo, a implementação de Variant Calling do genoma também pode ser viável e vai depender de qual projeto se está trabalhando.
  • Dessa forma o uso de perfis pelo nextflow.config fica restrito a clusters/servidores (e.g., Computador Local, Atria, Aarhus, Harpy). Isso permitiria criar perfis para cada um desses ambientes que possuem uma configuração de hardware diferente, e consequentemente selecionar o perfil a ser utilizado dependendo de qual desses ambientes vai ser utilizado para executar o job.
  • Sendo assim, cada um dos .JSON permite uma maior customização por parte do usuário sem complicar o entendimento. O uso de profiles {} se torna obsoleto para definir parâmetros, facilitando a compreensão do pipeline por leigos, e permite maior generalização para rodar em diferentes ambientes e utilizando diferentes recursos. Pode-se pensar além disso e criar um output para o usuário definir (run basecalling = true ou run modkit = true).