Developing Corona Matching Pipeline Sim

En mis tiempos de ocio he estado desarrollando un poco una versión lejana aún, pero parecida a Corona ya que lo necesito para probar otro proyecto, por el momento estoy trabajando en el Pipeline de “matching” que permite alinear lecturas de SOLiD(fragmentos o por pares) hacia un genoma de referencia, por lo que el parser del mapa de cromosomas esta terminado y efectivamente cumple su objetivo, básicamente en el primer Pipeline esta completo los siguientes puntos:

  • parámetros requeridos completos y por el momento  solo -z(hits) , –tempdir (scratch) son viables.
  • parser para el mapa de cromosomas esta completo, identifica los cromosomas y genera los directorios correctos.
  • genera los scripts necesarios para proceso en cluster al igual que Corona(torque pbs)

La forma de llamar el primer Pipeline es:

jacob@jacob-mobile:~/Projects/ABCoronaLiteEmu/build$ mono matching_large_genomes_cmap_save_script.exe -csfasta /home/jacob/tmp/SOLiD/results/lpi/R3/file.csfasta -dir /home/jacob/tmp/SOLiD/results/lpi/matchingR3 -cmap /home/jacob/tmp/SOLiD/ref/human_validated.cmap -t 25 -e 4 -z 10 -tempdir /home/jacob/tmp

más delante comentare sobre los avances de cada Pipeline y las herramientas independientes.

Advertisements

Matching Pipeline

La siguiente versión del diagrama de flujo que desarrollé está mal!! ya que hay puntos que han cambiado para el mapeo de los reads de 25bp hacia el genoma de referencia.