BlastXml2Database (bxml2db) v0.1

hace seis meses aproximadamente desarrolle un programa que permite ademas de parsear archivos XML, los cuales son generados por BLAST, de 1G aproximadamente , extraer su contenido y volcar los datos hacia una base datos. las bases de datos soportadas son PostgreSql, MySql y Sql-Lite.

Para esto bxml2db se puede ejecutar de dos maneras “standalone” o a través del “loader“, el esquema es muy parecido a blastall, el cual permite ejecutar un distinto programa para una comparación especifica.

por lo que usándolo con el “loader” acepta los siguientes parámetros:

– –program [bxml2dbmini|bxml2db_cutter] permite especificar cual programa ejecutara.
– –dir [path to blast xml generated files] permite especificar la ruta donde se encuentran archivos XML.
– –project [database name] especifica el nombre de la base de datos a usar para almacenar los datos.
– –server [ip address] especifica la dirección ip del servidor de datos.
– –user [usuario para el acceso a la base de datos]
– –password [contraseña para el acceso a la base de datos]
– –security [disabled|enabled(*)] especifica que al menos te preguntara por la contraseña de acceso de la aplicación para autenticar dichas credenciales, por omisión esta habilitada esta opción.
– –fix-iteration [disabled|enabled] permite definir si corregirá dinamicamente el numero de iteración(contig) de acuerdo a la llave primaria en la base de datos donde se almacenara la iteración(contig). esto es porque si tienes un modelo relacional en tu base de datos y te apegas a la normalizacion adecuada, BLAST tiene problemas en generar la numeración correcta de las iteraciones(contigs) cuando el modo de salida es XML y esto es un tema que discutiré luego porque  seguro que la gente que esta en esto ya estarán diciendo algo como no no es cierto, como!!!, ¿porque?.
– –data-server-provider [MySql|PostgreSql|Sqlite] permite definir cual proveedor de datos servirá a la aplicación.

Un ejemplo de uso con el “loader“:

mono launcherall_test.exe – -program bxml2dbmini – -dir /media/sda10/ensamblados/protmaiz/ensamblado090807.p1.protmaiz – -project maiz – -server 127.0.0.1 – -user pepito – -password agallas – -security disabled – -fix-iteration disabled – -data-server-provider MySql

El modo “standalone” creo que va a pasar a la historia, aunque lo voy a dejar disponible por si alguien tiene interés de mejorarlo o usarlo.

en un par de semanas subire al svn de google code bajo el proyecto de mono-biosharp.

About Jacob

I'm a Bioinformatics Developer, Software Engineer, Open Source Developer, Mobile Developer, Unix/Linux SysAdmin, HPC Sysadmin

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s