Bioscope goes to Ubuntu Linux Desktop and Server

Es bien sabido que la herramienta No. #1 de Applied Biosystems – Life Technologies , el BioScope, corre solo en un cluster de computo ,usando Torque-PBS o SGE, basado en CentOS, una distribución basada en Red Hat Linux.

En resumen BioScope te permite hacer análisis de los datos del instrumento SOLiD a través de tu navegador web y linea de comandos en Linux.

No hace mas de 2 años que encontré la manera de añadir contenido dentro de la aplicación como tal, a lo cual le llamaría crackear la aplicación pero evitare usar ese termino porque las aguas se levantan y ya chole…ayy el mexicano.

Pensé que quizá y observando que oficialmente no añaden el soporte para ensamblar genomas, dije seria bueno añadirle esas opciones al BioScope para lo cual ya tenia un esquema, diseño y el flujo de como hacerlo, pero después pensé que mejor no, puesto que no es mi aplicación , no es software libre y tendría que estar haciendo constantemente ingeniera inversa para lograr el objetivo y quizá después tendría problemas legales ya que quizá los usuarios del BioScope querrían tener estos nuevas actualizaciones,lo cual traería una seria de cuestiones legales.

Después me fastidio que BioScope solo pudiera correr en CentOS y empece analizar scripts y mas scripts con toda calma y dije !! solución !! al menos voy a hacer que BioScope puede ejecutarse en otra distro diferente a la basada en Red Hat, y dicho y hecho El servidor de BioScope ahora puede instalarse y correr en Ubuntu Linux Desktop y Server ;) , mapreads puede correr bien sin mucho problema , ahora ya podrías analizar tus datos de SOLiD en tu propia computadora con Ubuntu Linux sin necesidad de tener que instalarte CentOS Linux.

No solo eso también puedo soportar que se ejecute en Mandriva Desktop, Gentoo, claro necesitas al menos de 16G – 24 G en memoria ram si quieres que trabaje mas o menos decentemente.

Workshop “Sequencing Data Visualization for SOLiD Users” México 2011

Muy rápido pasa el tiempo y bien dice la gente que recordar es vivir.

El pasado 4 de Julio asistí junto con el personal del área de genomica y estudiantes de doctorado al Workshop “Sequencing Data Visualization for SOLiD Users” el cual se llevo a cabo en las oficinas de Life Technologies de México.

 

Apenas llegue a mi habitación cuando ya estaba instalando algunos de los programas en mi computadora portátil y la mac.

llegamos algo cansados y teníamos hambre por lo que decidimos cenar y disfrutar de una muy buena platica con todos , después ya bien comiditos nos fuimos a instalar las computadoras con los programas necesarios para el Workshop, yo me desvele un poco más tiempo ya que una computadora estaba dando mucha guerra pero como dicen que no hay peor lucha que la que no se hace finalmente quedo lista.

Leonardo inicio con el Workshop hablando sobre los análisis de los datos de Bioinformática en general, muy buena platica.

El workshop estuvo bien , estuvimos usando varias herramientas para visualización de secuencias como Magic Viewer, ChipViewer , Tablet y BamViewer , está platica fue impartida por la gente de Winter Genomics, también ellos hablaron sobre Galaxy solo que por alguna extraña razón el sitio web oficial de Galaxy se bloqueo, lo bueno es que tenia configurado Galaxy en mi propia computadora portátil por lo que les pasamos la dirección de mi computadora para que todos pudieran entrar a Galaxy y seguir trabajando con el WorkShop.

Alrededor de las 2:15 salimos a comer , todos estuvimos invitados a comer por parte de  Life Technologies México , gracias.

Al termino de la comida regresamos a la siguiente parte del workshop, Leonardo realizo una demostración del nuevo software de análisis de datos de SOLiD “LifeScope”.

De imprevisto me anime a participar complementando un poco sobre Galaxy y BioScope, pero mi computadora portátil no pudo reconocer el proyector por lo que solo use la computadora de Leonardo para presentar algo rápido.

Comente brevemente 3 puntos:

    1. BioScope ahora puede ser capaz de correr en Ubuntu Linux Desktop y Servidor para ello hice algunos cambios en los scripts de instalación de BioScope.
    2. Es posible usar TMAP , la herramienta para mapear secuencias de Ion Torrent dentro Galaxy así como Velvet , Mira ..etc , para ello visita el siguiente enlace.
    3. Desarrolle un pequeño pipeline que permite generar las secuencias de referencia en el formato que Galaxy necesita para ser usadas dentro de Galaxy con Blast-MegaBlast , para descargar o verificar el software haz clic aquí.

Al termino hicieron la entrega de constancias de participación y nos despedimos , no sin antes tomar un par de fotos para el recuerdo.

Gracias todos por el Workshop , la asistencia y la convivencia muy agradable , espero que se vuelva a promover y organizar este tipo de eventos que nos permiten conocer y compartir la información que es provechosa para todos, desde luego cuenten con mi participación

developing on Bioscope 1.2

In past days I was developing some extra features for Applied Biosystems Bioscope 1.2 software tool. I think that bioscope is good tool but finally users needs to get access to more documentation like tutorials and books, so I added a menu and documentation dialog box(java rich faces) under bioscope’s help menu first.

I am writing two books: My Life with Bioscope and Bioscope for dummies, I am developing live screencasts too about how to analyze data using Bioscope 1.2 by command line and web user interface.

Screenshots:

Plans for books ? coming soon

Developing Corona Matching Pipeline Sim

En mis tiempos de ocio he estado desarrollando un poco una versión lejana aún, pero parecida a Corona ya que lo necesito para probar otro proyecto, por el momento estoy trabajando en el Pipeline de “matching” que permite alinear lecturas de SOLiD(fragmentos o por pares) hacia un genoma de referencia, por lo que el parser del mapa de cromosomas esta terminado y efectivamente cumple su objetivo, básicamente en el primer Pipeline esta completo los siguientes puntos:

  • parámetros requeridos completos y por el momento  solo -z(hits) , –tempdir (scratch) son viables.
  • parser para el mapa de cromosomas esta completo, identifica los cromosomas y genera los directorios correctos.
  • genera los scripts necesarios para proceso en cluster al igual que Corona(torque pbs)

La forma de llamar el primer Pipeline es:

jacob@jacob-mobile:~/Projects/ABCoronaLiteEmu/build$ mono matching_large_genomes_cmap_save_script.exe -csfasta /home/jacob/tmp/SOLiD/results/lpi/R3/file.csfasta -dir /home/jacob/tmp/SOLiD/results/lpi/matchingR3 -cmap /home/jacob/tmp/SOLiD/ref/human_validated.cmap -t 25 -e 4 -z 10 -tempdir /home/jacob/tmp

más delante comentare sobre los avances de cada Pipeline y las herramientas independientes.

Imágenes de México

En la primera foto inferior se observa una Lasagna colombiana preparada por la esposa de un amigo, en Colombia no se acostumbra comer tortilla para acompañar los platillos como en México, para ello se acompaña casi siempre con sopa de arroz.

Algunas imágenes las tome desde  la 2da. Torre Zafiro y Torre Mayor.

fueron días que disfrute enormemente donde la hospitalidad de la gente de Applied Biosystems e Inmegen fue más que excelente.

SOLiD: Platica análisis de datos en Inmegen

La semana pasada asistí al curso del instrumento de secuenciación por ligación “SOLiD 3 Plus” impartido por Applied Biosystems, el curso se llevo a cabo en el Instituto Nacional de Medicina Genomica. El viernes colabore un poco impartiendo una platica introductoria sobre el análisis de los datos via offline y los formatos de las lecturas de SOLiD.

Fue un enorme gusto y placer el colaborar con Applied Biosystems y el Inmegen en esta pequeña platica que impartí.

Una visita muy agradable

Ola como esta voce Varuzza !!!

La semana pasada nos visitaron algunas personas de Applied Biosystems donde finalmente conocí a varuzza, el llego de Brasil , impartió una conferencia sobre el instrumento SOLiD y posteriormente platicamos bastante sobre los datos y herramientas de software para el análisis de los datos en el cluster.

Fuimos a varios restaurantes a que probara la comida mexicana ya que en São Paulo los pocos lugares que ofrecen comida mexicana son caros y hay pocas opciones, al parecer le gustaron mucho los tacos, las enchiladas con cecina, las fresas con chocolate, rompope y crema chantilly de la afamada cristalita en Irapuato Gto… mientras tanto ya estoy aprendiendo el idioma.