lunes, 1 de noviembre de 2010

Instalar R y Bioconductor en Ubuntu


Estos días he tenido que instalar Ubuntu en algunos ordenadores portátiles del departamento. Como es habitual los portátiles vienen con Windows 7 instalado, pero a la mayoría de compañeros y compañeras nos gusta trabajar con Linux y su distribución más popular es Ubuntu o Kubuntu (versión de Ubuntu con el escritorio KDE). La verdad es que ya quedan muy lejos los días en los que era muy difícil instalar una distribución de Linux. Ahora con Ubuntu es realmente muy sencillo.
Después de instalar el sistema operativo y sus aplicaciones por defecto, llega la hora de instalar las aplicaciones para trabajar en serio y, entre ellas, nuestro amado R. La cosa es tan sencilla como ir al Centro de software de Ubuntu del menú Aplicaciones y buscar en el apartado de Ciencia e ingeniería -> Matemáticas el famoso programa R Commander o, como alternativa RKWard (mejor en Kubuntu). Se instalan con un sólo click. Fabuloso.
Sin embargo, si deseamos tener siempre la última versión, es mejor añadir el repositorio oficial del R-project a nuestro conjunto de fuentes de programas. Para ello seguiremos las instrucciones del siguiente enlace

http://cran.es.r-project.org/bin/linux/ubuntu/

Si no hay ninguna dificultad, así tendremos la última versión, tanto para 32 como para 64 bits, y cuando salga la siguiente el propio sistema de Ubuntu nos avisará para actualizarnos.
El único detalle que puede sorprender al principio es la utilización de un APT seguro con las claves de Vincent Goulet. Basta con ejecutar las dos instrucciones que se muestran en una Terminal y ya está.

Una vez instalados todos los paquetes de R, ya que siempre se necesita alguno de ellos, queremos instalar Bioconductor.
Bioconductor es un conjunto de paquetes de R, más de 400, para el análisis de datos de genómica que ha tenido un brillante desarrollo en los últimos años. De hecho, el proyecto de Bioconductor es uno de los más activos y ha impulsado notablemente el desarrollo del propio R.
Instalar el Bioconductor básico es muy sencillo. En una sesión de R (mejor si la hemos iniciado como administrador, con "sudo R"), debemos introducir las instrucciones
> source("http://bioconductor.org/biocLite.R")
> biocLite()
Pero, tras esperar un buen rato que se bajen, descompriman y compilen un motón de paquetes, nuestra frustración será grande cuando veamos que algunos paquetes no se han instalado con un mensaje final del tipo

installation of package 'XML' had non-zero exit status

El problema es que la instalación por defecto de Ubuntu no permite compilar algunos paquetes de Bioconductor. La solución es instalar previamente todo el software necesario.
En el blog de James Reid está muy bien explicado. Los paquetes de Ubuntu necesarios se instalan así:

sudo apt-get install build-essential curl graphviz-dev libcurl4-gnutls-dev libboost-dev libgd2-xpm-dev libglu1-mesa-dev libgtk2.0-dev libmysqlclient-dev libxml2-dev mesa-common-dev sun-java6-jdk unixodbc-dev

De paso, dejo estas instrucciones como recordatorio para nuestras propias instalaciones.






No hay comentarios:

Publicar un comentario