New R y HPC (Uso de R en el CESGA) · 2018. 10. 26. · • Permite usar más de un nodo de...

Aurelio RodríguezV Xornadas R Galicia28 de Octubre 2018Santiago de Compostela

R y HPC. (Uso de R en el CESGA).

Uso FT

Internet

Login nodes e.g. fs6801

Shared nodes e.g. C6603thin-shared

sharedgpu-shared

gpu-shared-k2fatnode

Interactive e.g. c6601: thin-interactivegpu-interactiveiphi-interactive

Exclusive nodes e.g. C6635thinnodescola-cortaiphinodes

Remote desktop

Partitions:

ssh –X ft.cesga.es

Batch job compute sbatch run.sh squeue …

https://portalusuarios.cesga.es/tools/remote_vis

RUN LIMITS: cpu time 8 hours / virtual memory 8GB

RUN LIMITS: cpu time 8 hours / virtual memory 32GB

lim” fo

limits.

to 100 h

r s / Real m

ry: up

to 4 T

3 096 co

res or 129

Descripción del hardware

Nodos Procesador Cores RAM HDD Acelerador IB* LUSTRE* Partición

306 2xIntel E5-2680v3@2.50GHz 24 128GB 1TB thinnodes/thin-shared

4 2xIntel E5-2680v3@2.50GHz 24 128GB 1TB 2 NVIDIA K80 gpu-shared

2 2xIntel E5-2680v3@2.50GHz 24 128GB 1TB 2 Intel Phi iphinodes

1 8xIntel E7-8867v3@2.50GHz 128 4TB 24TB fatnode

4 2xIntel E5-2680v3@2.50GHz 24 128GB 1TB login

18 2xIntel E5-2680v3@2.50GHz 24 64/128GB 2TB shared

10 2xIntel E3-1240v3@3.40GHz 4 32GB 2TB shared

68 2xIntel E5-2650v3@2.30GHz 20 64GB 300GB shared

7 2xIntel E5-2650v3@2.30GHz 20 128GB 4TB NVIDIA K2 gpu-shared-k2

1 2xIntel E5-2650v3@2.30GHz 20 128GB 4TB NVIDIA V100 gpu-shared-v100

4 2xIntel E5-2650v3@2.30GHz 20 128GB 4TB shared

*IB: red Infiniband FDR 56Gbps*LUSTRE: Sistema de ficheros paralelo de alto rendimiento

Disco usuarioswtestg@fs6801 ~]$ myquota

- HOME and Store filesystems: -------------------------- Filesystem blocks quota limit grace files quota limit grace10.117.49.200:/Home_FT2 5972 10005M 10240M 108 100k 101k 10.117.49.201:/Store_uni 31206M 499G 500G 48581 300k 301k

- Special filesystems: -------------------…

- LUSTRE filesystem: ----------------- Filesystem used quota limit grace files quota limit grace/mnt/lustre/scratch 0k 3T 3.5T - 0 200000 240000 -

0 500 1000 1500 2000 2500 3000 3500

LUSTRE

NO BACKUP, DATOS TEMPORALES

NO BACKUP

Conexión SSH

Escritorio remoto bajo web

Resolution selector

Web browser

Clipboard: copy/paste from local computer

TerminalTerminal

File browser

Destroy remote desktop

FT2 Terminal

FT2 File browserFT2 File browser

Recommended if you use LUSTRE intensively

Uso interactivo

Bajo una terminal del escritorio remoto o bajo la conexión ssh:

module load intel/2018.3.222 RR

Límites: cpu time: 8 horas virtual memory: • 8GB (login node)• 32GB (desktop)

Rstudio

Bajo una terminal del escritorio remoto:

module load intel/2018.3.222 R rstudiorstudio

¿RStudio Server?

Aún bajo estudio … :● Problemas de seguridad● Ejecución en interactivo

https://www.rstudio.com/pricing/

Problemática similar presente en otros programas:

Python notebooksSageMath

Paquetes extra

installed.packages()Capabilities()

install.packages(“Rpackage”)

Instalación por defecto en:$HOME/R/x86_64-pc-linux-gnu-library/<Rversion>

Configurable mediante la variable de entorno: R_LIBS_USER

Ejemplo:install.packages(“shiny”)

https://shiny.rstudio.com/articles/basics.html

Cuidado con el compilador: intel/gcc

Trabajo bajo slurm

Script de envío (run.sh)

#!/bin/bash#SBATCH -t 01:00:00#SBATCH -c 2module load intel/2018.3.222 R Rscript test.R

Envío de trabajo

sbatch run.sh

Recomendado: man Rscript

Trabajo bajo slurm

N <- 10000system.time(x <- matrix(rnorm(N^2), N, N) %*% matrix(rnorm(N^2), N, N))N <- 10000system.time(x <- matrix(rnorm(N^2), N, N) %*% matrix(rnorm(N^2), N, N))

rslurm

https://cran.r-project.org/web/packages/rslurm/vignettes/rslurm.html

Parallelize R code on a Slurm cluster

Parallel y doParallel

• Entorno multicore nunca usar más de un nodo• Basado en el paradigma master-slave• Funciones específicas para la paralelización:

• sapply → parSapply• Fácil paralelización de bucles tipo “for” (%dopar%), obteniendo buena

escalabilidad• Limitaciones:

• Bucles “for” de muchas iteraciones con funciones que requieren mucho tiempo de computación pueden provocar que los “slaves” se corrompan

Parallel y doParallel

Ejemplo: https://cran.r-project.org/web/packages/doParallel/vignettes/gettingstartedParallel.pdf

library(doParallel)registerDoParallel(cores=as.numeric(Sys.getenv(“SLURM_NTASKS”)))x <- iris [which(iris[,5] != “setosa”), c(1,5)]parallel_time <- system.time({

r <- foreach(icount(100000), .combine=cbind) %dopar% {ind <- sample(100, 100, replace=TRUE)result1 <- glm(x[ind,2]~x[ind,1], family=binomial(logit))coefficients(result1)

}})parallel_time

snow y doSnow

• Snow permite usar más de un nodo de cálculo (usando ciertas funciones de Rmpi)

• Sintaxis relativamente sencilla en comparación con Rmpi• Fáciles paralelizaciones de bucles “for” con doSnow• Limitaciones:

• La expansión de procesos es secuencial → cuántos más procesos, más tiempo en crear el clúster de snow

• Se envía toda la información del máster a cada slave para obtener un buen rendimiento, se necesitaría que el tiempo de cálculo en cada slave sea superior al tiempo de envío y recepción de datos entre slave y master

snow y doSnow

Rmpi y doMPI

• Permite usar más de un nodo de cálculo• Sintaxis similar a las funciones propias de herramientas MPI• Programación siguiendo los esquemas de lenguajes como C o Fortran en el

paradigma MPI• Limitaciones:

• La expansión de procesos se hace a través de la función “mpi.spawn” → problemas a la hora de integrarlo con slurm

• Debemos usar “mpirun -np 1” en vez de srun, independientemente de los recursos solicitados

Rmpi y doMPI

Ejemplo (hello.R):

library(Rmpi)ns <- mpi.univese.size() -1mpi.spawn.Rslaves(nslaves=ns)mpi.bcast.cmd( id <- mpi.comm.rank() )mpi.bcast.cmd( ns <- mpi.comm.size() )mpi.bcast.cmd(host <-mpi.get.processor.name() )mpi.remote.exec(paste("I am", id, "of", ns, "running on", host))mpi.close.Rslaves(dellog = FALSE)mpi.exit()

R y HPC

https://cran.r-project.org/web/views/HighPerformanceComputing.html

R y HPC

• Multitud de paquetes disponibles• Muy útil en estudios paramétricos• Multinodo: Requiere programación y conocimientos

en paralelización

• Multitud de paquetes disponibles• Muy útil en estudios paramétricos• Multinodo: Requiere programación y conocimientos

en paralelización

Actualización sistema operativo del Finis Terrae II

RedHat 7.5

Actualización de kernel (3.10.0) + glibc (versión 2.17 sistema / versión 2.28

en aplicaciones): Esto asegura casi un 100% de compatibilidad con cualquier

aplicación

Actualización del stack de Infiniband (MLNX_OFED 4.3) con mejora del

rendimiento en ciertas aplicaciones

Nueva versión del SLURM (17.02.9) que resuelve algunos problemas/límites

presentes actualmente

Planes

Actualización sistema operativo del Finis Terrae II

LUSTRE 2.10 con notables mejoras en seguridad y rendimiento:

Aplicaciones: migración automática de las aplicaciones más usadas

(instalación de versiones actualizadas).

Resto: bajo petición de usuario

Migración progresiva de todas las particiones

Finales de Octubre/principios Noviembre: Thinnodes

Resto: fecha límite Diciembre

Planes

Dudas, preguntas, comentarios….

New R y HPC (Uso de R en el CESGA) · 2018. 10. 26. · • Permite usar más de un nodo de...

Documents

Transcript of New R y HPC (Uso de R en el CESGA) · 2018. 10. 26. · • Permite usar más de un nodo de...

Template BR_Rec_2005.dot!MSW-S.docx · Web viewNOTA 1 – En la Recomendación UIT-R BT.1368-10 aparece información sobre el cálculo de los valores de selectividad de canal adyacente

Optimización del cálculo por Monte Carlo de la Dosis en ......3. Método Propuesto Para la optimización del tiempo de cálculo del fenómeno Producción de Pares se ha utilizado

tema1 07 saneamientoCTE · 2020. 6. 12. · - circulaciÓn teÓrica de las aguas servidas. 9.- presiones y depresiones. la ventilaciÓn como determinante del cÁlculo y proyecto de

ROOIGEM ECHO 147 · Heren C – Nodo B Heren D – Schulen B vrijdag 24 Werkgroep 09.00 Provinciale competitie 20.00 zondag 25 Nieuwjaarsaperitief 10.30 FEBRUARI maandag 10 Algemene

A QUÉ COS TOptps-aps.org › wp-content › uploads › 2018 › 01 › Manual-3-AQueCosto-2.pdfLa herramienta A Que Costo es una hoja de cálculo en Excel que consta de seis pestañas,

msi.gob.pemsi.gob.pe/portal/wp-content/uploads/2018/02/2018PUBLIC66.pdf · - Procesador de textos (Word, Open Office Write, etc.) Básico - Hojas de cálculo (Excel, Opencalc, etc.)

compranet.sinaloa.gob.mx · Web viewANÁLISIS, CÁLCULO E INTEGRACIÓN DEL FACTOR DE SALARIO REAL CONFORME A LO PREVISTO EN EL REGLAMENTO DE LA LEY DE OBRAS PÚBLICAS Y SERVICIOS

Guía Docente - UCM · Paracetamol. Síntesis, purificación mediante recristalización y caracterización (punto de fusión). Cálculo del rendimiento de la reacción. ... Frecuencias

de los Super Flujos - echange-cipe.comechange-cipe.com/cipe/needcms2/upload/b995d3f5035e...4. Desarrollo – 2/5 Cálculo de los indicadores • Los equipos calculan los plazos de

Figueira de Castelo Rodrigocm-fcr.pt/wp-content/uploads/2015/01/3-Anexo_2013.pdfPara o cálculo das amortizações do imobilizado foi utilizado o método das quotas constantes. Para

Aula 9 Métodos de Jacobi e Gauss-Seidel. - …valle/Teaching/2015/MS211/Aula9.pdf · Aula 9 Métodos de Jacobi e Gauss-Seidel. MS211 - Cálculo Numérico Marcos Eduardo Valle Departamento

Carlos Antonio da Silva Junior Marcos Rafael Nanni Aline ... · fator de correção para interferência do solo. Para o cálculo do ... CEI e à classificação do ... Na Tabela 1

AVISO LEGAL PAGINA WEB - LYRECO - Homepage · LYRECO ESPAÑA, S.A. no se hace responsable de las webs no propias a las que se pueda acceder mediante vínculos o enlaces (“links”)

TEST PRO - CÁLCULO - uca.edu.ar · PDF fileTEST PRO - CÁLCULO Test para la evaluaci ón del procesamiento del n úmero y el c álculo Prof. Lic. Yamila Karqui Bibliografía utilizada:

Milton Procópio de Borbamiltonborba.org/Calculo_III/Trabalho_14-1.docx · Web viewÓtica – Reflexão Rebello -2014 Fundamentação: O cálculo vetorial, encontra um campo fértil

Controller MCE 06 ADV Controller MCE 12 ADVa_Programación_MCE_ADV.pdf · Ver Tabela 1 e Cálculo do factor C/K. Seleccionar o tipo de programa. Ver ajuste de valores. Este ajuste

Leica Geo Office · de mínimos cuadrados n Beneficiese del cálculo de volumenes que se actualizan instantáneamente al cambiar las coordenadas Todos los componentes integrados en

fx-82EX fx-85EX fx-350EX - Support | Home | CASIO...radián o gradián como la unidad de ángulo para mostrar el valor de entrada y el resultado de cálculo. Number Format Especiﬁca

José Álvaro Tadeu Ferreira Cálculo Numérico – Notas de ...A determinação das raízes de uma equação envolve duas fases. Fase I – Isolamento das raízes Nesta fase, o objetivo

Cálculo ICálculo 1 / Érika Maria Chioca Lopes. Uberlândia, MG : UFU, 2013 89p. Licenciatura em Matemática. 1. Cálculo 1 Cálculo I 3 PRESIDENTE DA REPÚBLICA Dilma …