DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

98
IN S T IT U T O P O L IT É C N IC O N A C IO N A L ESCUELA SUPERIOR DE INGENIERÍA QUÍM ICA E INDUSTRIAS EXTRACTIVAS DESARROLLO DE M ODELOS PRONÓSTICOS DE LA CALIDAD D EL AIRE EN LA ZON A METROPOLITANA DE GUADALAJARA (ZMG), JALISCO T E S I S QUE PARA OBTENER EL TÍTULO DE: INGENIERO QUÍMICO INDUSTRIAL P R E S E N T A N : R O D R IG U E Z O LIVAR E S JO G U A D A LU P E TEN O R IO M Á R Q U E Z YE N ISSE M O N SE R R A T DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ MEXICO D. F. 2006

Transcript of DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

Page 1: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

I N S T I T U T O P O L I T É C N I C O N A C I O N A L

E S C U E L A S U P E R I O R D E I N G E N I E R Í A Q U Í M I C A E I N D U S T R I A S E X T R A C T I V A S

D E S A R R O L L O D E M O D E L O S

P R O N Ó S T I C O S D E L A C A L I D A D

D E L A I R E E N L A Z O N A M E T R O P O L I T A N A

D E G U A D A L A J A R A ( Z M G ) , J A L I S C O

T E S I S QUE PARA OBTENER EL TÍTULO DE:

INGENIERO QUÍMICO INDUSTRIAL

P R E S E N T A N : R O D R I G U E Z O L I V A R E S J O S É G U A D A L U P E

T E N O R I O M Á R Q U E Z Y E N I S S E M O N S E R R A T

DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

M E X I C O D. F. 2 0 0 6

Page 2: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

SECRETARIADEEDUCACION PUBLICA

I N S T I T U T O P O L I T E C N I C O N A C I O N A LESCUELA SUPERIOR DE INGENIERIA QUIMICA E INDUSTRIAS EXTRACTIVAS

DEPARTAMENTO DE PRÁCTICAS, VISITAS Y TITULACIÓN

T-071-05

México, D. F , a 20 de junio del 2005

Al C. Pasante:JOSE GUADALUPE RODRIGUEZ OLIVARES YENISSE M. TENORIO MARQUEZ

Boleta:20013203110098071521

Carrera:IQIIQI

Generación:2000-20042000-2004

Av. 5 de Mayo No. 5 Col. Santa Cuz, Tlapacoya,Municipio Ixtapaluca Estado de México C.P. 56570

Mediante el presente se hace de su conocimiento que este Departamento acepta que el C.Ing. Ignacio García Sánchez, sea orientador en el Tema que propone usted desarrollar comoprueba escrita en la opción; Tesis Colectiva, con el título y contenido siguientes:“Desarrollo de modelos pronósticos de la calidad del aire en la zona metropolitana de Guadalajara (ZMG), Jalisco”.

Resumen.Justificación

I - Conceptos fundamentales.II.- Modelos de predicción.III.- Descripción metodológica.IV.- Selección de las variables predictorV.- Modelos pronóstico obtenidos.VI - Análisis de resultados.

Conclusiones y recomendaciones Bibliog rafia.

Se concede un plazo máximo de un año, a partir de esta fecha, para presentarlo a revisión por el Jurado asignado.

Presidente de Academia

M. en C. Blanca Zamora Celis Jefa del Depto. de Prácticas

Visitas y TitulaciónSubdirector Académico

c. c. p.- Control Escolar

Page 3: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

>\»OS V

SECRETARIADEEDUCACION PUBLICA

I N S T I T U T O P O L I T E C N I C O N A C I O N A LESCUELA SUPERIOR DE INGENIERÍA QUÍMICA E INDUSTRIAS EXTRACTIVAS

D E P A R T A M E N T O D E P R Á C T IC A S , V IS IT A S Y T IT U L A C IÓ N

México, D. F., a 19 de enero del 2006.

Boleta: Cañera:C. JOSE GUADALUPE RODRIGUEZ OLIVARES 2001320311 IQIC. YENISSE M. TENORIO MARQUEZ 0098071521 IQI

T-071-05

Generación:2000-2004

2000-2004

Presente.

Los suscritos tenemos el agrado de informar a Usted, que habiendo procedido a revisar el borrador de la modalidad de titulación correspondiente, denominado:

‘Desarrollo de modelos pronósticos de la calidad del aire en la zona metropolitana deGuadalajara (ZMG), Jalisco”.

encontramos que el citado trabajo de TESIS COLECTIVA, reúne los requisitos para autorizar el Examen Profesional y PROCEDER A SU IMPRESIÓN según el caso, debiendo tomar en consideración las indicaciones y correcciones que al respecto se le hicieron.

AtentamenteJURADO

Page 4: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

AGRADECIMIENTOS

Al INSTITUTO POLITECNICO NACIONALmi alma mater, por haber compartido su esencia de lucha, coraje y dedicación.

A la ESCUELA SUPERIOR DE INGENIERIA QUIMICA E INDUSTRIAS EXTRACTIVAS por

haber sido durante estos años mi recinto de desarrollo y darme las b a se s para ser

un Ingeniero honorable.

Al Profesor Orientador: M en C. Ignacio García S án ch ez y al Ing. A lonso Marbánpor compartir su s conocimientos e instruirnos en todo lo necesario para realizar ésta tesis.

A todos mis P ro feso res por enseñarme a crecer profesionaimente y que puedo superar

cualquier obstáculo, que solo nuestra propia imaginación e s nuestro limite al se r Ingenieros.

Al Ing Emmanuel Álvarez del SMN y la Srita. Guadalupe Tzinzun del INE, por brindarnos todas las facilidades para obtener los datos necesarios para la realización de ésta tesis.

I

Page 5: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

AGRADECIMIENTOS

AGRADECIMIENTOS

POR Y. MONSERRAT TENORIO MARQUEZ

A mis padres Lic. Yolanda Márquez M. y Lic. Gregorio Tenorio I., por representar un ejemplo de carácter fuerte y amoroso y brindarme todo lo necesario para mi desarrollo personal y profesional.

A mis hermanos Irvin y J e s s e por brindarme su cariño compartiendo

los logros y abatimientos de cada uno.

A mis abuelitos el Sr. Ascensión Márquez y la Sra. Emma Martínez por su s cariños y todo su amor.

A todos lo que me han brindado su amistad Y son dignos de llamarles amigos por los momentos

de alegría y los consejos que me han sido de granayuda para llegar hasta aquí.

A Dios por concederme la bendición de tener una familia, unos buenos amigos, una persona especial y por todo cuanto me ha concedido en esta vida, que apenas empieza.

II

Page 6: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

AGRADECIMIENTOS

POR JOSÉ GUADALUPE RODRIGUEZ OLIVARES

A la Sra. Consuelo Olivares y al C.P. Jo sé G. Rodríguez, por ser mis padres y recibir su amor, apoyo y comprensión en estos años de esfuerzo y dedicación

A mis hermanos,Sr. J. Efraín, Sra. Araceli y Dr. A. Gustavo Rodríguez,

por brindarme su apoyo incondicional en momentos difíciles.

A la coautora de este trabajo,por su paciencia y perseveranciapara la consolidación de este proyecto de tesis..

A la memoria de mis abuelitas Gaudatia Torres Sánchez

y Guadalupe Nava Zúñiga

I I I

Page 7: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

ÍNDICE

Í N D I C E

RESUMEN JUSTIFICACIÓN CAPITULO 1

CONCEPTOS FUNDAMENTALES1.1 Contaminación del aire1.2 Clasificación de la atmósfera1.3 Contaminación atmosférica1.4 Problemática del aire en la Zona

Metropolitana de Guadalajara (ZMG)

CAPITULO 2MODELOS DE PREDICCIÓN2.1 Modelos de Regresión Multivariable (RM)2.2 Modelos de Redes Neuronales Artificiales (RNA)2 3 Aplicaciones de Modelos Pronóstico en el área ambiental

CAPITULO 3DESCRIPCIÓN DE LA METODOLOGÍA3.1 Fuente de datos3.2 Base de datos para el análisis3.3 Aplicación de regresiones3.4 Desarrollo de los modelos pronóstico3.5 Calibración de los modelos

CAPITULO 4SELECCIÓN DE LA VARIABLES PREDICTOR4.1 Análisis de las variables meteorológicas 4 2 Análisis de las variables químicas

P ág s .

VIVII

1

2

3

10

141724

29323637 37

3944

IV

Page 8: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

IN D IC E

Pág s .CAPITULO 5

MODELOS PRONÓSTICO OBTENIDOS5.1 Modelos de Regresión Multivariable

5.1 1 Obtención del modelo de regresión 465.1.2 Modelo pronóstico de regresión 485.1.3 Pre-evaluación del modelo 495.1.4 Evaluación del desempeño en modo pronóstico 53

5.2 Modelo de Redes Neuronales Artificiales5.2.1 Obtención del modelo de Redes

Neuronales Artificiales 555.2 2 Entrenamiento de la red neuronal 615.2 3 Simulación de la red neuronal 68

CAPITULO 6ANÁLISIS DE RESULTADOS6.1 Comparación con otros autores 706.2 Comparación RM vs RNA 746.3 Parámetros más importantes en la

Predicción de niveles de calidad del aire en la ZMG 756.4 Beneficios, aplicaciones y

Novedades que deja el trabajo 78

CONCLUSIONES 79

RECOMENDACIONES 82

BIBLIOGRAFÍA 83

ANEXOS

V

Page 9: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

RESUMEN

R E S U M E N

La problemática de la contaminación atmosférica e s un tema de estudio que tuvo un surgimiento importante a mediados del siglo pasado. Con la aparición formal de la química atmosférica, mucho progreso se ha logrado para entender los mecanismos que originan las especies contaminantes en la atmósfera

Mundialmente se han efectuado investigaciones sobre las posibles soluciones al problema atmosférico, en México se han realizado estudios sobre la calidad del aire en Monterrey (García, 2003), así como en la Ciudad de México (Atmospheric Enviroment 34 (2000) 4097- 4102), por lo que el presente estudio se ve enfocado a la Zona Metropolitana de Guadalajara, Jalisco.

Para la realización de estos estudios fue necesario utilizar técnicas semi-empíricas, las cuales sirvieron para obtener modelos computacionales que permitan emitir un pronóstico de ¡a calidad del aire haciendo referencia principalmente a las concentraciones de ozono ( 0 3); siendo estas la Regresión Multivariable y las Redes Neuronales Artificiales.

El presente estudio se encuentra dividido en seis capítulos, siendo el primero CONCEPTOS FUNDAMENTALES, que aborda aspectos ambientales e introduce al lector a la problemática atmosférica en la ZMG; como segundo capítulo MODELOS DE PREDICCIÓN, donde se presentan los tipos de modelos utilizados, su funcionamiento y las principales aplicaciones que han tenido dentro del marco ambiental. El tercer capitulo DESCRIPCIÓN DE LA METODOLOGÍA establece los puntos a seguir para la obtención de los modelos pronóstico, como cuarto capítulo SELECCIÓN DE VARIABLES PREDICTOR, presenta un análisis de las posibles variables a utilizar en los modelos pronóstico, el quinto capítulo, MODELOS PRONÓSTICO OBTENIDOS establece las características de los modelos obtenidos por Regresión Multivariable y Redes Neuronales Artificiales a partir de las variables seleccionadas en el capítulo anterior y como ultimo capítulo ANÁLISIS DE RESULTADOS, donde se presenta una comparación entre los modelos obtenidos y los parámetros importantes dentro de la predicción, así como su s grados de aplicación; para finalizar se presentan recomendaciones y las conclusiones.

V I

Page 10: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

JUSTIFICACIÓN

J U S T I F I C A C I Ó N

En México, se han investigado extensivamente los orígenes y posibles soluciones a la contaminación del aire en las principales zonas del país que experimentan los síntomas de una problemática existente. Las Zonas Metropolitanas de Guadalajara, Monterrey, Toluca y la región del Bajío son algunas de las á reas donde se han enfocado recursos, con el fin de comenzar a comprender los orígenes de la problemática y su relativo grado de deterioro en la calidad del aire.

De los cientos de contaminantes que existen en las atmósferas urbanas, se ha prestado más atención a seis especies químicas contaminantes: Ozono (0 3), monóxido de carbono (NO), bióxido de nitrógeno (N02), bióxido de azufre (S 0 2), partículas con diámetros aerodinámicos menores a 10 micrómetros (PM10) y plomo (Pb)

La gran mayoría de los estudios realizados a la fecha se han centrado en e s ta s especies , y las estaciones de monitoreo que realizan mediciones rutinarias en las ciudades mexicanas centran sus esfuerzos en caracterizar los niveles de estos contaminantes, para ello la ZMG, cuenta desde 1994 con seis estaciones que generan reportes detallados sobre las concentraciones de los contaminantes antes mencionados.

El siguiente proyecto se enfoca al contaminante Ozono, ya que según reportes del Instituto Nacional de Ecología (INE), en la ZMG este contaminante e s el que más número de veces por año rebasa los criterios establecidos para su control, adem ás de que e s uno de los contaminantes que mas afecta a la salud, generando problemas respiratorios y malestares como, dolor de cabeza, irritación en los ojos, entre otros, a la población adulta e infantil principalmente.

Los principales beneficios que se tienen con el desarrollo de esta tesis, es la capacidad de pronosticar por medio de modelos, si los niveles de contaminación en una región determinada serian excedidos, basados en monitoreos ambientales de días previos y pronósticos de parámetros meteorológicos para el día de interés.

V I I

Page 11: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

JUSTIFICACIÓN

Este punto no resulta básico para tomar medidas preventivas y alertar a la población de un área determinada, a futuro servirá para tomar medidas de control que reduzcan el grado de afectación “tóxica” de los contaminantes a la población Otro beneficio significativo, es el poder dilucidar los parámetros y condiciones mas importantes, tanto climáticas como químicas, que gobiernan la calidad del aire en Guadalajara, siendo éstos consisten tes con los conocimientos que se tienen actualmente.

Los modelos se realizarán con la ayuda de las siguientes herramientas SPSS v.10 y Matlab v.7, ya que ofrecen exactitudes de moderada a alta, tiempos de ejecución del pronóstico bajos y requerimientos computacionales modestos.

V I I I

Page 12: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 1 - CONCEPTOS FUNDAMENTALES

C A P I T U L OC O N C E P T O S F U N D A M E N T A L E S

1.1 C o n t a m i n a c i ó n d e l a i r e

El aire constituye uno de los elementos básicos de todo ser vivo Diariamente nuestros pulmones filtran unos 15 Kg de aire, mientras que sólo absorbemos 2.5 Kg de agua y menos de 1.5 Kg de alimentos.

Por ello, desde los tiempos más remotos, el hombre ha estado consciente del peligro que representa una atmósfera contaminada, tanto la creada de modo natural como una erupción volcánica o la provocada por él mismo, al hacer arder un bosque y al encender una antorcha para iluminarse en el interior de las cavernas donde vivía En tiempos históricos esta preocupación motivó varias disposiciones legislativas en diversos países, como Francia, donde en 1832 Carlos VI prohibía en un edicto, la emisión de ga se s malolientes Asimismo, en Inglaterra ya existía en el siglo XVII una disposición que prohibía encender fuego en las chimeneas durante las sesiones en el Parlamento de Westminster.

Con el advenimiento de la era industrial el problema de la contaminación atmosférica adquiere toda su magnitud, llegando en nuestros días a constituir un motivo de inquietud creciente en las zonas urbanas e industriales.

¿Qué se entiende por contaminación atmosférica? El consejo de Europa dio en 1967 la siguiente definición: hay contaminación del aire cuando la presencia de una sustancia extraña o la variación importante en la proporción de su s constituyentes, puede provocar efectos perjudiciales o crear molestias, teniendo en cuenta el estado de los conocimientos científicos del momento.

En general, todas las definiciones de contaminación atmosférica relacionan los elementos químicos de la atmósfera con efectos nocivos para la salud de ia población, de los animales y de las plantas, (http://www.puc.cl/sw_educ/contam/...).

1

Page 13: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 1 - CONCEPTOS FUNDAMENTALES

1 .2 C l a s i f i c a c i ó n d e la a tm ó s f e r a

La atmósfera se divide en diferentes capas que pueden clasificarse siguiendo ciertos criterios, tales como la temperatura, la densidad o la composición química. Desde el punto de vista de dispersión de los contaminantes atmosféricos, la clasificación más importante es de acuerdo con la temperatura, según la cual e s posible identificar las siguientes regiones:

• Troposfera: región de la atmósfera en contacto con la superficie de la tierra, cuyo espeso r oscila entre 15 Km sobre el ecuador y 10 Km sobre los polos La temperatura disminuye con la altura a un ritmo de 6.5°C/Km aproximadamente. La convección vertical (mezclado del aire ascenden te-descendente) mantiene el aire relativamente bien mezclado. En la parte superior de la troposfera es tá una zona llamada tropopausa, que marca el fin de la troposfera.

• Estratosfera se extiende desde la tropopausa hasta 50 Km. de altura. La temperatura e s constante en la baja estratosfera, aunque aumenta después debido a la absorción de radiación de onda corta por el ozono ( 0 3). En la estratopausa (parte superior de la estratosfera), la temperatura alcanza 270 K. hay poca mezcla vertical en la estratosfera.

• Mesósfera: se extiende desde 50 hasta 85 Km., en los cuales la temperaturadisminuye con la altitud hasta alcanzar 175 K, la temperatura mas baja de laatmósfera.

• Termósfera: la capa superior de la atmósfera. La intensa radiación ultravioleta,disocia N2 y 0 2. Las temperaturas superan los 1000 K. (Seinfield, 1978)

2

Page 14: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 1 - CONCEPTOS FUNDAMENTALES

Figura 1.1. Capas de la atmósfera terrestre (Moran y Morgan, 1994)

El presen te estudio s e enfoca a la troposfera, ya que ésta e s s ed e de los fenómenos meteorológicos y contiene el 80% de toda la m asa de g a s e s de la atmósfera y el 99% de todo el vapor de agua.

1 .3 C o n t a m i n a n t e s a t m o s f é r i c o s

Los contaminantes atmosféricos son tan numerosos que resulta difícil agruparlos para su estudio. Dentro de los principales grupos s e encuentran:

Óxidos de carbono (COx), óxidos de azufre (SOx), óxidos de nitrógeno (NOx), compuestos orgánicos volátiles (COV’s), partículas suspendidas (PM10 Y PM25), oxidantes ( 0 3), sustancias radiactivas, calor y ruidos.

S e consideran contaminantes cuando sus concentraciones son notablemente m ás elevados que en la situación normal. Algunos de los principales contaminantes atmosféricos son sustancias que s e encuentra en forma natural en la atmósfera.

3

Page 15: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 1 - CONCEPTOS FUNDAMENTALES

El contaminante de interés para este estudio es el ozono troposférico, ya que e s el principal constituyente de un tipo de contaminación atmosférica conocida como “smog fotoquímico o niebla fotoquímica”. Según reportes del Instituto Nacional de Ecología (INE), la ZMG es la segunda ciudad que más excede la norma (NOM-020-SSA1-1993) para su control así como también se encuentran concentraciones elevadas en ciudades como el Distrito Federal, Monterrey y Ciudad Juárez. (http.//www.ine.gob.mx/ueajei/publicaciones/...); adem ás es el contaminante que causa daños especialmente a los humanos; así como a la vegetación, metales y materiales de construcción, colorantes y pigmentos.

El ozono e s un irritante respiratorio. La influencia sobre la salud del ozono como contaminante se basa en su toxicidad. Debido a su pequeña capacidad de disolución, el ozono penetra en las vías respiratorias e irrita las mucosas y los tejidos pulmonares.

La concentración de ozono a partir de la cual comienza a observarse una incidencia adversa sobre la salud, varía con la duración y el volumen de aire que se inhale durante la exposición. Así se han observado los siguientes efectos sobre la salud humana:

• Irritación del tejido pulmonar interno desde las 160 pg/m3 (0.082 ppm) después de 6 horas de exposición. Inflama y daña las células que conforman la capa interna de los pulmones. Al cabo de unos pocos días, las células dañadas son reemplazadas y las células viejas se desprenden.

• La población mas sensible muestra una reducción promedio en la función pulmonar del 10% a 200 pg/m3 (0.10 ppm). Se observan en concentraciones superiores a 200 pg/m3 (0.10 ppm), irritación en los ojos y vías respiratorias provocando tos, dolor de cabeza, respiración dificultosa, irritación en la garganta y/o una sensación incomoda en el pecho (causados por elementos que acompañan al ozono, como los nitratos de peroxiacilo “PAN”1).

• Una reducción en la función pulmonar del 30% a 300 pg/m3 (0.15 ppm). Resulta más difícil la respiración profunda y vigorosa normal. Cuando esto sucede, la respiración comienza a sentirse incomoda.

' Compuestos muy importantes en la niebla fotoquímica por su considerable reactividad biológica, el mejor conocido es el nitrato de peroxiacetilo.

4

Page 16: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 1 - CONCEPTOS FUNDAMENTALES

• Reducción de la capacidad física (incremento de la fatiga), desde 240 |jg/m3 a 400 pg/m3 (0 12 a 0 20 ppm) cuando se realizan ejercicios o se trabaja al aire libre, la respiración es más rápida y superficial de lo normal.

Empeora el asma. Cuando los niveles de ozono son altos, aumenta el número de personas con asma que sufren ataques y requieren atención médica o el uso adicional de medicamentos. Esto sucede porque el ozono hace que las personas sean más susceptibles a los alergenos, los agen tes que provocan los ataques de asma. Otros efectos severos para los asmáticos son función pulmonar reducida y la irritación provocada al sistema respiratorio

Empeora enfermedades pulmonares crónicas tales como el enfisema y la bronquitis y reduce la capacidad del sistema inmunológico para defender al sistema respiratorio de las infecciones bacterianas.

Causa daño permanente al pulmón. El daño repetido a corto plazo en los pulmones en desarrollo de los niños puede resultar una función pulmonar reducida en edad adulta. En los adultos, la exposición ai ozono puede acelerar la disminución natural de la función pulmonar que ocurre como parte del proceso normal de envejecimiento. (www.tdx.cesca.es/TESIS- UJI/AVAILABLE/ )

1.3.1 El o x í g e n o m o n o a t ó m i c o y la f o rm a c i ó n d e O z o n o ( E s t r a t o s f e r a ) .

En la alta atmósfera, los fotones de alta energía atacan al oxígeno molecular, según lo indica la reacción

0 2 + Av —>■ 2 0 . . .(A)

Esto da por resultado que el oxígeno exista solamente como O* monoatómico en esta región A más bajas alturas, el oxígeno monoatómico experimenta algunas reacciones. Dos de ellas son recombinaciones para formar 0 2 y, más importante, ia combinación con el 0 2 para formar ozono 0 3, según la reacción

O + 0 2 + M -» 03 + M ,R

5

Page 17: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 1 - CONCEPTOS FUNDAMENTALES

Donde M es un tercer grupo capaz de aceptar energía El propio ozono experimenta cambios fotoquímicos de modo que

+ a. v —̂ O2 + o (O)

El resultado final es que se crea una capa de ozono por encima de ia superficie terrestre. Esta capa de ozono ofrece varios efectos interesantes. Debido a las características de absorción del ozono, actúa como un filtro para las radiaciones ultravioleta, que tratan de llegar a la superficie terrestre Por tanto, a más baja altitud se reduce la reactividad fotoquímica. Desde el punto de vista del hombre, dicha reducción e s esencial, independientemente de los problemas del nebiumo. El cuerpo humano, como está constituido, no podría soportar la radiación ultravioleta procedente del sol, si esta radiación no estuviera a tenuada por la capa de ozono. (Wark y Warner, 2000)

1 .3 .2 P a p e l d e l o s ó x i d o s d e n i t r ó g e n o e n la f o t o - o x i d a c i ó n .

En las á reas donde las emisiones de la industria pesada se combinan con emisiones de fuentes móviles, la atmósfera recibe grandes cantidades de S 0 2 y NO, e hidrocarburos, que por lo general no tiene fuerza oxidante en ausencia de la luz solar, por lo que el S 0 2 y el NO se convertirían lentamente en sulfatos y nitratos; no existirían entonces las condiciones que ahora predominan en las á reas urbanas. No obstante, se tiene el problema de la contaminación del aire, debido al hecho de que, adem ás del S 0 2 y el NO, los hidrocarburos y la luz solar están presentes en la atmósfera urbana.

Según el monóxido de nitrógeno (NO) e s liberado por fuentes estacionarias y móviles, tiende a oxidarse a N02 por medio de la reacción

2N O + 0 2 —» 2 N 0 2 (D)

La síntesis del ozono cerca de la superficie terrestre (troposfera) no se lleva a cabo por medio de las reacciones (A) y (B). La fotodisociación del 0 2 por la reacción (A) requiere energía solar. Sin embargo, la radiación solar no llega a la tropopausa, habiendo sido eliminada principalmente por reacciones con el ozono en la estratosfera.

6

Page 18: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 1 - CONCEPTOS FUNDAMENTALES

Por tanto, el ozono en la troposfera deberá producirse por algún otro mecanismo, su formación se atribuye por lo general al ciclo fotolítico del dióxido de nitrógeno (altamente reactivo fotoquímicamente). El cual se disocia según la reacción

N 0 2 + á v - > N 0 + 0 (E)

Esta e s una de las reacciones fotoquímicas más importantes en la atmósfera inferior, puesto que produce el oxígeno monoatómico O, altamente reactivo. Como ya s e indicó, el O se combina con el 0 2 para formar ozono mediante la reacción (B).

Luego, el ozono oxida el monóxido de nitrógeno a dióxido de nitrógeno. En resumen, el ciclo fotolítico del dióxido de nitrógeno se puede representar por

N 0 2 + A v - > N O + O

O + O2 + M ■—̂ Qj + Ad

O + N O —» N 0 2 + ü 2

(E)

(B)

(F)

Las tres reacciones ya indicadas son muy rápidas, y la combinación tendería a mantener un estado de nivel bajo y constante de ozono.

En la figura 1.2 se muestra el modelo simplificado del ciclo fotolítico del dióxido de nitrógeno.

Figura 1.2. Ciclo fotolítico del dióxido de nitrógeno atmosfénco (Wark y Warner, 2000)

7

Page 19: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 1 - CONCEPTOS FUNDAMENTALES

Por tanto, la gran cantidad de ozono observado en las atmósferas urbanas, comparándola con la cantidad pronosticada por el ciclo fotolítico del dióxido de nitrógeno, solo sería esperado si se pudiera establecer un mecanismo alternativo para la oxidación del NO a N 02 (Wark y Warner, 2000).

1 .3 .3 N ie b l a f o t o q u ím i c a ( f o rm a c i ó n d e O z o n o t r o p o s f é r i c o )

La niebla fotoquímica se forma mediante un proceso fotoquímico a partir de numerosos g a se s presentes en la troposfera, como son los óxidos de nitrógeno (NOx, esto es, NO y N 02), compuestos orgánicos volátiles (COV's) y el monóxido de carbono (CO).

Los reactivos de la niebla fotoquímica están constituidos por la quema de combustibles fósiles, sobre todo para el transporte, y el uso de productos que contienen disolventes orgánicos. La energía necesaria para la reacción de la niebla fotoquímica proviene del espectro de la radiación solar.

En la figura 1.3 se muestra la variación de la concentración de los principales componentes de la atmósfera durante un periodo de niebla fotoquímica. La secuencia de acontecimientos comienza en las primeras horas de la mañana cuando se produce una intensa emisión de hidrocarburos (HC) y monóxido de nitrógeno (NO) al comenzar la actividad humana en las grandes ciudades (encendido de las calefacciones y tráfico intenso). El monóxido de nitrógeno (NO) se oxida a dióxido de nitrógeno (N02) aumentando la concentración de e s te último en la atmósfera. Las concentraciones superiores de N 02 unido a que la radiación solar se va haciendo más intensa, ponen en marcha el ciclo fotolítico del N 02, generando oxígeno atómico que al transformarse en ozono conduce a un aumento de la concentración de es te elemento y de radicales libres de hidrocarburos Estos, al combinarse con cantidades apreciables de NO, producen una disminución de este compuesto en la atmósfera.

Este descenso en la concentración de NO impide que se complete el ciclo fotolítico aumentando rápidamente la concentración de ozono ( 0 3).

8

Page 20: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 1 - CONCEPTOS FUNDAMENTALES

A medida que avanza la mañana, la radiación solar favorece la formación de oxidantes fotoquímicos, aumentando su concentración en la atmósfera. Cuando disminuyen las concentraciones de los precursores (NOx y HC) en la atmósfera, c e sa la formación de oxidantes y su s concentraciones disminuyen al avanzar el día. De aquí que la contaminación fotoquímica s e manifieste principalmente por la mañana en las ciudades. (http://www.jmarcano.com/recursos/contamin/catmosf2c.htmi).

a.§

3SO

0,6 i r i -j T ' T' ' 1--- T... 1 1" 7 T ' *1 i

0.5 -Hidrocarburos -

0,4 -

0,3 - Aldehidos -

0,2 - Ozono -

0,! -N O :

-

0 i i i i N Oi i i i i i i i6 8 10 12 2 4 6

a.m. Mediodía p tn

Figura 1.3. Formación de ozono a partir de sus precursores (Spedding, D J.)

La atmósfera urbana contaminada contiene, aproximadamente, cien hidrocarburos diferentes, siendo los m ás reactivos las olefinas. El resultado del a taque del oxígeno atómico sobre las olefinas produce dos radicales libres, en el caso del propileno, la primera e tapa de la reacción consiste en la adición de oxígeno al doble enlace para dar un complejo reactivo (G)

h 3c - h c = c h 2 + o -̂ > [ h 3c - h c = c h 2 - o ] (G)

que s e puede fragmentar en dos formas diferentes (reacciones H e I)

H 3C - H C = C H 2 - O [//3C - HC -+-C H = O ]

//3C - H C = C H 2 - 0 - + [H 3C >+H 3C - C-= O ]

(H)

(D

9

Page 21: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 1 - CONCEPTOS FUNDAMENTALES

La reacción más probable e s la (I), ya que representa menor reagrupamiento del complejo activado que la (H). Los radicales CHO* y CH3CO* forman rápidamente formaldehído y acetaldehído, respectivamente, las reacciones (H) e (I) son las e tapas iniciales de un proceso en cadena

c / / , * + o 2 -> C I I / ) 2. (J)c h 3o 2 *+n o -> c h 3o *+ n o 2 (K)C7T,0 ‘ + 0 2 I íC H O + H 0 2 • (L)H ü 2 •+ N O -> 0 I I ‘ \ N 0 2 • (M)C3/ / 6 + O H - + C H 3C H 2 *+ H 20 (N)

La reacción en cadena permite la rápida oxidación del NO a N02 por radicales alcoxilo (RO*) y peroxialquilo (R02*) sin necesidad de la intervención del oxigeno atómico y el 0 3, lo cual proporciona cierta explicación a los cambios observados en la concentración de g a se s contaminantes durante el día.

Cuando crece la concentración atmosférica de hidrocarburos, a causa de la actividad de los vehículos de motor, se perturba el ciclo fotolítico del N 02 y el NO se oxida a N 0 2 por la reacción en cadena en que intervienen los radicales de los hidrocarburos (ecuaciones H — N). Como consecuencia, crece la baja concentración constante de 0 3 encontrada en el ciclo fotolítico del N 02, ya que el ozono no se consume en la oxidación del NO a N02. (Spedding,D. J.).

1 .4 P r o b l e m á t i c a d e l a i r e e n la Z o n a M e t r o p o l i t a n a d e G u a d a l a j a r a , J a l i s c o (ZMG)

Debido al desarrollo industrial que la ZMG ha experimentado en los últimos años, ha surgido un desequilibrio urbano — ecológico — industrial, a cau sa de la generación de contaminantes de diferentes características que alteran la calidad ambiental y superan la capacidad de asimilación del ecosistema.

10

Page 22: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 1 - CONCEPTOS FUNDAMENTALES

En la ZMG tanto la actividad industrial (fuentes fijas) como la concentración vehicular (fuentes móviles) determinan la calidad del medio ambiente urbano en lo referente al aire y su composición. En su conjunto, vehículos y establecimientos comerciales generan 600,000 ton anuales de contaminantes; 75% proviene de fuentes móviles que alcanzan el número de 792,000 unidades; en cuanto a los establecimientos industriales; comerciales y de servicios, se reportan mas de 23,000 establecimientos que en porcentaje representa un 25% de la contaminación, (http://semades.jalisco.gob mx/site/indexaire.htm)

Entre las fuentes fijas de contaminantes de carácter antropogénico2, s e encuentran las siguientes:

• Emisiones de humos por actividades industriales.• Emisiones de humos por ladrilleras, sobre todo en los municipios de Tonala y

Tlaquepaque.• Quema de basura que e s una practica generalizada en todo el estado.• Quema de llantas o cajas de acumuladores.• Quema de pastizales y campos de cultivo sobre todo caña de azúcar.• Quema provocada de bosques, y• Quema de leña o carbón en zonas suburbanas.

En la ZMG se presenta el fenómeno llamado Inversión Térmica el cual provocaestancamiento de los contaminantes en la atmósfera. Por la noche y temprano en las mañanas, la capa de aire que se encuentra en contacto con la superficie del suelo adquiere una temperatura menor que las capas superiores, volviéndose m ás densa y pesada . Las capas de aire que se encuentran a mayor altura y que están relativamente más calientes, actúan entonces como una cubierta que impide el movimiento ascenden te del airecontaminado.

2 Antropogénico: referido a los contaminantes resultantes de la actividad humana

Page 23: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 1 - CONCEPTOS FUNDAMENTALES

La información de frecuencias de ocurrencia de la inversión térmica (Figura 1.4), muestra que é s ta s e presenta en la ZMG durante 283 días del año, e s decir un 78% de los días, siendo los periodos de enero a junio y noviembre a diciembre, cuando su presencia se da prácticamente en todos los días del mes. Para los m ese s de julio a octubre, su frecuencia llega a se r menor al 50% de los días del mes.

!2D _

H c í

¡ ^ * 2 2 3 ' i - »■ t i _ » t - i r r t a - J

Figura 1.4. Frecuencia e intensidad promedio de las inversiones térmicas en la Z M G (1993-1994)

Asimismo, la inversión térmica alcanza sus valores más altos de intensidad en el mismo período en que se presenta con mayor incidencia (Figura 1.4); es to es, en las épocas de invierno-primavera y la mayor parte dei otoño. En diciembre, la intensidad de la inversión térmica ha llegado a presentar valores máximos de hasta 12°C. Durante la mayor parte del período de lluvias, de junio a septiembre, e inclusive octubre, la intensidad promedio mensual de las inversiones térmicas es menor a 1°C.

El espesor de la inversión térmica e s típicamente de decenas a algunos cientos de metros, siendo mayor en la época de secas y relacionada con temperaturas de rupturas de cerca de 13°C para los m eses más fríos del año (enero y febrero), (http://www.ine.gob.mx/ueajei/...).

12

Page 24: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 1 - CONCEPTOS FUNDAMENTALES

Cuando se emiten contaminantes al aire en condiciones de inversión térmica, estos aumentan su concentración debido a que los fenómenos de transporte y difusión de los contaminantes ocurren demasiado lento, provocando graves episodios de contaminación atmosférica de consecuencias graves para la salud de los se res vivos. (http://www.sagan- gea.org/hojared/hoja20.htm).

AGENTESCONTAMINANTES

Figura 1.4. Formación de la inversión térmica (http://www comsoc.udg.mx/gaceta/paginas/372/372-8.pdf)

Debido a es te problema la ZMG e s la segunda ciudad que más excede la norma para su control (NOM-020-SSA1-1993), por lo que, e s de vital importancia que la ZMG cuente con un modelo matemático que prediga en forma acertada las concentraciones de ozono que se podrían presentar en un momento determinado, ya que esto ayudará a tomar medidas preventivas y/o correctivas para evitar que los se res vivos se expongan a las altas concentraciones de ozono. Estos modelos tienen la característica de poder relacionar la calidad del aire con algunos otros parámetros particulares de las cuencas atmosféricas, como lo serían los niveles de emisión y condiciones meteorológicas.

13

Page 25: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 2 - MODELOS DE PREDICCIÓN

C A P I T U L OM O D E L O S D E P R E D I C C I Ó N

Las cuencas atmosféricas, así como los puntos de mayor impacto y los efectos en materia de salud En la actualidad existen diferentes modelos para explicar y/o entender la dinámica de los contaminantes en la atmósfera. Dichos modelos se pueden clasificar en dos grandes grupos: los determinísticos, caracterizados por ser complejos, de altos requerimientos de información y soporte computacional; y los modelos semi-empíricos, caracterizados por tener requerimientos computacionales y de información más modestos, pero con la suficiente eficiencia para poder llegar a ser útiles en el estudio de la contaminación atmosférica. (García, 2003).

Los modelos semi-empíricos más empleados en estudios de calidad de aire son: Regresión Multivariable, Redes Neuronales Artificiales (RNA) y Series de Tiempo. En este trabajo se presenta el desarrollo de dos modelos En el primer modelo se utilizará la Regresión Multivariable, y en el segundo una estructura de RNA, para pronosticar los niveles máximos de concentración de Ozono (0 3) en la Zona Metropolitana de Guadalajara (ZMG), partiendo de una serie de variables meteorológicas y químicas.

En la última década se ha visto un creciente interés en el desarrollo de modelos atmosféricos para tratar de pronosticar los niveles de contaminación haciendo uso de técnicas de ajuste de datos. Dichos modelos establecen las condiciones ambientales de una región basándo se en datos históricos de diversos parámetros (meteorológicos y químicos) medidos rutinariamente por estaciones de monitoreo atmosférico.

2.1 M O D E L O S DE R E G R E S IO N M ULTIVARIABLE

Una Regresión Multivariable analiza por medio de una ecuación matemática la relación que existe entre una única variable dependiente y varias variables independientes. El objetivo e s predecir cambios en la variable dependiente en respuesta a cambios en varias de las variables independientes.

14

Page 26: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 2 - MODELOS DE PREDICCIÓN

En este trabajo el objetivo primordial de los modelos de Regresión Multivariable e s describir el comportamiento de la concentración de ozono troposférico ( 0 3) utilizando algunas variables meteorológicas y químicas que son de gran importancia para la formación de dicho contaminante.

El modelo general que se tiene es el siguiente

C Gi = f (x1,x2,x3,....,Xn) + E

DondeC e s la concentración del contaminante en cuestión, Xn representa las variables independientes que serán introducidas al modelo y E e s el error, el cual representa el hecho de que el modelo no puede explicar toda la variación observada. (Draper y Smith, 1981)

La mayoría de los contaminantes formados en la troposfera se comportan en una forma no lineal, esto es, por ejemplo, en las horas de 12 - 17, cuando la temperatura aumenta, la producción de ozono aumenta considerablemente con respecto al resto de horas en que la temperatura e s baja y por consiguiente la formación de dichos contaminantes disminuye, como se puede observar en la figura 2.1.

0 3 0 I > 1--------------------------------1------------------------------- 1------------------------------- r

Time, min

Figura 2.1. Comportamiento lineal y no lineal de diferentes contaminantes (Seinfeld, 1978)15

Page 27: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 2 - MODELOS DE PREDICCIÓN

Debido a esto e s necesario estudiar los modelos de Regresión Multivariable lineal y no lineal, así como entender las variables para obtener un mejor modelo de predicción.

A continuación se nombran los modelos de regresión lineal y no lineal, debido a que las relaciones entre las concentraciones de los contaminantes atmosféricos con los parámetros químicos y físicos son altamente no lineales, lo que presupone que los modelos no lineales resulten superiores en sus estimaciones, respecto a los lineales.

La forma general de los modelos lineales y no lineales se presenta en la tabla 2.1

Tabla 2.1 Modelos matemáticos

Modelo Ecuación MatemáticaLineal r = /?0+ ( A * 0

Logarítmico r = /?0 + (A * in ( f ) )

Inverso Y =

Cuadratico Y = /}0 + ( f i * t ) + (j32 * t 2)

Cúbico Y = fio + (fix * t ) + (P 2 * t 2) + (j33 * r3)

Poder Y = 0 o+ ( t * )

Compuesto Y = Po + ( /V )

Curva S Y —

Creciente Y = e(A+(A*0)

Exponencial Y = /?0* (e(A*'))

16

Page 28: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 2 - MODELOS DE PREDICCIÓN

Una vez estudiados los diferentes modelos de regresión, e s preciso saber qué variables afectarán de forma directa la predicción de concentración de 0 3

Las siguientes cuestiones a resolver son ¿Qué modelo se ajusta mejor a ios datos?, y ¿Qué variables son importantes a considerar para la construcción del modelo de regresión?

Para responder la primera pregunta e s preciso conocer un parámetro importante; la R2 (Coeficiente de correlación); cuando un modelo presenta una R2 igual a 1, arroja la certeza de que el modelo construido e s 100% confiable, y las estimaciones hechas serán reales. Si el modelo presenta un valor 0<R2<1, éste muestra una incertidumbre de la realidad, por lo consiguiente mientras más se aproxime el valor de R2 a 0 el modelo se rá poco confiable.

Para responder la segunda pregunta e s necesario hacer un modelo para cada una de las variables químicas y meteorológicas, así se sabrá qué variables tendrán gran impacto en la predicción de la concentración de 0 3.

2 .2 . R E D E S N E U R O N A L E S

Referidas habitualmente de forma más sencilla como redes de neuronas o redes neuronales, las Redes de Neuronas Artificiales (RNA) o Artificial Neural System (ANS) son un paradigma de aprendizaje y procesamiento automático inspirado en la forma en que funciona el sis tema nervioso de los anímales Consiste en simular las propiedades observadas en los s is tem as neuronales biológicos a través de modelos matemáticos realizados mediante mecan ismos artificiales (como un circuito integrado, un ordenador o un conjunto de válvulas).

El objetivo es conseguir que las máquinas den respuestas similares a las que e s capaz el cerebro, las cuales se caracterizan por su generalización, (http //ohm.utp.edu.co/ )

Las RNA son redes compuestas de grandes cantidades de elementos computacionales simples altamente interconectados.

17

Page 29: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 2 - MODELOS DE PREDICCIÓN

El término "neuronal" e s meramente indicativo de la inspiración original que condujo al desarrollo de e s ta s redes. De hecho, existe poco parecido entre el funcionamiento real de estas redes y el cerebro, por lo que muchas personas prefieren el uso de términos como Redes de Autómatas o Redes Celulares para referirse a este tipo de tecnología

En su libro "Artificial Neural Networks, Concepts and Theory", Pankaj Mehra y Benjamín W. Wah, explican las características de las Redes Neuronales Artificiales:

"Quizá la mejor manera de caracterizar a las Redes Neuronales Artificiales e s contrastarías con otros modelos cognitivos y computacionales El modelo cognitivo más popular empleado en la Inteligencia Artificial separa al conocimiento de la inferencia, de forma similar, el modelo computacional comúnmente utilizado para la programación de computadoras hace una distinción entre los datos y los programas”.

Las Redes Neuronales Artificiales diluyen estas distinciones- sus "algoritmos" son representados de forma estática por su arquitectura y sus "datos" son rep resen tados implícitamente por su dinámica. El término de "computación emergente" enfatiza el hecho de que los datos de entrada se vuelven indiscernibles an tes de emerger como los da tos de salida de la red." (www.itlp edu.mx/publica/..)

Las simulaciones de redes neuronales no son un desarrollo reciente. Este campo fue establecido antes del advenimiento de los computadores, pero su verdadero desarrollo tuvo lugar cuando las simulaciones por computadora fueron factibles por capacidad de procesamiento y bajo costo.

2 .2.1 E S T R U C T U R A DE UN S ISTEM A N E U R O N A L ARTIFIC IAL .

Las RNA imitan la estructura de un hardware del sistema nervioso, con la intención de construir sistemas de procesamiento de la información paralelos, distribuidos y adoptivos, que puedan presentar cierto comportamiento “inteligente”.

Los elementos básicos de un sistema neuronal biológico son las neuronas, que se agrupan en conjuntos compuestos por millones de ellas organizadas en capas, constituyendo un sistema con funcionalidad propia.

18

Page 30: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 2 - MODELOS DE PREDICCIÓN

Un conjunto de estos subsistemas da lugar a un sistema global. En la realización de un Sistema Neuronal Artificial puede establecerse una estructura jerárquica similar que copie en cierto modo la estructura de las redes neuronales biológicas.

El elemento esencial de partida será la neurona artificial, que se organizará en capas; varias capas constituirán una red neuronal; y por ultimo, una red neuronal (no un conjunto de ellas), junto con las interfaces de entrada y salida, más los módulos convencionales adicionales necesarios, constituirán el sistema global de proceso (Ver figura 2.2)

Figura 2.2 Estructura jerárquica de un sistema basado en ANS

Formalmente y desde el punto de vista del grupo PDP (Parallel Distributed Processing Research Group, de la Universidad de California en San Diego3), un sistema neuronal, está compuesto por los siguientes elementos:

• Un conjunto de procesadores elementales o neuronas artificiales.• Un patrón de conectividad o arquitectura• Una dinámica de activaciones• Una regla o dinámica de aprendizaje• El entorno donde opera

Grupo iniciador de las investigaciones de las RNA, con varias publicaciones.19

Page 31: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 2 - MODELOS DE PREDICCIÓN

2 .2 .2 M O D E L O G E N E R A L IZ A D O DE N E U R O N A ARTIF IC IAL .

Aunque el comportamiento de algunos sistemas neuronales biológicos sea lineal, en general la respuesta de las neuronas biológicas es del tipo no lineal, característica que e s emulada en los RNA ya desde la neurona formal original de McCulloch-Pitts.

La formulación de la neurona artificial como dispositivo no lineal constituye una de su s características más destacables y una de las que proporciona mayor interés a las RNA, pues el tratamiento de problemas altamente no lineales no suele ser fácil de abordar mediante técnicas convencionales.

Se denomina procesador elemental o neurona a un dispositivo simple de cálculo que, a partir de un vector de entrada procedente del exterior o de otras neuronas, proporciona una única respuesta o salida. Los elementos que constituyen la neurona de etiqueta / son los siguientes:

• Conjunto de entradas• Pesos sinápticos de la neurona i, que representan la intensidad de interacción entre

cada neurona presináptica j y la neurona postsináptica /.• Regla de propagación, que proporciona el valor del potencial postsináptico de la

neurona i en función de sus pesos y entradas.• Función de activación, que proporciona el estado de activación actual de la neurona /,

en función de su estado anterior y de su potencial postsináptico actual.• Función de salida, que proporciona la salida actual de la neurona i en función de su

estado de activación.

2 .2 .3 M O D E L O EST A N D A R DE LA N E U R O N A ART IF IC IA L

El modelo expuesto en la sección anterior resulta muy general. En la práctica suele utilizarse uno más simple, que constituye un caso particular del modelo del PDP, considerando que la regla de propagación e s la suma ponderada y que la función de salida e s la identidad, de esta forma la neurona estándar consiste en (Ver figura 2.3):

20

Page 32: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 2 - MODELOS DE PREDICCIÓN

• Un conjunto de entradas y pesos sinápticos.• Una regla de propagación que es la más común.• Una función de activación, que representa simultáneamente la salida de la neurona y

su estado de activación. (Martín y Sanzo,1999)

x,

* 5 ' ' '

Figura 2.3. Modelo de neurona estándar

2 ,2 ,4 A R Q U IT E C T U R A DE R E D E S N E U R O N A L E S

Se denomina arquitectura a la tipología, estructura o patrón de conexión de una red neuronal. En una RNA los nodos se conectan por medio de sinapsis4, e s ta estructura de conexiones sinápticas determina el comportamiento de la red. Las conexiones sinápticas son direccionales, e s decir, la información solamente puede propagarse en un único sentido.

En general las neuronas se suelen agrupar en unidades estructurales llamadas capas. Las neuronas de una capa pueden agruparse, a su vez, formando grupos neuronales. Dentro de un grupo, o una capa si no existe este tipo de agrupación, las neuronas suelen se r del mismo tipo. Finalmente, el conjunto de una o mas capas constituye la red neuronal.

Se distinguen tres tipos de capas: de entrada, de salida y ocultas. Una capa de entrada es tá compuesta por neuronas que reciben datos o señales procedentes del entorno. Una capa de salida e s aquella cuyas neuronas proporcionan la respuesta de la red neuronal. Una capa oculta e s aquella que no tiene una conexión directa con el entorno, e s decir, que no se conecta directamente a órganos censores.

4 Región de comunicación y transmisión entre neuronas.21

Page 33: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 2 - MODELOS DE PREDICCIÓN

Este tipo de capa proporciona a la red neuronal grados de libertad adicionales, gracias a los cuales puede encontrar representaciones internas correspondientes a determinados rasgos del entorno, proporcionando una mayor riqueza computacionai. (Ver figura 2.4).

Las conexiones entre las neuronas pueden ser excitatorias o inhibitorias: un peso sináptico negativo define una conexión inhibitoria, mientras que uno positivo determina una conexión excitatoria. Habitualmente, no se suele definir una conexión como de un tipo o de otro, sino que por medio del aprendizaje se obtiene un valor para el peso, que incluye signo y magnitud.

Por otra parte, se puede distinguir entre conexiones Intra-capa e Inter-capa. Las conexiones intra-capa, también denominadas laterales, tienen lugar entre las neuronas pertenecientes a una misma capa, mientras que las conexiones inter-capa se produce entre las neuronas de diferentes capas. Existen además conexiones realimentadas, que tienen un sentido contrario al de entrada-salida. En algunos casos puede existir realimentación, incluso de una neurona consigo misma.

CAPA DE CAPA CAPA DEENTRADA OCULTA SALIDA(SENSORIAL)

Figura 2.4. Arquitectura unidireccional

22

Page 34: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 2 - MODELOS DE PREDICCIÓN

Pueden estab lecerse tipos de arquitecturas neuronales, en relación a su estructura en capas, es decir, redes monocapa y de redes multicapa Las redes monocapa son aquellas compuestas por una única capa de neuronas. Las redes multicapa son aquellas cuyas neuronas s e organizan en varias capas.

Asimismo atendiendo al flujo de datos en la red neuronal, existen redes unidireccionales y redes recurrentes. En las redes unidireccionales, la información circula en un único sentido, desde las neuronas de entrada a las de salida En las redes recurrentes o realimentadas la información puede circular entre las capas en cualquier sentido, incluido el de salida-entrada.

Por último también se habla de redes autoasociativas y heteroasociativas. Con frecuencia se interpreta la operación de una red neuronal como la de una memoria asociativa, que ante un determinado patrón de entrada responde con un cierto patrón de salida. Si una red se entrena para que ante la presentación de un patrón A responda con otro diferente B, se dice que la red e s heteroasociativa. Si una red es entrenada para que asocie un patrón A consigo mismo, s e dice que e s auto-asociativa. (Martín y Sanzo, 1999)

2 .2 .5 C L A S IF IC A C IO N DE L O S M O D E L O S N E U R O N A L E S

Dependiendo del modelo de neurona concreto que se utilice, de la arquitectura o topología de conexión y dei algoritmo de aprendizaje, surgirán distintos modelos de redes neuronales.

De esta manera, en primer lugar, se hace una distinción respecto al tipo de aprendizaje (supervisados, no supervisados, híbridos y reforzados), a su vez, y dentro de cada uno de los grupos, se toma en cuenta el tipo de topología de la red (realimentadas y unidireccionales).

23

Page 35: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 2 - MODELOS DE PREDICCIÓN

La clasificación que así surge es-

M O D E L O S DE REDES N E U R O N A L E S ARTIFICIALES

Híbridos Supervisados No supervisados Reforzados

Retroalimentados Unidireccionales Retroalimentados UnidireccionalesBSBFuzzy Cog Map BP Through Time

RBFContra-propagación

Perceptrón Adalina/Madalina Perceptrón multicapa Back Propagation Time-delay NN CMACCorrelación en cascada Máquina de Boltzmann LVQ GRNNSupport Vector Machines

ARTHopfieldBAM

LAM y OLAM Mapas de Kohonen Neocognitrón Redes PCA

Premio-castigo asociativo Critico adaptativo

Figura 2.5. Clasificación de los ANS por el tipo de aprendizaje y la arquitectura (http //es wikipedia org/ )

2 .3 A P L IC A C IO N E S DE M O D E L O S P R O N Ó S T IC O EN E L Á R E A A M B IEN TA L

A continuación se citan algunos ejemplos, el primero de ellos fue realizado en Houston y se explica a continuación:

Davis y Speckman utilizaron registros de datos de ozono de los años 1983 - 1991 de diez estaciones en el área de Houston para el desarrollo del estudio, así también datos meteorológicos del aeropuerto internacional de la ciudad de Houston Para la construcción del modelo, se utilizaron los registros de abril a octubre de 1983 a 1987 y de 1989 a 1990

24

Page 36: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 2 - MODELOS DE PREDICCIÓN

El modelo de predicción que representaba mejor la realidad contenía tres términos relacionados (se tomaron valores promedio en los horarios de 8 PM a 5 AM, 6 AM a 9 AM, de 10 AM a 5 PM) los cuales son- nubosidad (promedio del horario de 10 AM a 5 PM), nivel máximo de ozono del día anterior y nivel máximo de temperatura del día de hoy.

El modelo de predicción que se realizó para cada estación, arrojó una R2 de 0.66 a 0.73 para una concentración media de 13.2 a 16 3 ppb y para una concentración máxima de ozono (18.5 a 22 ppb) mostró una R2 de 0.61 a 0.68.

Se concluye que el modelo funciona mejor para predecir concentraciones medias que cuando se analizan concentraciones altas.

• El segundo trabajo hecho por Hubbard y Cobourn en la Ciudad de Louisville y Jefferson, Kentucky.

En dicho estudio se emplearon diferentes parámetros meteorológicos, los que destacan por su importancia en la formación de picos de ozono son los siguientes:

Temperatura máxima donde se encontró que la mejor transformación para el pronóstico de ozono, se logra con una ecuación polinomial de cuarto orden.

Velocidad del viento donde se aplica una función de decaimiento exponencial, así como un elemento no lineal.

Transmitancia atmosférica considerando la intensidad de radiación solar que recibe la tierra, encontrando un valor de R2=0.063 respecto a la concentración de ozono.

Temperatura mínima para hacer un ajuste entre la temperatura máxima en el horario fotolítico y la temperatura mínima.

Cobertura de nubes aplicando una adaptación que aplican los meteorólogos para reducir el error de lectura subjetivo a la lectura visual.

25

Page 37: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 2 - MODELOS DE PREDICCIÓN

Precipitación mencionando que esta variable puede reducir la concentración de ozono a 10 — 20 ppb en pocos minutos, para lavar dicho contaminante

Calmas considerando esta variable a velocidades de viento menores a 3 mph, considerándolas desde la media noche hasta las 4 AM

Día de ia sem ana para encontrar concentraciones máximas de ozono los fines de sem ana (sábado y domingo), básicamente por los patrones de conducta antropogénicos.

Aplicando las variables antes mencionadas en diferentes regresiones, llegaron a una ecuación de regresión múltiple que consiste en 10 coeficientes de regresión; 8 variables (el orden de las variables en la ecuación, corresponde al orden de las variables anteriormente listadas) y un parámetro no lineal.

Y = fío + P\X\ + fh X x + /?3X,4 + p , exp (0X 2) + B.-X, + BhX , + J37X 5 + K X 0 + j3gX 7 + & 0X S

La correlación obtenida bajo este modelo fue de R2 = 0.67 a 0.7 para el período comprendido del 1o de Mayo al 31 de Septiembre (este periodo e s conocido como estación de ozono, ya que en e s to s m eses por lo regular se alcanzan concentraciones máximas de ozono en el ambiente, dadas las condiciones meteorológicas presentes como alta temperatura, cielos despejados y buena incidencia lumínica, entre otras) para los años 1993 - 1996

La validación del modelo se realizó comparando las concentraciones de ozono observado contra el pronóstico (517 lecturas de datos), estableciendo 4 escenarios de calidad ambiental, siendo las siguientes: buena ([03J < - 60 ppb), moderada (60 < [0 3] <-95), próximo a insalubre (95 < [0 3]<-120) e insalubre ([03]>120).

Tal que para el periodo examinado el 72% de los datos pronosticados fue correcto (comparado con el ozono observado); mientras que por categoría de calidad ambiental s e encontró: 74% correcto para el rango de 0 -60 ppb, 80% correcto de 61 - 95 ppb, 40% correcto en el intervalo de 96 - 120 y 0% correcto para concentraciones superiores a las 120 ppb

26

Page 38: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 2 - MODELOS DE PREDICCIÓN

• El tercer trabajo realizado por Cobourn y Hubbard utilizando Redes Neuronales Artificiales de Mayo a Septiembre de 1998 y 1999.

S e aplicaron tres capas en la red, con su s respectivas interacciones por nodos, donde en cada uno de éstos se empleó una función sigmoidal Las capas correspondientes fueron la de entrada, oculta y la de salida. De las nueve posibles variables de entrada, sólo se tomaron seis para este modelo siendo temperatura, velocidad del viento, temperatura en el punto de rocío, cobertura de nubes, calmas y precipitación

El modelo de RNA consistió en seis nodos de entrada, diez nodos intermedios y un nodo de salida (estructura 6X10X1), representando la concentración de ozono estimada. Se estableció como valor de alta concentración de ozono, aquellas concentraciones que sobrepasarán 110 ppb, con un porcentaje de detección de excedencia a la norma del 42%. (García, 2003).

• El cuarto trabajo fue realizado por Ignacio García y Alberto Mendoza, en el área Metropolitana de Monterrey, N. L. México.

Se presentó el desarrollo de dos modelos para pronosticar el nivel máximo de 0 3 Uno de los modelos relaciona datos meteorológicos y químicos con el estimado de 0 3 mediante una ecuación de Regresión no Lineal (RNL). El segundo modelo emplea una estructura de Redes Neuronales Artificiales (RNA) para relacionar las m ismas variables; las cuales para ambos casos fueron para un periodo de años de 1998 al 2002 y dichas variables utilizadas son: temperatura, velocidad del viento, humedad relativa, presión, precipitación, radiación solar todas ellas máximas en el periodo de 12 a 23 horas, así como concentraciones máximas del día anterior de NOx, N 02 y 0 3. Con e s ta s variables el modelo obtiene un pronóstico de la concentración de ozono máxima para el día de interés.

El modelo RNL obtenido consistió de 14 coeficientes de regresión y nueve variables independientes, las cuales fueron seleccionadas mediante regresiones individuales entre la variable de interés (0 3) y los diversos parámetros, escogiendo sólo aquellos con índices altos de correlación, quedando de la siguiente manera:

27

Page 39: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 2 - MODELOS DE PREDICCIÓN

o , = ( F * OanU ) + (B0 + [T0 * ex p (7 ’ * T E M P j] + Bt * HR + B, * PREC IP + B, * PRESI +

+ b4 * r a d + ^ n ^* n o 2) + [ n 2 * n o x ) + ( n x 2*N O X2)]+ [(JV l * W )+ (W 2 * W 2)~\

La RNA empleada fue de retropropagación en multicapas. Todas las redes probadas constaron de tres capas alimentación, oculta y de salida. El número de nodos de la capa oculta se varió entre seis y doce. Las funciones de transferencia de la capa interna fueron Log-sigmoidales, mientras que la de la capa de salida fue lineal. Para el entrenamiento de la red se empleó el algoritmo de Levenberg-Marquardt.

Los modelos generados fueron evaluados en cuanto a su eficiencia para pronosticar acertadamente la calidad del aire en Monterrey, empleando datos del 2002. En ambos casos, los modelos tuvieron dificultad para estimar altas concentraciones de ozono, por lo que se aplicó un factor de incremento a las estimaciones gene radas por los modelos, con ello sobreestimando la concentración de ozono y logrando un mejor desempeño. El desempeño se evaluó comparando las concentraciones de ozono estimadas respecto a las observadas, contabilizando el porcentaje de acierto sobre tres diferentes niveles de calidad de aire, buena, moderada y mala. Los modelos tuvieron eficiencias globales mayores al 75%.

28

Page 40: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 3 - DESCRIPCIÓN DE LA METODOLOGÍA

C A P I T U L O D E S C R I P C I Ó N D E L A M E T O D O L O G Í A

En este capítulo se explica la estructuración de la ba se de datos de trabajo para desarrollar los modelos pronóstico, acorde a los programas computacionales que se emplearon en la realización de esta tesis.

3.1 F u e n t e d e d a t o s .

Los datos empleados fueron proporcionados por el Sistema Meteorológico Nacional (SMN) y el Instituto Nacional de Ecología (INE).

Por parte del SMN se obtuvieron los datos meteorológicos correspondientes a los años de Abril de 1999 a Junio de 2005, siendo estos promedios con lecturas de 0 a 23 hrs. cada 10 minutos.

Las variables meteorológicas suministradas son:• Dirección del viento (promedio y máxima promedio) (grados)• Velocidad del viento (promedio y máxima promedio) (km/h)• Temperatura Promedio (°C)• Humedad Relativa (%)• Presión Barométrica (mbar)• Precipitación (mm)• Radiación Solar (W/m2)

Estos datos fueron obtenidos de las estaciones de Chapala y Tizapán presen tadas en la figura 3.1, que pertenecen a las Estaciones de Monitoreo Automáticas (EMA's) que están formadas por un conjunto de sensores que registran y transmiten información meteorológica de forma automática de los sitios donde se encuentran colocadas estratégicamente. El área representativa de las estaciones es de 5 Km. de radio aproximadamente en terreno plano.

29

Page 41: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 3 - DESCRIPCIÓN DE LA METODOLOGÍA

Figura 3.1. Localización de las EMA's

Por otro lado los datos de las variables químicas (Ozono, Óxidos de Nitrógeno -NOx y N 0 2), fueron proporcionados por el Instituto Nacional de Ecología (INE) sobre las estac iones de Miravalle y Tlaquepaque represen tadas en la figura 3.2. Los datos s e obtienen de cada una de las estaciones que conforman las diferentes Redes de Monitoreo Atmosférico. Cada estación cuenta con una serie de instrumentos que de forma automática y continua miden concentraciones de contaminantes atmosféricos como Ozono, Monóxido de Carbono, Dióxido de Azufre, Óxidos de Nitrógeno, Partículas PM10, entre otras.

30

Page 42: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 3 - DESCRIPCIÓN DE LA METODOLOGÍA

Z i t c p c r i

Vrfiadf»- - i

j

. fLas Agiüas

• í

Atemjac /• _/

G*n*ro*

Guadal apro

OH ato*

Datóte pac»»é ~ ~ -

í x t ó r i u x a i > _ ( P i u

V -\

' 3}ootariB,ü

U>ma DoradaMnvtf#

To i o te

T a c m .n o , u Z ú a cr. T i a a u e p a q u e

* E r a c r i c ' -x: i c-> tzr¿~

O l.va* "r- ’r> v»

'■ix ffc ccruir csci'Vi

Rtr-cha ut-fro L 'r r t l . i c i a

0 1 2 r ít a T C T -:.E iS a t c

Figura 3.2. Red Automática de Monitoreo Atmosférico de la Zona Metropolitana de Guadalajara (RAMAG),

Ert el Sistema de Monitoreo Atmosférico de la Ciudad de Guadalajara (RAMAG), se realiza un procedimiento automatizado de verificación de datos obtenidos a través de las estaciones de monitoreo, previo a la integración de promedios horarios y su posterior envío al servidor del SINAICA. Posteriormente estos reportes son enviados y a lmacenados en el INE, con el fin de tenerlos disponibles para la comunidad en general.

Haciendo un análisis de los reportes de los años 2002 - 2005 (tabla 3.1) se determinó que las mayores concentraciones de ozono se encontraban en la Zona Sur y Sur-Este de Guadalajara, por lo que se obtuvieron datos específicos para las variables meteorológicas y químicas de las estaciones ubicadas en esa zona.

31

Page 43: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 3 - DESCRIPCIÓN DE LA METODOLOGÍA

Tabla 3.1. Concentraciones máximas de ozono para los años 2002,2003, 2004 y 2005

Año 2002 2003 2004 2005

EstaciónConcentración

MáximaRegistrada

(ppm)

ConcentraciónMáxima

Registrada(ppm)

ConcentraciónMáxima

Registrada(ppm)

ConcentraciónMáxima

Registrada(ppm)

Las Águilas 0 169 0 165 0 164 0 131Atemajac 0 152 0 185 0 165 0 144Centro 0 166 0 171 0 157 0 137L Dorada 0 225 0 195 0 197 0 215Miravalle 0.232 0.225 0.226 0.154Oblatos 0 158 N.D N D N DTlaquepaque 0.142 0 149 0 138 0.109Vallaría 0 171 0217 0 175 0 096

N D - No Disponible

3 .2 B a s e s d e d a t o s p a r a e l a n á l i s i s

Los datos que se utilizaron fueron obtenidos de las bases de datos realizadas por el SMN como se indicó en el punto anterior, las cuales cuentan con un índice general, que describe el significado de la simbología, así como las consideraciones que se deben tomar en cuenta para la utilización de los datos, como se muestra en la figura 3.3.

32

Page 44: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 3 - DESCRIPCIÓN DE LA METODOLOGÍA

V A R I A B L E SM E T E O R O L O G I C A S

W S K - V e l o c i d a d d e V i e n t o d e l p r o m e d i o , e s t a d a d a e n k m / h

W S M K - V e l o c i d a d d e l v i e n t o m á x i m o , e s t a d a d a e n K m / h

A v g T e m p - T e m p e r a t u r a p r o m e d i o d e l a i r e , u n i d a d ° C

A v g R h - H u m e d a d R e l a t i v a p r o m e d i o , e s t a d a d a e n %

A v g B P - P r e s i ó n B a r o m é t r i c a p r o m e d i o , u n i d a d m i l i b a r ( m b a r )

R a i n - P r e c i p i t a c i ó n d e L l u v i a a c u m u l a d a , u n i d a d m m

A v g S R - S e n s o r d e r a d i a c i ó n s o l a r , e s t a d a d a e n W / r n 2

V A R I A B L E S Q U I M I C A SC O - C o n c e n t r a c i ó n d e C O eri p p r n

N O X - C o n c e n t r a c i ó n d e N O X e r i p p m

N 0 2 - C o n c e n t r a c i ó n d e N O 2 e n p p m

0 3 - C o n c e n t r a c i ó n d e 0 3 e n p p m

Figura 3.3. Simbología de las bases de datos proporcionadas por el SMN

Las bases de datos cuentan con un registro cada 10 minutos durante las 24 horas del día los 365 días de año presentadas en Excel con un archivo por cada mes.

33

Page 45: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 3 - DESCRIPCIÓN DE LA METODOLOGÍA

jüate ITime Dirdecj

WSMDirdea

WSKkph

WSMK AvgTemp ÁvgRh kph C %

AvgBP Rain mbar mm

AvgSR Baít W'mA2 V

SParielV

2004 Mar 01 000 235 274 7,9 15,4 25,6 17 842,4! 0 205 13,2 13,42004 Mar 01 ' 0 10 232 22 2 9,2 20 25,6. 18 842,3 0 '199:2004 Mar 01 0 20 228 214 6,1 " 13 7 25,4 18 842,3 ' 0 130:2004 Mar 01 030 267 253 7,5 13,7 25,1 18 842,4 0 101 ■2004 Mar 01 0 40 250 245 7,4 16,6 24,7 19 842,4 0 5 4 :2004 Mar 01 050 237 220 7,7 13,7 23 9 20 '842,5 " 0 92004 Mar 01 1 00 233 243 4.3 8,5 '23 21 842,5 0 3 '2004 Mar 01 1 10 260 243 2.5 6,2 22,1 22 842,5 0 -5

2004 Mar 01 1 20 288 294 5.2 12 5 21,4 22 842,6 0 -102004 Mar 01 1 30 '290 281 9.5 " 20,6; 21,2. 23 842,8' 0 92004 Mar 01 1 40 267 276 6,3 13,7: 20,9 25 843 0 -92004 Mar 01 1 50 272 242 6.5 12.5: 20,2 26 843,1 ' 0 -9:2004 Mar 01 2 00 275 273 5,8 8~5~ 19,7: 27 8432 0 9 '2004 Mar 01 2 10 272 268 5,7 "10.2. 19,3 28 843,4 "o -9"2004 Mar 01 2 20 268 254 5,9 9,1 ' 19 " ’ 29 843,5: 0 92004 Mar 01 . 2 30 262 251 5,6 10,8 18,6 31 843,7 0 92004 Mar 01 2 40 272, '240 4,4: 8.5 18.3 32 843,9 ' 0 -92004 Mar 01 2 50 276' 273 2,7 ' 7,9 ' 18 34 844 .0 -92004 Mar 01 3 00 271 264* 5,2 8,5 17,5" 36 844,2 0 3 V 2 p ' IJ2004 Mar 01 3 10 275 261 5,6" ~ 7 , 9 17.3 37 844,3| 0 -32004 Mar 01 3 20 295' 280 6,3; 9,1 17,1 38 844,4* ~ 0 -82004 Mar 01 330 309 301 6,2 " ' 9,7“ 17 40 844,6 0 -92004 Mar 01 3 40 307 297 9,2 13,1 168 41 844,7' 0 ’" .. 82004 Mar 01 3 50 283 270 9,3 13,7 17,1: 42 844,7 0 82004 Mar 01 4 00 283 276 6.7 10,2 17 43' 844,7 0 82004 Mar 01 4 10 280 277 62 11,4 16,6 44 844,8 0 -82004 Mar 01 .4 20 267 277 4,7 9,7 16,2 46 844,9 0 -82004 Mar 01 4 30 284 274 7.7 13,7 16 47 845 0 ...-8 '2004 Mar 01 4 40 290 287 9,3 15,4 15,8.' 48 845' 0 -82004 Mar 01 4 50 293 308 8,3 13,7 ¡5,7 49 845,1 0 -02004 Mar 01 500 270 275 7 Í5.4 15,6 50 845,2 0 -8

Figura 3.4. Bases de datos de variables meteorológicas

Los registros de las variables químicas proporcionadas por el INE en archivos de Excel, son cada 60 minutos las 24 horas del día durante los 365 días al año, d e sd e Abril de 1999 a Junio de 2005, figura 3.5.

34

Page 46: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 3 - DESCRIPCIÓN DE LA METODOLOGÍA

B C D E F G H I J03 N02 NOX

2 F E C H A H O R A MIR TL A MIR TLA MIR T L A3 01/01/2004 1 0 007 0 005 : 0 061 0 064 0 080 0 1354 01/01/2004 2 0 007 0 005 0 064 0 063: 0 121 0 1735 01/01/2004 3 0 007, 0 005 0 065 0 059 0 191 0 250'6 01/01/2004 4 0 006 0 006 0 059 0 060 0 222 0 2307 01/01/2004 5 0 007 0 005 0 058 0 056: 0217 02188 01/01/2004 6 0 007^ 0 005 0 055 0 052 0 160 0 194:9 01/01/2004 7 0 006 0 005 0 061 0 050 0 132 0 17310 01/01/2004 8 0 006 0 005 0 058 0 048 0 107 _ 0 0 9 Z11 01/01/2004 9 0 006 0 006 0 047 0 038 0 054 0 05612 01/01/2004 10 0010 0 006 0 037 0 053 0 036 0 08913 01/01/2004 11 0 020 0 012 0 034 0 036 0 032 0 05614 01/01/2004 12 _ 0 026 0018 0 021 0 028 0017 0 04215 0 i/01/2004 13 0 032 0 021 0 020 0 026 0 014 0 03616 O V 0 1/2004 14 0 035 0 023 0 020 0 024 0 014 0 03217 01/01/2004 15 0 038 0 024 0 020 0 025 0 013 0 036

i 18 01/01/2004 16 0 041 0 025 0 023 0 031 0 017 0 044j 19 01/01/2004 17 0 042 0 030: 0 027 0 033 0 020 0 040l 2 0 01/01/2004 18 0 032 0 021: 0 039 0 041: 0 034 0 061

Figura 3.5. Bases de datos de variables químicas.

Posteriormente se procedió a dar tratamiento a los datos:S e obtuvieron los valores máximos y promedios de cada una de las variables para cada día de estudio, para así poder ingresarlos en las herramientas computacionales, de forma que é s ta s trabajaran adecuadamente y arrojaran resultados aceptables según los objetivos planteados.

Se desarrollaron tres diferentes tipos de bases de datos. La primera, fue realizada con valores promedio de cada una de las variables (base de datos promedio); la segunda fue elaborada con valores máximos de todas ellas (base de datos máxima) y finalmente la tercera una con valores promedio de las variables meteorológicas a excepción de la temperatura y la radiación solar, las cuales fueron máximas al igual que las variables químicas (base de datos combinada). Cada una de las b ases de datos se analizó por medio de regresiones a fin de obtener la mejor correlación.

35

Page 47: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 3 - DESCRIPCIÓN DE LA METODOLOGÍA

Tabla 3.2. Correlaciones para cada año usando las diferentes bases de datos

ANOS Máximas Promedios Combinados1999 0.52108 0.4952 0.521792000 0.32021 0.32274 0.323232001 0 65254 0 66416 0.654702002 0.54957 0.53924 0.528072003 0.45793 0.46479 0.472272004 0 28284 0.28493 0.29717

Como se observa en la tabla 3.2 el año que mostró una mayor correlación utilizando las tres bases de datos fue el 2001 y para este año la mejor correlación obtenida fue para la b a se de datos promedio, pero se descarta ya que el objetivo principal de este trabajo es pronosticar concentraciones máximas de ozono, ya que si se utilizan valores promedios para el pronóstico se obtendrán valores promedios pronosticados, siendo este el motivo para descartar dicha base de datos.

La base de datos máxima, e s igualmente descartada, no sólo por se r la de menor correlación, además de que un valor máximo es puntual y difícil que una estación de monitoreo lo pueda reportar como tal; por lo que la mejor opción e s la base de datos combinada, ya que utiliza valores máximos de las variables que afectan directamente en la formación de ozono (capítulo 1), las cuales son proporcionadas fácilmente por las estaciones de monitoreo.

3 .3 D e s a r r o l l o d e l o s m o d e l o s p r o n ó s t i c o

En el modelo de regresión multivariable (RM), se realizarán diferentes regresiones para cada año (1999 — 2004), con el fin de obtener una ecuación, con la mejor correlación de los seis años, de donde se tomarán los coeficientes de regresión, para emplearlos en una b a se de datos global.

36

Page 48: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 3 - DESCRIPCIÓN DE LA METODOLOGÍA

En el modelo de redes neuronales artificiales (RNA), considerando las variables empleadas en el modelo de RM, se realizará un arreglo a la ba se de datos empleada, para poder introducirla en el programa a utilizar (MATLAB), considerando la bibliografía s e trabajará con 6, 10, 12 y 15 neuronas en la capa oculta, seleccionando la mejor opción.

Estos dos modelos fueron realizados considerando las variables Meteorológicas: Velocidad del Viento promedio, Temperatura máxima, Humedad Relativa promedio, Precipitación promedio, Presión Barométrica promedio, Radiación Solar máxima. Así como las siguiente variables químicas: Concentración máxima de NOx del día anterior (15 - 23 hrs.), Concentración máxima de N 02 del día anterior (15 — 23 hrs.) y Concentración máxima de Ozono del día anterior.

3 .4 C a l i b r a c i ó n d e l o s m o d e l o s

De acuerdo a la NOM-020-SSA1-1993 que establece que la concentración de ozono, como contaminante atmosférico no debe rebasar el límite máximo normado de 0.11 ppm, en una hora, una vez al año, en un periodo de tres años para protección a la salud de la población susceptible, se clasificaron los datos del ozono real y predecido dentro de tres rangos de concentración (bajo, medio y alto), a partir de los cuales se cuantificaron el número de datos que caían dentro de dichos rangos (porcentajes de acierto), para así estimar el grado de certeza que ofrecen los modelos.

3 .5 E v a l u a c i ó n d e l d e s e m p e ñ o d e l o s m o d e l o s .

Los modelos obtenidos fueron evaluados en función de su desempeño, considerando el porcentaje de acierto que presentó cada modelo respecto al valor observado. Para es to se aplicó cada modelo en modo pronóstico real a una base de datos correspondiente a los m eses de Enero - Junio del 2005. Este punto tiene como finalidad, evaluar el desem peño en tiempo real del modelo, comparando los resultados pronosticados, con los datos reales observados.

37

Page 49: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 4 - SELECCIÓN DE LAS VARIABLES PREDICTOR

C A P I T U L O S E L E C C I Ó N D E L A S V A R I A B L E S P R E D I C T O R

En este capítulo se presentarán las variables meteorológicas y químicas que s e ingresarán a los modelos de Regresión Multivariable y Redes Neuronales Artificiales, fundamentada su selección en base a la correlación que muestren con la concentración de ozono, para con esto poder definir un modelo que permita estimar en forma pronóstico la concentración de 0 3 del día de interés.

Se emplearon diferentes regresiones apoyadas en el software SPSS v. 10, las reg resiones aplicadas fueron las siguientes: lineal, logarítmica, inversa, cuadrática, cúbica, poder, compuesta, curva S, creciente y exponencial (mencionadas en el capitulo 2).

Las variables meteorológicas consideradas para la realización de los modelos fueron las siguientes: Velocidad del Viento promedio, Temperatura máxima, Humedad Relativa promedio, Precipitación promedio, Presión promedio y Radiación Solar máxima; y las variables químicas seleccionadas son: N02 máximo del día anterior (15 - 23 hrs.), NOx máximo del día anterior ( 1 5 - 2 3 hrs.) y Ozono máximo del día anterior.

Para cada variable se realizaron las regresiones con todos los modelos matemáticos, esto con la finalidad de sabe r qué modelo tiene una mejor correlación. El ejemplo que se cita aquí e s el año 2001, debido a que éste presentó una mayor correlación de R2 de 0.65470 (una vez hecho el modelo final). Aunque probablemente algunas variables no presentan una alta correlación, son tomadas en cuenta, ya que al momento de integrarlas aum en tan considerablemente la relación con el Ozono.

Todas las variables meteorológicas están relacionadas unas con otras, por lo que resulta muy difícil hablar de ellas aisladamente, por lo que aquí se citan algunos ejemplos de e s ta s relaciones.

38

Page 50: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

CAPITULO 4 - SELECCIÓN DE LAS VARIABLES PREDICTOR

Por ejemplo, la radiación solar e s ta íntimamente relacionada con la temperatura, ya que las partículas que se encuentran en la atmósfera absorben radiación solar, é s ta s pasan a un estado de excitación, aumentando el choque entre las moléculas (aumentando su energía cinética), lo que conlleva a un aumento en la temperatura de las mismas (ya que la temperatura e s la medida de la energía cinética de las moléculas).

Así también la precipitación e s tá ligada con la humedad relativa y la temperatura, ya que como se explicará adelante, el aire soporta una cantidad determinada de vapor de agua a una cierta temperatura (saturación), si se sobrepasa este punto de saturación, el vapor de agua tenderá a condensarse en forma de lluvia.

4.1 A N Á L IS IS DE V A R IA B L E S M E T E O R O L Ó G IC A S

VELOCIDAD DEL VIENTO

En la atmósfera libre, las corrientes de aire pueden tener un movimiento vertical de a scen so o descenso , llamado convección, o bien un sentido horizontal, llamado advección, el cual se puede reportar o medir como velocidad del viento (Ayllón, 1996)

Los movimientos del aire “viento” atmosférico serán los encargados de difundir por toda la atmósfera las altas concentraciones de contaminantes (en es te caso el 0 3 y su s precursores), pero esto puede o no realizarse con rapidez, ya que si la velocidad del viento esta en calma (o presenta bajas velocidades), la difusión será casi nula, pero si hay altas velocidades, los contaminantes tenderán a esparcirse rápidamente. La mayor parte de los contaminantes no supera el nivel de los 600 metros y ninguno llega m ás allá de los 3,500 metros.

Los cambios climáticos y los vientos pueden hacer que las m asas de aire se desplacen, y esto, junto con la topografía del terreno ocasionan que las m asas de aire queden atrapadas, de e s ta forma los contaminantes no pueden dispersarse, y se siguen incorporando más contaminantes y su concentración puede llegar a se r muy alta.

Para la Velocidad del Viento, el mejor ajuste fue de tipo cúbico, con un coeficiente de correlación de R2 de 0 066.

39

Page 51: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 4 - S E L E C C I Ó N D E L A S V A R I A B L E S P R E D I C T O R

TEMPERATURA

Esta variable ha demostrado tener una fuerte correlación con la concentración de ozono. Los razonam ientos básicos a es te efecto son: las velocidades de reacción fotoquímica son sensib les a la temperatura, ya que las reacciones para la formación de ozono son endotérm icas, por lo que al aum entar la temperatura en la troposfera se da paso a una serie de reacciones encadenadas que contribuyen a la formación de ozono; y altas tem peratu ras en el aire asoc iadas a condiciones con sistem as de baja movilidad (días de poca nubosidad, so leados y circulación estancada). (García, 2003).

Para esta variable, la relación con el Ozono más alta fue de tipo cúbico, encontrando un coeficiente de correlación de R2 de 0.138.

HUMEDAD RELATIVA

El vapor de agua e s uno de los componentes más elem entales de la atmósfera; su cantidad e s muy variable y es muy importante; ya que es uno de los elem entos que abso rbe gran parte de la radiación solar, evitando así que ésta interaccione con los contam inantes primarios y forme los contam inantes secundarios como el Ozono. (Ayllón, 1996).

Se entiende por humedad la cantidad de vapor presente en el aire. Es preciso distinguir los conceptos de mayor uso para referirse cuantitativamente a dicha humedad.

Humedad relativa e s la relación, expresada en porcentaje, entre la cantidad de vapor de agua realmente existente en la atmósfera y la que existirá si el aire estuviera sa tu rado a la misma temperatura.

Como la capacidad de concentración de vapor de agua del aire aumenta si la tem peratura se eleva, resulta que la humedad relativa varía de acuerdo con la temperatura por lo que e s ta s dos variables están íntimamente relacionadas.

40

Page 52: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 4 - S E L E C C I Ó N D E L A S V A R I A B L E S P R E D I C T O R

Para cada temperatura hay un límite de cantidad de vapor de agua que el aire puede contener en estado gaseoso ; pasado e se límite se dice que el aire e stá sobresaturado . Si aum enta la cantidad de vapor de agua, el excedente se condensa en forma de pequeñas gotas de agua (nubes, niebla, rocío, etc.) (Ayllón, 1996)

La correlación que presentó un mejor ajuste de datos fue cúbica con un coeficiente de correlación de R2 de 0.038.

PRECIPITACIÓN

La deposición húmeda se produce cuando las gotas de lluvia arrastran consigo hacia la superficie a las partículas contam inantes. Este proceso e s una de las formas principales de eliminación de contam inantes de la atmósfera, pero significa que esto s contam inantes pasarán a contaminar la superficie terrestre, donde ciertos casos pueden ser incluso más activos, por su acción sobre las aguas superficiales, las plantas y los materiales (lluvia ácida). (Climent, 1992).

Para este caso la correlación máxima fue cúbica con un coeficiente de correlación de R2 de 0.042

PRESIÓN

Se define la presión atmosférica como el peso de la columna de aire existente sobre el lugar de observación El valor al nivel de la superficie oscila, según las condiciones meteorológicas, alrededor de los 760 mmHg.

Esta variable esta relacionada con la temperatura por lo siguiente: el movimiento vertical del aire está determ inado por la variación vertical de tem peraturas en la troposfera, según la cual la temperatura disminuye con la altitud a razón de 0.64°C cada 100 m de ascenso . Así, la superficie terrestre calienta la porción de aire próximo a ella, este aire caliente se expande haciéndose menos denso que el que está por encima de él a menor temperatura. El aire caliente asciende y el aire frío ocupa su lugar, é s te se calienta, a su vez, al tom ar contacto con la superficie, con lo que también ascenderá. De esta manera se crean corrientes de aire (mezclado vertical) que contribuyen a la dispersión de los contam inantes. (Climent, 1992).

41

Page 53: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 4 - S E L E C C I Ó N D E L A S V A R I A B L E S P R E D I C T O R

La correlación obtenida fue cúbica con un coeficiente de correlación de R2 de 0.254.

RADIACION SOLAR

La tierra recibe del sol una energía de 345 W/m2 (unidades de la radiación solar), pero no toda la energía que llega del sol e s absorbida, pues un 30% es reflejado, de la porción de energía no reflejada, una parte equivalente al 25% es absorbida por la atmósfera y no llega a la superficie. S e trata de la absorción de la radiación ultravioleta que efectúa el ozono en la estratosfera (expresada en la ecuación C, citada en el Capítulo 1), a una altura de unos 20 km. Con todo ello, solo alcanzan la superficie unos 170W/m2. Con e s ta energía que recibe, el suelo se calienta, pero también cede energía, de modo que se estab lece un equilibrio entre la energía ganada y la energía perdida por el suelo.

De los 170 W/m2 que el suelo recibe, comunica 65 W/m2 por conducción al aire en contacto con él, 40 W/m2 los utiliza en evaporar aguas superficiales, y los 65 W/m2 restan tes los pierde por radiación como se puede observar en la figura 4.6. (Climent, 1992).

42

Page 54: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 4 - S E L E C C I Ó N D E L A S V A R I A B L E S P R E D I C T O R

CONSTANTE SOLAR = lOO %

Figura 4.1. Balance energético de las radiaciones procedentes del sol que llegan a la tierra {Climent, 1992)

La cantidad de radiación que llega a la tierra varia con la latitud, por que depende d e la altura del sol en el horizonte y de la diferente inclinación con que inciden los rayos so la res en la superficie terrestre. A medida que la incidencia e s m ás vertical (ecuador), e s mayor la cantidad de radiación recibida por m2, pero cuando la incidencia e s oblicua (polos), los rayos se distribuyen en una mayor superficie, y corresponde menor cantidad de calor por m2 (Ayllón, 1996).

Dada la gran cantidad de contam inantes y su complejidad química, el número de reacciones que se producen entre ellos mismos y los componentes naturales de la atm ósfera es enorme. En esta s reacciones es adem ás muy frecuente que intervenga la radiación solar, con complejas reacciones fotoquímicas. (Climent, 1992).

43

Page 55: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 4 - S E L E C C I Ó N D E L A S V A R I A B L E S P R E D I C T O R

En la atmósfera la disociación fotoquímica se puede considerar como un proceso de dos e tapas . La disociación de un fotón de energía por una especie química conduciendo a é s te a un estado excitado y la disociación del producto excitado en nuevos productos que pueden se r altamente reactivos, generando con esto el neblumo fotoquímico (Wark y Warner, 2000).

La correlación obtenida fue cúbica con un coeficiente de correlación de R2 de 0 047

4.2 ANÁLISIS DE VARIABLES QUÍMICAS

OZONO DEL DIA ANTERIOR

Se ha considerado como variable para el desarrollo del modelo, la concentración de ozono del día anterior, dado que no toda la concentración de Ozono del día anterior de interés se mantendrá, por lo que se considera que sólo una parte de dicha concentración quedara al finalizar el día, y se optó por multiplicar es ta concentración por un factor llamado “Factor de Rem anencia” (explicado en el capítulo 5), así e s te producto indicará, a partir de que Concentración de Ozono se inicia para el día de interés.

Se aplicó una regresión lineal entre la concentración de ozono del día anterior y la del día observado, obteniendo una correlación máxima R2 de 0.598.

ÓXIDOS DE NITRÓGENO

Estas variables son de las principales precursoras en la formación del ozono Los óxidos que están p resen tes en la atmósfera en cantidades significativas son el monóxido de nitrógeno y el bióxido de nitrógeno (NOx = NO + N 02) donde aproximadamente el 90% de é s to s son destruidos por fotolisis en la formación del ozono (Wark y Warner, 2000).

Estas variables presentan un mayor rompimiento fotolítico de las 11 a las 15 horas; e s decir cuando existe una mayor incidencia lumínica, pasado este horario las concen traciones empiezan a incrementarse paulatinamente, de e ste modo las concentraciones que no fueron afec tadas durante el periodo fotolítico, participarán como materia prima para la formación del ozono del día siguiente. Por ello se consideran las concentraciones máxim as correspondientes al horario de 15 — 23 horas del día anterior al pronóstico

44

Page 56: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 4 - S E L E C C I Ó N D E L A S V A R I A B L E S P R E D I C T O R

Se realizaron regresiones de los óxidos de nitrógeno con el ozono observado, encontrando que la mejor correlación entre e s ta s variables se logra con ecuaciones cúbicas tanto para N 02 como para NOx, obteniendo un valor de R2 de .01892 y de 08307, respectivamente.

45

Page 57: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 5 - M O D E L O S P R O N Ó S T I C O O B T E N I D O S

C A P I T U L O

M O D E L O S P R O N Ó S T I C O O B T E N I D O S

5.1 M o d e lo d e R e g re s ió n M u lt iv a r ia b le

5 .1 .1 O b te n c ió n d e l m o d e lo de re g re s ió n

Después de realizar la selección de variables y ya establecida la b ase de da to s a utilizar (base de datos combinada) se procedió a realizar una regresión lineal múltiple (RLM), para cada año, con las 8 variables, para obtener la mínima correlación con una ecuación lineal, utilizando el Software SPSS V. 10.

Uno de los dos propósitos por los que se hizo la RLM fue para observar cómo influye el adicionar una a una las variables sobre el coeficiente de correlación. Estos resultados son mostrados en la tabla 5 1. Dicha tabla s e interpreta como sigue, ejemplificando con el año 1999: en la letra A solam ente fue introducida la velocidad del viento promedio y proporciona un valor de R2 de 0.046. En la letra B, se introdujo la velocidad del viento promedio y la temperatura máxima obteniendo un valor de R2 de 0 287, así hasta introducir las 8 variables y se observa que al introducir una a una las variables, el coeficiente de correlación aum enta

Tabla 5.1. Incremento de R2 al anexar las variables en un modelo de RLM

1999 2000 2001 2002 2003 2004Mod R2 R2 R2 R2 R2 R2A 046 001 056 060 012 005B 287 073 162 381 136 .104C 287 076 .171 386 257 .165D 302 077 344 387 267 174E 303 080 .345 392 .274 .178F .326 083 364 .403 293 179G 329 084 366 403 299 227H 332 087 367 .403 301 228

46

Page 58: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 5 - M O D E L O S P R O N Ó S T I C O O B T E N I D O S

A) Constante, VELOCIDAD DEL VIENTOB) Constante, VELOCIDAD DEL VIENTO, T E M PERATURAC) Constante, VELOCIDAD DEL VIENTO, TEMPERATURA, H U M E D A DD) Constante, VELOCIDAD DEL VIENTO, TEMPERATURA, HUMEDAD, PRESIONE) Constante, VELOCIDAD DEL VIENTO, TEMPERATURA, HUMEDAD, PRESION,

PRECIPITACIONF) Constante, VELOCIDAD DEL VIENTO, TEMPERATURA, HUMEDAD, PRESION,

PRECIPITACION, RADIACION SOLARG) Constante, VELOCIDAD DEL VIENTO, TEMPERATURA, HUMEDAD, PRESION,

PRECIPITACION, RADIACION SOLAR, N 0 2 DEL DIA ANTERIOR.H) Constante VELOCIDAD DEL VIENTO, TEMPERATURA, HUMEDAD, PRESION,

PRECIPITACION, RADIACION SOLAR, N O z DEL DIA ANTERIOR, N O x DEL DIA ANTERIOR.

El segundo propósito importante por lo que se hizo la RLM, fue el de obtener el grado de importancia de cada una de las variables con respecto a la variable dependiente, e s decir el ozono, por medio del análisis estadístico mostrado en el programa SPSS de t - Ratio (t), presentado en la tabla 5.2. Este análisis indica, que entre mayor se a el número (considerando el valor absoluto), m ás necesaria e s esta variable en el modelo de RLM.

Tabla 5.2. Valores de t-Ratio para cada año

Modelo1999

Modelo2000

Modelo2001

Modelo2002

Modelo2003

Modelo2004

Constante -2 344 - 242 -10.033 - 591 -1 295 - 795VELOCIDAD DEL VIENTO - 049 -365 1 859 -719 -2.617 -3 490TEMPERATURA 7 847 4 637 2 519 10 951 7.031 5.036HUMEDAD 1 340 1 583 -3 777 - 437 -5 512 -3.978PRESION 2 261 197 10 228 .499 1 358 806PRECIPITACION - 071 - 905 635 -1 721 -1.692 -1 092RADIACION SOLAR -2 959 -778 3 132 -2 973 -2.699 316NOz DEL DIA ANTERIOR 243 - 875 1 293 105 1.213 3 654NOx DEL DIA ANTERIOR -1 143 1 223 -950 -296 842 - 152

Como se mencionó anteriormente la primera ecuación obtenida fue lineal, pero se probaron las ecuaciones no lineales (citadas en el Capitulo 2) con las 8 variables independientes mencionadas anteriormente, con el fin, de obtener la mejor relación de ellas con respecto al Ozono.

47

Page 59: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 5 - M O D E L O S P R O N Ó S T I C O O B T E N I D O S

Posteriormente lo que se buscó fue que en cada una de las ecuaciones no lineales obtenidas para cada año, se guardara la misma relación de las variables con respecto al ozono, a fin de hacer un modelo consistente para los 6 años Se observó que para los 6 años, la mejor relación Ozono vs. Variables (Químicas y Meteorológicas) correspondía a una ecuación cúbica

5 .1 .2 M o d e lo P ro n ó s t ic o d e R e g re s ió n

Una vez efectuado lo descrito en el punto anterior. S e seleccionó el año 2001 en el que se presentó el mayor valor de la R2; con el fin de utilizar e sa ecuación y su s coeficientes de regresión en una ba se de datos donde se involucraran los 6 años para obtener mejores resultados, e s decir una R2 global y coeficientes igualmente globales quedando como ecuación final el siguiente modelo:

C0i = ( F * OZONO _ A N T E ) + B 0 + (V0 + V 1 * V + V 2 * V 2 + V 3 * V 3) +

+ (T0 + T1*T + T 2 * T 2 + T 3 * T 3) + ( H 0 + HA * H + H 2 * H 2 + H 3 * H 3) +

+ (P 0 + P\*P + P 2 * P 2 + P 3 * P 3) + (R0 + R\*R + R 2 * R 2 + R 3 *R 3) +

+ (S0 + S1*S + S 2 * S 2 + S 3 * S 3) + ( N 2 0 + N 2 l * N 0 2 + N 22 * N 0 2 2 + N 2 3 * N 0 2 3) +

+ (N X 0 + NX\ * N O X + N X 2 * N O X 2 + N X 3 * N O X 3)

Las variables involucradas dentro del modelo son: (V) Velocidad del viento promedio en km/h, (T) Temperatura máxima en °C, (H) Humedad Relativa promedio (%), (P) Presión Barométrica promedio en mbar, (R) Precipitación promedio en mm, (S) Radiación Solar máxima en W/m2, (N 02) concentración máxima de Dióxido de Nitrógeno del día anterior (15- 23 hrs ) en ppm, (NOx) Concentración máxima de Oxido de Nitrógeno del día anterior (15-23 hrs.) en ppm, (OZONO _ ANTE) concentración máxima de Ozono del día anterior en ppm.

Los coeficientes de regresión son: F, B0, V0, V1, V2, V3, TO, T1, T2, T3, H0, H1, H2, H3, P0, P1, P2, P3, RO, R1, R2, R3, SO, S1, S2, S3, N20, N21, N22, N23, NXO, NX1, NX2, NX3.

48

Page 60: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 5 - M O D E L O S P R O N Ó S T I C O O B T E N I D O S

Es importante mencionar el coeficiente de regresión F, que es llamado “factor rem anen te” de ozono del día anterior Éste e s tomado en cuenta, ya que de la producción de ozono que se registró en un día cualquiera, una parte no e s eliminada de la atmósfera, por lo que e s te factor servirá para que al día siguiente la concentración de ozono se aum ente a partir de e se valor

El valor obtenido para el factor e s de 0.479, lo que indica que el 47.9% del ozono producido en e se día se ve involucrado en la concentración de ozono del día siguiente; e s te valor se obtuvo una vez que se sab ía que las ecuaciones para las 8 variables eran de tipo cúbico. Al realizar la regresión se obtuvieron valores para cada uno de los coeficientes que participan dentro del modelo de regresión multivariable, los cuales se muestran en el anexo A.

5 .1 .3 P re - e v a lu a c ió n d e l m o d e lo .

Para la pre — evaluación del modelo de Regresión Multivariable (RM) se tomó en cuenta la Norma Oficial Mexicana NOM-020-SSA1-1993, que presenta tres rangos de concentraciones en partes por millón (ppm).

Rango Bajo Ca¡ < 0.060

Rango Medio 0.060 < C n <0.11Rango Alto >0.11

Las concentraciones que se obtuvieron de los años 1999 — 2004 fueron clasificados en esto s tres rangos, ya que debido a la cantidad de datos presentados, resulta muy difícil igualar las concentraciones reales

El modelo realizado, descrito en el punto 5.1.2, se introdujo a las b a se s de datos de los años 1999 - 2004 (año por año) para calcular los valores de Ozono Pronosticado. Estos valores se compararon con los datos obtenidos de Ozono Observado para sabe r cómo fue el desem peño del modelo en los tres rangos de concentraciones (ver tabla 5.5).

49

Page 61: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 5 - M O D E L O S P R O N Ó S T I C O O B T E N I D O S

Tabla 5.3. Certeza en los 3 rangos de concentraciones para los años 1999 - 2004

AÑODIAS Y % DE ACIERTOS

RANGO DE CONCENTRACIONBAJO MEDIO ALTO

1999 DIAS REALES 234 32 0PRONOSTICO (%) 89 56 0

2000 DIAS REALES 280 79 7PRONOSTICO (%) 91 57 0

2001 DIAS REALES 278 80 7PRONÓSTICO (%) 91 60 0

2002 DIAS REALES 229 111 25PRONOSTICO (%) 91 58 8

2003 DIAS REALES 222 118 25PRONOSTICO (%) 82 66 4

2004 DIAS REALES 254 102 9PRONOSTICO (%) 84 45 0

La tabla 5.3 indica que, por ejemplo, en 1999 en el rango bajo hubo 234 días, de los cuales el modelo acertó en un 89%, e s decir, de los 234 días, quedaron dentro del rango 208 días.

Como se observa en la tabla anterior, el modelo muestra un excelente desem peño para pronosticar concentraciones bajas, un desem peño aceptab le para concentraciones medias, pero un nulo o e scaso desem peño para predecir concentraciones altas.

Debido a que el objetivo primordial de e s ta tesis, es pronosticar en el rango de concentraciones altas, se utilizó un factor llamado “FACTOR DE ESCALAMIENTO” (representado con la letra E), dicho factor se multiplica por la concentración de ozono calculada mediante el modelo de Regresión Multivariable expresado de la siguiente forma:

C ' — p* c'-'O, f Of 1

50

Page 62: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 5 - M O D E L O S P R O N Ó S T I C O O B T E N I D O S

Los subíndices i y f se refieren a la concentración de Ozono an tes y d e spu és respectivamente, de se r multiplicada por el factor de escalam iento. El objetivo primordial de e s te factor e s incrementar el valor del Ozono pronóstico obtenido por el modelo, para alcanzar concentraciones pronostico altas.

El factor de escalam iento (E) actúa de la siguiente m anera, si por ejemplo el modelo estim a una concentración de ozono de 0.050 ppm, al aplicar un factor de 1.25 la concentración se incrementará a 0.0625 ppm e s decir en un 25% sobre la estimación del modelo. (García, 2003). Para encontrar e ste factor se buscó un número tal, que igualara el número de d ías en los que se excedió la norma, sin sabe r hasta e se momento, si los d ías en que se sob repaso la norma realmente eran los d ías que el modelo predecía.

Por ejemplo para el año 2004 el número de d ías que se sobrepasó la norma fue d e 9, y al igualar dicho número, el factor que se encontró fue de 1.25. Este procedimiento s e realizó para todos los años en cuestión, ya que cada año tiene diferentes días en los cua les se sobrepasó la norma, y por consecuencia diferentes factores. En la tabla 5 6 se m uestra el valor de los factores d e escalam iento para cada año, así como el incremento en el % de aciertos que se presen ta con dicho Factor.

Con este incremento se perderá exactitud en el rango bajo pronosticado, pero aum en ta rá en el rango medio y alto, los cuales son de nuestro interés.

51

Page 63: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 5 - M O D E L O S P R O N Ó S T I C O O B T E N I D O S

Tabla 5.4. Factores de Escalamiento obtenido para cada año

AÑORANGO DE CONCENTRACIONBAJO MEDIO ALTO

1999DIAS REALES 234 32 0

PRONOSTICO (%) 89 56 0FACTOR E = 1 89 56 0

2000DIAS REALES 280 79 7

PRONÓSTICO (%) 91 57 0FACTOR E = 1.33 52 84 14

2001DIAS REALES 278 80 7

PRONOSTICO (%) 91 60 0FACTOR E = 1.31 72 88 14

2002DIAS REALES 229 111 25

PRONÓSTICO (%) 91 58 8FACTOR E = 1.19 71 66 36

2003DIAS REALES 222 118 25

PRONÓSTICO (%) 82 66 4FACTOR E = 1.246 46 77 32

2004DIAS REALES 254 102 9

PRONÓSTICO (%) 84 45 0FACTOR E = 1.25 55 81 0

Como se puede observar en la tabla 5.4, se obtuvo un factor por año, pero debido a que se realizó una ba se de datos de los 6 años (base de datos global), se optó por realizar un promedio de factores de los años 1999 - 2004, obten iéndose un valor de 1.265.

Para un mejor manejo de los datos se optó por agrupar las bases de datos de los años 1999 - 2004 en una sola (citado en el párrafo anterior), esto para obtener un modelo global del periodo, que de cierto modo pueda ajustarse en forma más precisa al operarlo en modo pronóstico, s e a el año que fuere (García, 2003).

Por tal motivo se pre — evaluó el modelo sobre la b ase de datos de todos los años, obteniendo los resultados mostrados en la tabla 5.5, !a cual muestra una comparación entre el uso de factor y sin él.

52

Page 64: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 5 - M O D E L O S P R O N Ó S T I C O O B T E N I D O S

Tabla 5.5. Tabla comparativa sin y con el factor de incremento único para la base de datos 1999 — 2004

AÑO RANGO DE CONCENTRACIONBAJO MEDIO ALTO

1999 - 2004DIAS REALES 1478 522 72

PRONOSTICO (%) 88 58 4FACTOR E = 1.265 61 80 28

5 .1 .4 E v a lu a c ió n d e l d e s e m p e ñ o en m o d o p ro n ó s t ic o

Una vez que se realizó lo descrito en los puntos anteriores, se procedió a utilizar el modelo en modo pronóstico real. La evaluación del modelo de regresión multivariable fue realizada con una base de datos que involucró los m eses de Enero a Junio de 2005 contando con 173 días, utilizando las 9 variables (6 variables meteorológicas, 2 químicas y el ozono máximo del día anterior), así como el valor de los coeficientes de regresión obtenidos mostrados en el anexo A y el Factor de Escalamiento.

La evaluación se realizó de dos formas: la primera sin utilizar el Factor de Escalam iento y la otra con dicho factor, la comparación s e muestra en la tabla 5.6

Tabla 5.6. Tabla comparativa con y sin Factor de Escalamiento

AÑO RANGO DE CONCENTRACIONBAJO MEDIO ALTO

2005DIAS REALES 79 77 17

PRONOSTICO (%) 59 61 0FACTOR E = 1.265 22 78 65

Como se puede observar de acuerdo a la tabla anterior, el desem peño del modelo s e vio beneficiado utilizando el Factor de Escalamiento, por lo que se comprueba la utilidad de su uso. Para una mejor ilustración se presentan las gráficas 5.1 y 5.2.

53

Page 65: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 5 - M O D E L O S P R O N Ó S T I C O O B T E N I D O S

O z o n o R e a l V S O z o n o P r o n o s t i c o (sin F a c t o r )

O z o n o R e a l O z o n o P re d e c id o

1 5 9 13 17 21 2 5 2 9 3 3 3 7 41 4 5 4 9 5 3 5 7 6 1 73 77 81 85 89 93 97 101 105 109 113 117 121 125 129 133 137 141 145 149 153 157 161 165 169 173

Días

Gráfica 5.1. Ozono Real vs. Ozono Pronóstico (sin factor).

O z o n o R e a l V S O z o n o P r o n o s t i c o ( c o n F a c t o r )

i Ozono Real Ozono Predecido

Dias

Gráfica 5.2. Ozono Real vs. Ozono Pronóstico (con factor)

5 4

Page 66: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 5 - M O D E L O S P R O N Ó S T I C O O B T E N I D O S

La gráfica 5 1 se realizó sin utilizar el factor, con lo que se observa que en las concentraciones bajas y medias, el modelo tiene un buen desempeño, pero los picos altos de concentraciones, el modelo no tiene la capacidad de predecirlos. Así utilizando el factor de escalam iento mostrado en la gráfica 5.2, se observa que el modelo e s capaz de predecir altas y medias concentraciones de manera aceptable (las de mayor importancia, por sus efectos contra la salud, citados en el Capítulo 2).

5 .2 M o d e lo s d e R e d e s N e u ro n a le s A r t if ic ia le s (R N A )

5 .2 .1 O b te n c ió n d e l m o d e lo d e R N A

Para la obtención del modelo de RNA, se utilizó el programa computacional MATLAB versión 12. Este programa cuenta con una gran cantidad de herram ientas, dentro de las cuales se encuentra la de R edes Neuronales (Neural Network Toolbox).

La base de datos que se utilizó, fue la misma que para el modelo de Regresión Multivariable, contando con 9 variables (6 meteorológicas. Velocidad del viento promedio, Temperatura máxima, Humedad Relativa promedio, Presión Barométrica promedio, Precipitación promedio, Radiación Solar máxima y 3 químicas: Concentración máxima de Dióxido de Nitrógeno del día anterior de 1 5 - 2 3 hrs, Concentración máxima de Óxidos de nitrógeno del día anterior de 1 5 -2 3 hrs, y Concentración máxima de Ozono del día anterior).

El algoritmo que se utilizó para hacer dicho modelo, fue el de Retropropagación (Backpropagation). El algoritmo de propagación del error hacia atrás, o retropropagación; e s una regla de aprendizaje que se puede aplicar en modelos de redes con m ás de dos capas. Una característica importante de este algoritmo e s la representación interna del conocim iento que es capaz de organizar en la capa intermedia de las neuronas para conseguir cualquier relación entre la entrada y la salida de la red.

55

Page 67: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 5 - M O D E L O S P R O N Ó S T I C O O B T E N I D O S

La aplicación de este algoritmo tiene dos fases, una hacia adelante y otra hacia atrás. Durante la primera fase los datos de entrada son presentados a la red y propagados a través de las capas hasta llegar a la capa de salida. Obtenidos los valores de salida de la red, se inicia la segunda fase, comparándose estos valores con la salida esperada (Target) para obtener el valor del error (se ajustan los pesos de la última capa proporcionalmente al error). Se pasa a la capa anterior con una retropropagación del error, ajustando convenientemente los pesos y continuando con este proceso hasta llegar a la primera capa. De esta m anera se han modificado los pesos de las conexiones de la red para cada dato o patrón de aprendizaje del problema, del que conocíamos su valor de entrada y la salida que debería generar la red ante dicho patrón.

La regla delta genera lizada

La regla propuesta por Widrow en 1960 (regla delta) ha sido generalizada a redes con capas intermedias (regla delta generalizada) con conexiones hacia adelante (feedforward) y cuyas neuronas tienen funciones de activación continuas (lineales o sigmoidales), dando lugar al algoritmo de retropropagación. Este algoritmo requiere el uso de neuronas cuya función se a continua, y por tanto, diferenciable. Generalmente la función utilizada será del tipo sigmoidal presentada en el punto 5.2.2

Este algoritmo utiliza también una función o superficie de error asociada a la red, buscando el estado estable de mínima energía o de mínimo error a través del camino descenden te de la superficie del error Por ello, realimenta el error del sistema para realizar la modificación de los pesos en un valor proporcional al gradiente decreciente de dicha función de error.

Funcionam ien to del a lgoritm o

El método que sigue la regla delta para ajustar los pesos e s el mismo que el utilizado en el Perceptrón (red neuronal en la cual solo existen la capa de entrada y la de salida y el flujo e s en una sola dirección), e s decir, los pesos se actualizarán de forma proporcional a la delta, o diferencia entre la salida deseada y la obtenida (5= sal. D eseada - sal. Obtenida).

56

Page 68: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 5 - M O D E L O S P R O N Ó S T I C O O B T E N I D O S

Dada una neurona y la salida que produce, yi, el cambio que se produce en el peso de la conexión que une la entrada de dicha neurona con la unidad para un patrón de aprendizaje determ inado e s ’

AW (t+1) = a*5*y, (O)

En donde a es la constante o ta sa de aprendizaje

El punto en el que difieren la regla delta generalizada de la regla delta e s el valor concreto de 5. Por lo tanto, en las redes multinivel, a diferencia de las redes sin neuronas ocultas, no se puede conocer la salida d eseada de las neuronas de las capas ocultas para poder determ inar los pesos en función del error cometido.

Ahora que sabem os el fundamento del algoritmo de retropropagación, procederemos a explicar la forma en que fueron introducidas las variables, así como la forma de crear una RNA en Matlab.

La base de datos a introducir para el entrenam iento de la red (explicado con m ás detalle en el siguiente punto) fue la base de datos global, e s decir, de los años 1999 - 2004 (igual como se hizo en el modelo de regresión multivariable para encontrar los coeficientes de regresión).

Las variables se introdujeron en forma de matriz con un arreglo de datos de 9X2065, e s decir, las 9 variables m encionadas anteriormente X 2065 días de los 6 años. Así como ya se explicó, se necesita un valor de salida (Target o valor objetivo), por lo que se introdujo una segunda matriz con los valores de la concentración máxima de Ozono real en un arreglo de 1X2065.

La forma en que se creó la RNA se explica a continuación: Se introdujo el comando nn too l en la ventana de trabajo “Com m and W indow”, el cual presenta la siguiente pantalla: (Figura5.1).

57

Page 69: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 5 - M O D E L O S P R O N Ó S T I C O O B T E N I D O S

N e tw o rk /D a ta M anage r O ~ ®

Inputs. Networks: ÜUtpUt:

Targets. Eriors

Iriput Del ay S ta tes Layer

Networks and DataHelp New Data . | New Netv.'Oii. (

Irnport. E^port

Networks onlv

Figura 5.1. Ventana de trabajo para la creación de redes.

DondeInputs: matriz de entrada, ia cual fue de 9X2065.Target: matriz de valores rea les de ozono, la cual fue de 1X2065.N etworks: nombres de las RNA que han sido creadasO u tpu ts: valores de las sa lidas calculadas por la RNA, la cual fue de 1X2065 Error: valores de los errores para cada salida (valor real - valor calculado).

58

Page 70: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 5 - M O D E L O S P R O N Ó S T I C O O B T E N I D O S

Para la creación de una red de retropropagación, s e uthizará el botón de New Network, la cual muestra la figura 5.2.

J-: C reate N e w N e tw o rk

N etw ork Na m e : ne tw o rk l

r N etw orkType: Feed-fo rw ard b ack p rop

Input r a n g e s : [0 1; -1 1]Tra i ri i ri g fu n cti o n : TRAIMLMAdaption le a rn in g function ■ LEARNGD:.1 P e rfo rm an c e function : MSEN u m b e r of I aye r s : 2

¡-Properties for: Layer 1 ----------

Q

N u m b e r o f n e u ro n s : 1

T ra ns fe r F u ri cti o ri: TAN SIG

V iew D e fau lts C reate

Figura 5.2. Ventana de parámetros de red.

DondeNetwork ñam e: nombre que s e le dará a la redNetwork type: de ias diferentes opciones se e scogerá el tipo feed - forward backprop.T raining function : función de entrenam iento utilizando Levenberg-Marquardt (TRAINLM), ya

que esta función llega m as rápido a la convergencia y minimizar el error (comparada con otras funciones), pero con requerim ientos altos de memoria al correrla.

A dap ta tion learn ing func tion : función de aprendizaje de retropropagación para p e so s yvectores de sesgo , aplicando la función de grad ien te descenden te con momentum (LEARNGDM ).

5 9

Page 71: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 5 - M O D E L O S P R O N Ó S T I C O O B T E N I D O S

Perfo rm ance function : función de desem peño , aplicando tres tipos: Media del cuadrado delerror (M SE ), media del cuadrado del error con regularización (M SEREG ) y sum a del cuadrado del error (SSE).

N um ber of laye rs número de capas en la red; en e s te caso se eligieron 2 (capa oculta ycapa de salida).

P rop e rtie s fo r propiedades de la capa que se encuentre desplegadaNum ber of n eu ron s : número de neuronas de la capa que se encuentra desp legadaT ran sfe r function . función de transferencia deseada . Para la capa oculta (capa 1) se eligió

la función logsígmoidal (logsig) y para la capa de salida (capa 2) una función lineal (purelin).

El algoritmo de la función de entrenam iento, aprendizaje, desem peño y transferencia serán abordados a detalle en la sección 5.2 2 de e s te capítulo.

El modelo de red diseñado para e s te trabajo contará, en resumen con las siguientes características:

• Red de retropropagación de tipo Feed-forward con 2 capas, la primera con variación en el número de nodos de 6, 10, 12 y 15 y la segunda (salida) con 1 nodo.

• Función de entrenam iento TRAINLM• Función de aprendizaje LEARNGDM• Las funciones de desem peño fueron: MSE, MSEREG y SSE.• La función de transferencia para la primera capa (oculta) e s LOGSIG y para la

segunda capa (salida) PURELIN.

De forma esquem ática se puede ver en la figura 5.3 la estructura de la red de retropropagación, considerando dos capas, conteniendo la primera 6 nodos y la segunda 1 nodo de salida, para una matriz de en trada de 9 valores por columna.

60

Page 72: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 5 - M O D E L O S P R O N Ó S T I C O O B T E N I D O S

Entrada Capa Oculta

IW{1,1>

6x9

b{1}

: © & •

6x1

a,= logsig (IW11pi + *>1)

Capa de Salida

LO - V

6x1LW{2,1}

GSi

1~ H

1x6

G b{2}

1x1

a2= purelin (LWz,1a1 + b*)

UR

N

Figura 5.3. Esquema de una red de retropropagación del tipo Feed - Forward, con una estructura 9 X 6 X 1(entrada X oculta X salida) (García, 2003).

Debido a la bibliografía encontrada (capitulo 2), se realizaron 4 arreglos de R edes, la diferencia que existe entre ellas, e s la variación del número de neuronas en la capa oculta. Las redes neuronales con las que se pretendía trabajar fueron 6, 10, 12 y 15 neuronas, ya que el número de neuronas ocultas interviene en la eficiencia de aprendizaje y la generalización de la red

No hay ninguna regla que indique el número óptimo, en cada problema se debe en sayar con distintos números de neuronas para organizar la presentación interna y escoger el mejor. La idea más utilizada sobre todo en los sistem as simulados, consiste en tener el m enor número posible de neuronas en la capa oculta, porque cada una de ellas supone una mayor carga de procesam iento en el caso de una simulación software (Hilera, 1995).

5 .2 .2 E N T R E N A M IE N T O DE LA R E D N E U R O N A L

Una vez hecha la selección estructural de la red con sus diferentes funciones, se procedió a entrenarla. El entrenam iento tiene como finalidad, estimar las matrices de pesos y vectores de sesgo para cada capa, para con esto obtener un valor de concentración de ozono, buscando la menor diferencia entre lo observado y el estimado. Ya teniendo las matrices de pesos, se podrá aplicar esta red para simular, e s decir en modo pronóstico, abordando esta simulación en la siguiente sección. (García, 2003)

61

Page 73: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 5 - M O D E L O S P R O N Ó S T I C O O B T E N I D O S

Antes de hacer el entrenam iento de la red, se deben conocer las funciones de entrenam iento (TRAINLM), aprendizaje (LEANDGDM), desempeño (MSE, MSEREG Y SSE) y transferencia (LOGSIG Y PURELIN).

La función de entrenam iento aplicada fue de Levenberg-Maquardt (TRAINLM) para optimizar y ajustar los pesos y vectores de sesgo .

S e aplicó una función de aprendizaje de gradiente descenden te con momentum para los pesos y se sgo s “LEARNGDM” El método de retropropagación del error hacia atrás, también conocido como del gradiente descendiente, requiere un importante número de cálculos para lograr el ajuste de los pesos de la red. En la implementación del algoritmo, se toma una amplitud de paso que viene dada por la tasa de aprendizaje a. A mayor ta sa de aprendizaje, mayor es la modificación de los pesos en cada iteración, con lo que el aprendizaje se rá más rápido, pero, por lo tanto, puede dar lugar a oscilaciones. Rumelhart, Hinton y Williams (1986) sugirieron que para filtrar e s ta s oscilaciones se añada en la expresión del incremento de los pesos un término (momentum), (3, de manera que dicha expresión quede:

W(t+1) = a*5*y,+ p*AW (t) (P)

Donde p e s una constante (momentum) que determina el efecto en t+1 del cambio de los pesos en ei instante t; e s decir en sum ar una fracción del cambio anterior cuando se calcula el valor del cambio del peso actual. Este término adicional tiende a mantener los cambios de peso en la misma dirección.

Con este momentum se consigue la convergencia de la red en menor número de iteraciones, ya que si en t el incremento de un peso era positivo y en t+1 también, entonces el descen so por la superficie de error en t+1 e s mayor. Sin embargo, si en t el incremento era positivo y en t+1 e s negativo, el paso que se da en t+1 e s mas pequeño, lo cual es adecuado, ya que eso significa que se ha pasado por un mínimo y que los pasos deben se r m enores para poder alcanzarlo.

62

Page 74: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 5 - M O D E L O S P R O N Ó S T I C O O B T E N I D O S

Se aplicaron 3 diferentes funciones de desem peño ' media del cuadrado del error (MSE), media del cuadrado del error con regularización (MSEREG ) y suma del cuadrado del error (SSE); para las 4 estructuras de redes (9x6x1, 9X10X1, 9x12x1 y 9X15X1), con la finalidad de observar si existe cambio significativo en el desem peño de la red al aplicar alguna de estas.

La función M SE mide el desem peño de la red de acuerdo a la media del cuadrado de su s errores, considerando los valores de entrada y los valores objetivo (ozono observado) {Pi»ti}J{P2»t2>.—{Pn, tN}, así como el error e (e= t-a, donde a e s el valor estimado de ozono), tal que:

La función MSEREG mide el desem peño de acuerdo a la media del cuadrado del error con regularización. Esta mide el desem peño como la sum a de pesos de dos factores: la media del cuadrado del error (MSE) y la media del cuadrado de los pesos y vectores de se sg o (M SW ).

( Q )

M SEREG = /M SE + ( l - y)M SW (R)

Donde y e s la razón de desem peño , y

(S)

Por último la suma del cuadrado del error (SSE) para medir el desempeño:

S S E = X ( t , - a ¡ ) 2 (T)

63

Page 75: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 5 - M O D E L O S P R O N Ó S T I C O O B T E N I D O S

Las funciones de transferencia aplicadas fueron las siguientes:

• En la primer capa se utilizó una función Log-sigmoidal (LOGSIG), siendo e s ta una función diferenciable, tomando cualquier valor entre m enos y m ás infinito, reduciéndolos a valores de salida en el rango entre 0 y 1 tal que la expresión matemática será:

En la figura 5.4 y con ecuación y = — -—1 + e~x

• En la segunda capa (salida), se empleó una función de transferencia lineal (figura 5.5), para obtener los valores correspondientes de ozono estimado, tom ando como entradas a la función los valores emitidos por las neuronas de la capa oculta. Esta función lo que hace es calcular los valores de salida de la(s) neurona(s) de la siguiente manera:

yi

X

Figura 5.4. Función de activación sigmoidal

Purelin(n)= purelin [(Wp)+b]= (Wp) + b

64

Page 76: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 5 - M O D E L O S P R O N Ó S T I C O O B T E N I D O S

Donde W es la matriz de pesos, p son los valores de entrada y b e s el vector de se sgo s

Figura 5.5. Función de transferencia lineal

a = purelin (n )

Una vez explicado lo anterior, se crearon las 4 redes con sus diferentes funciones de desem peño, haciendo un total de 12 redes neuronales en trenadas con la matriz de en trada de 9X2065 así como la matriz “Target” de 1X2065.

Una vez en trenadas las 12 redes, se eligieron las 2 con mejor R2 aplicando una regresión lineal entre el Ozono real y el Ozono estimado (tabla 5.7)

Tabla. 5.7. Correlaciones de las redes con cada función de desempeño

# DE N E U R O N A S EN CAPA OCULTA

FUNCIONES DE D E S E M P E Ñ OM S E M S E R E G SSE

6 0 5170 0 4597 0 519810 R¿ 0 53 0 4886 0 528512 0.5655 0.4651 0 540215 R2 0.5595 0.4726 0 5446

Así se observa que las R edes con mayor R2 fueron las de 12 y 15 neuronas en la capa oculta, am bas con una función de desem peño MSE.

65

Page 77: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 5 - M O D E L O S P R O N Ó S T I C O O B T E N I D O S

Posteriormente, se realizó el mismo procedimiento que en Regresión Multivariable, e s decir, se simularon las 2 redes con cada uno de los años para sab e r si las RNA eran c ap ac e s de predecir concentraciones altas de Ozono, en la siguiente tabla se muestran los resu ltados obtenidos

Tabla 5.8. Por ciento de aciertos para 12 y 15 neuronas sin incremento

AÑORANGO DE CONCENTRACIONBAJO MEDIO ALTO

1999DIAS REALES 232 32 0

PRONOSTICO (%) 12 NEURONAS 90 56 0PRONOSTICO (%) 15 NEURONAS 91 50 0

2000DIAS REALES 274 78 7

PRONOSTICO (%)12 NEURONAS 89 56 0PRONOSTICO (%) 15 NEURONAS 90 55 0

2001DIAS REALES 273 79 7

PRONÓSTICO (%)12 NEURONAS 91 82 0PRONOSTICO (%) 15 NEURONAS 90 78 29

2002DIAS REALES 224 110 25

PRONOSTICO (%)12 NEURONAS 87 65 20PRONÓSTICO (%) 15 NEURONAS 86 59 24

2003DIAS REALES 222 118 25

PRONOSTICO (%)12 NEURONAS 83 72 28PRONOSTICO (%) 15 NEURONAS 82 67 20

2004DIAS REALES 249 102 8

PRONOSTICO (%)12 NEURONAS 80 57 0PRONÓSTICO (%) 15 NEURONAS 83 59 0

Se observó que existe un pobre desem peño en el rango alto de concentraciones d e ozono (tabla 5.8), por lo que se optó por implementar el factor de escalam iento realizando el mismo procedimiento para su obtención hecho en Regresión Multivariable.

6 6

Page 78: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 5 - M O D E L O S P R O N Ó S T I C O O B T E N I D O S

Tabla 5.9. Por ciento de aciertos para 12 y 15 neuronas con incremento

AÑORANGO DE CONCENTRACIONBAJO MEDIO ALTO

1999DIAS REALES 232 32 0

PRONÓSTICO (%) 12 NEURONAS. E = 1 90 56 0PRONOSTICO (%) 15 NEURONAS. E = 1 91 50 0

2000DIAS REALES 274 78 7

PRONÓSTICO (%) 12 NEURONAS. E = 1.31 60 74 14PRONOSTICO (%) 15 NEURONAS. E = 1.28 66 76 29

2001DIAS REALES 273 79 7

PRONOSTICO (%) 12 NEURONAS. E = 1.16 85 82 29PRONÓSTICO (%) 15 NEURONAS. E = 1.18 83 85 43

2002DIAS REALES 224 110 25

PRONOSTICO (%) 12 NEURONAS. E = 1.16 74 70 48PRONOSTICO (%) 15 NEURONAS. E = 1.18 65 71 52

2003DIAS REALES 222 118 25

PRONOSTICO (%) 12 NEURONAS. E = 1.19 60 78 44PRONOSTICO (%) 15 NEURONAS. E = 1.15 61 75 32

2004DIAS REALES 249 102 8

PRONOSTICO (%) 12 NEURONAS. E = 1.26 53 78 0PRONOSTICO (%) 15 NEURONAS. E = 1.25 58 82 0

Como se observa en la tabla 5.9, el acierto de las RNA en el rango alto de concen traciones se ve favorecido con el Factor de Escalam iento con 12 y 15 neuronas en la capa oculta. También se obtuvo un factor promedio de los 6 años con un valor de 1 216 y 1.208 respectivamente.

Debido a que las redes fueron en trenadas con los da to s de los 6 años, los promedios de los Factores de Escalam iento, fueron introducidos a es ta b ase de datos, p resen tando los resultados en la tabla 5.10.

67

Page 79: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 5 - M O D E L O S P R O N Ó S T I C O O B T E N I D O S

Tabla 5.10. Tabla comparativa sin y con el factor de incremento único para la base de datos1999-2004

AÑO RANGO DE CONCENTRACIONBAJO MEDIO ALTO

DIAS REALES 1474 519 721999-2004 PRONÓSTICO (%) 12 NEURONAS. E = 1.216 69 76 38

PRONOSTICO (%) 15 NEURONAS. E = 1.208 70 77 40

5 .2 .3 S IM U L A C IÓ N D E LA R E D N E U R O N A L

Una vez que se realizó el entrenam iento de las redes, s e finalizó haciendo que é s ta s funcionarán en modo pronóstico real De igual manera, e s ta s dos redes fueron simuladas, con el año 2005, de los m eses de Enero a Junio, contando con 173 días, así como el uso del factor de escalam iento calculado en el punto anterior. Los resultados fueron los siguientes, mostrados en la tabla 5 11.

Tabla 5.11. Por ciento de aciertos 12 y 15 neuronas para el año 2005 con incremento

AÑO RANGO DE CONCENTRACIONBAJO MEDIO ALTO

2005DIAS REALES 79 77 17

PRONÓSTICO (%) 12 NEURONAS E = 1.216 22 74 65PRONOSTICO (%) 15 NEURONAS E = 1.208 29 74 47

Se observó que el arreglo de 12 neuronas en la capa oculta tiene un mejor desem peño , por lo tanto se optó por escoger esta red para compararla (capítulo 6) con el modelo de Regresión Multivariable. Otra razón por la que se eligió el modelo de 12 neuronas fue la siguiente, se observó que para el modelo de 12 neuronas en la capa oculta, el modelo cuenta con una sobreestimación, e s decir, los d ías que hasta e se momento sobrepasaron la norma, fue de 17, pero el modelo estima 24, con lo que se le da un margen de error, para la segunda mitad del año 2005. En cambio el modelo de 15 redes, tiene solam ente un día de sobreestimación, por lo que no deja margen para la segunda mitad del año. A continuación se muestran dos gráficas con el arreglo de 12 neuronas En la gráfica 5.3 no se usa el Factor de Escalamiento pero en la gráfica 5.4 si se utiliza dicho factor.

6 8

Page 80: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 5 - M O D E L O S P R O N Ó S T I C O O B T E N I D O S

1O z o n o R e a l V S O z o n o P r o n ó s t i c o ( s i n F a c t o r )

Dias

Gráfica 5.3. Ozono Real vs. Ozono Pronóstico (sin factor).

O z o n o R e a l V S O z o n o P r o n ó s t i c o ( c o n F a c t o r )

...............................................i Ozono Real Ozono Predecido

Días

Gráfica 5.4. Ozono Real vs. Ozono Pronóstico (con factor)

69

Page 81: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 6 - A N Á L I S I S D E R E S U L T A D O S

C A P I T U L O

A N Á L I S I S D E R E S U L T A D O S

6.1 C O M P A R A C IÓ N C O N O T R O S A U T O R E S

La comparación p resen tada a continuación es considerando el modelo de Regresión Multivariable.

Este trabajo fue inspirado en los autores Davis y Speckman, Hubbard y Cobourn, G arcía y Mendoza, por mencionar algunos, pero con algunas modificaciones ya se a en el aum ento de variables, o en su s valores (promedio o máximo), esto e s debido a que los modelos dependen principalmente de la cuenca a estudiar, así como algunas similitudes como son el Factor de Escalamiento, o el Factor Remanente. Todas e s ta s modificaciones o similitudes se realizaren para obtener un mejor rendimiento en el modelo de regresión multivariable hecho en esta tesis.

Uno de los primeros autores en realizar e s te tipo de estudio fueron Davis y Speckm an, quienes realizaron una regresión múltiple en el á rea de Houston, Texas, tom ando en cuen ta las principales variables que desencadenaban la formación de ozono como son la temperatura y la radiación solar (cobertura de nubes), por lo que en estudios posteriores, tomando este tipo de experiencia, los autores Houbarn y Cobourn, realizaron un modelo de regresión multivariable, donde adem ás de tomar en cuenta la formación de Ozono, involucraron variables que ayudan a la disminución de la concentración de dicho contam inante como lo son la velocidad del viento y precipitación.

70

Page 82: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 6 - A N Á L I S I S D E R E S U L T A D O S

Posteriormente García y Mendoza, realizaron un modelo utilizando las m ismas variables meteorológicas que Cobourn, todas ellas con valores máximos (aumentando la Humedad Relativa y Presión Barométrica), y adem ás utilizando las siguientes variables químicas: Óxidos de nitrógeno y el Ozono del día anterior al igual que Davis y Speckman; sab iendo que una fracción del ozono formado será la que inicie ai día siguiente, por lo que se utilizó un factor llamado Factor de Remanencia de Ozono. El modelo por si solo servía para obtener concentraciones medias, por lo que utilizaron un factor llamado Factor de Incremento, con lo cual se ayudó a é s te a pronosticar concentraciones altas

Debido a lo experimentado por los au tores citados en e s te estudio, se realizó un modelo de regresión multivariable considerando las siguientes variables meteorológicas: velocidad del viento promedio, temperatura máxima, humedad relativa promedio, precipitación promedio, presión barométrica promedio y radiación solar máxima; así como las variables químicas: Óxidos de Nitrógeno y ozono del día anterior. Además de tomar en cuenta un factor de Remanencia como lo hecho en el estudio de García.

Se observó que igual que las otras tres parejas de autores, el modelo de regresión obtenido en este estudio en su fase de calibración arrojó muy buenos rendim ientos para concentraciones m edias (capítulo 5), pero un e sc aso desem peño para concen traciones altas, por lo que se decidió retomar lo hecho por García y Mendoza, en cuanto al factor de Incremento, renombrado en e s te estudio como “Factor de Escalam iento”, con este factor se observó que la exactitud en ei rango medio de concentraciones se mantenía y aum en taba considerablemente en el rango alto.

Para la fase de pronóstico en modo real para el año 2005, se observó que las consideraciones an tes m encionadas favorecieron en gran medida el desem peño del modelo al obtener m as de 60% de aciertos en el rango alto de concentraciones, e s decir, s e acertó al pronosticar 11 d ías de los 17 ya reportados

71

Page 83: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 6 - A N Á L I S I S D E R E S U L T A D O S

A continuación se realiza ia comparación en cuanto a las R edes Neuronales Artificiales

Houbard y Cobourn posteriormente de hacer el modelo de Regresión Multivariables realizaron un Modelo de R edes Neuronales Artificiales, utilizando la técnica de retropropagación. El modelo RNA consistió en se is nodos de en trada (seis variables meteorológicas), diez nodos intermedios (empleando una función sigmoidal en cada nodo intermedio) y un nodo de salida, con lo que lleva a una estructura fina! de 6X10X1.

Posteriormente, García y Mendoza, realizaron un arreglo de RNA utilizando las m ismas variables que en el Modelo de Regresión Multivariable (ver tabla 6.1). Dichos autores realizaron dos arreglos, uno con 6 neuronas y otro con 12 neuronas en la capa oculta, 9X6X1 y 9X12X1, respectivamente. Debido a que e ste modelo tenía un buen desem peño en concentraciones medias, se utilizó el factor de incremento utilizado en el modelo de regresión multivariable, aumentando considerablemente la eficiencia del modelo.

Debido que no hay una regla que indique el número óptimo de neuronas en la capa oculta, en cada problema se debe de ensayar con distintos números de é s ta s para organizar la representación interna y escoger la mejor (Hilera y Martínez, 1995); tom ando es ta s consideración y observando los estud ios realizados por dichos autores, se optó por hacer diferentes arreglos de RNA, considerando 6, 10, 12 y 15 neuronas en la capa oculta,

En esto s dos estudios (Cobourn; García) las neuronas en la capa oculta utilizaron la función de transferencia sigmoidal, y en la capa de salida la función de transferencia lineal, por lo que en e s te trabajo se utilizaron e s ta s dos funciones, debido a que son las m ás utilizadas para este tipo de aplicaciones (Hilera y Martínez, 1995).

El modelo demostró tener una nula eficiencia en el rango alto, por lo que se utilizó el Factor de Escalamiento, utilizando un valor diferente al de Regresión multivariable, pero calculado de la misma manera (Capítulo 5).

72

Page 84: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 6 - A N Á L I S I S D E R E S U L T A D O S

Las comparaciones de Regresión Multivariable y R edes Neuronales Artificiales se presen tan en la tabla 6.1, presen tada a continuación

Tabla 6.1. Comparación de los modelos realizados en este trabajo con otros autores

AUTORESANOS

IMPLICADO S EN EL ESTUDIO

VARIABLESMETEOROLOGICAS

VARIABLESQUIMICAS TIPO DE MODELO DESEMPEÑO

DAVIS Y SPECKMAN (HOUSTON, TEXAS),

1983- 1991 NUBOSIDAD PROMEDIO, TEMPERATURA MÁXIMA

OZONO MAXIMO DEL DIA

ANTERIOR

REGRESIÓNMULTIVARIABLE

MEJOR PREDICCIÓN PARA

CONCENTRACIONES MEDIAS

HUBBARDY COBOURN (LOUISVILLE KENTUCKY)

1993 - 1996

TEMPERATURA MAXIMA, VELOCIDAD DEL VIENTO,

TRANSMITANCIA ATMOSFERICA,

COBERTURA DE NUBES PRECIPITACIÓN, DIA DE LA

SEMANA

NO UTILIZADAS REGRESIÓNMULTIVARIABLE

INTERMEDIAS Y ALTAS

HUBBARD V COBOURN (LOUISVILLE, KENTUCKY)

1998 - 1999

TEMPERATURA, VELOCIDAD DEL VIENTO, TEMPERATURA EN EL PUNTO DE ROCIO,

COBERTURA DE NUBES CALMAS Y

PRECIPITACIÓN

NO UTILIZADAS REDESNEURONALES

INTERMEDIAS Y ALTAS

IGNACIO GARCIA Y ALBERTO MENDOZA

(MONTERREY, N L )

1998-2002

TEMPERATURA MAXIMA, VELOCIDAD DEL VIENTO MAXIMA, HUMEDAD RELATIVA MÁXIMA,

PRECIPITACIÓN MAXIMA PRESIÓN MAXIMA, RADIACIÓN SOLAR

MAXIMA

NO, DEL DIA ANTERIOR N02

DEL DIA ANTERIOR, 03

DEL DIA ANTERIOR (TODAS MÁXIMAS)

REGRESION MULTIVARIABLE Y

REDES NEURONALES

INTERMEDIAS Y ALTAS

MONSERRAT TENORIO Y

JOSE RODRIGUEZ

(GUADALAJARA JAL )

1999 - 2005

TEMPERATURA MÁXIMA, VELOCIDAD DEL VIENTO PROMEDIO, HUMEDAD RELATIVA PROMEDIO

PRECIPITACION PROMEDIO, PRESIÓN PROMEDIO, RADIACION

SOLAR MAXIMA

NOx DEL DÍA ANTERIOR, N02

DEL DIA ANTERIOR, 03

DEL DIA ANTERIOR (TODAS MAXIMAS)

REGRESIÓN MULTIVARIABLE Y

REDES NEURONALES

INTERMEDIAS Y ALTAS

73

Page 85: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 6 - A N Á L I S I S D E R E S U L T A D O S

6 .2 C O M P A R A C IÓ N R E G R E S IÓ N M U L T IV A R IA B L E (R M ) v s R E D E S

N E U R O N A L E S A R T IF IC IA L E S (R N A )

La elección de un modelo de Regresión Multivariable o uno de Redes Neuronales Artificiales obedece a diversos factores entre los que se encuen tran- el gusto o afinidad a cierto modelo, el nivel de conocimiento en su estructura o funcionamiento, calidad de la b a se de datos, condiciones atmosféricas de la cuenca o requerimientos computacionales que dem anda cada modelo, adem ás de un análisis estadístico de los resultados obtenidos.

En e s te trabajo se observó que los modelos obtenidos de RM como el de RNA proporcionaron buenos resultados en modo pronóstico ya que como se observa en la tabla6.2 el porcentaje de aciertos para el rango alto en los dos modelos equivale a proporcionar 11 de los 17 d ías observados, en el rango medio 60 de 77 y en el rango bajo 17 de 79, lo que cumple con el objetivo de pronosticar concentraciones altas de ozono en la ZMG e indica que los modelos no muestran una diferencia significativa en su desem peño pero si en su operación y manejo, e s preciso aclarar que cada uno trabaja con un Factor de Escalam iento (E) diferente, 1.265 y 1 216 para RM y RNA respectivamente.

Tabla 6.2. Tabla comparativa de los modelos R M vs RN A para el año 2005

ANO 2005RANGO DE CONCENTRACION

% ACIERTOSBAJO MEDIO ALTO

DIAS REALES 79 77 17MODELO DE RM, E = 1.265 22 78 65MODELO RNA, E = 1.216 22 74 65

El modelo de RM presenta una ecuación de regresión usando variables meteorológicas y quím icas observadas para generar un pronóstico; en el caso del modelo de RNA son un conjunto de ecuaciones no lineales que proporcionan concentraciones pronóstico utilizando las mimas variables del modelo de RM. Ambos modelos tienen la gran ventaja de que pueden ser armados, entrenados y simulados en sistem as computacionales m odestos (PC o Laptop) que cuenten con los softwares SPSS y Matlab, según el modelo a realizar y el ingreso de una base de datos adecuada.

74

Page 86: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 6 - A N Á L I S I S D E R E S U L T A D O S

El tiempo empleado para correr ios modelos e s bajo para ambos, considerando una ba se de datos conformada por lecturas diarias para 6 años (aproximadamente 2190 días) conteniendo cada uno de los días 9 variables entre meteorológicas y quím icas y el ozono observado, dando un total aproximado de datos a analizar de 21900.

La consideración más importante e s tener nociones de los datos requeridos y los resultados esperados, una comprensión estadística de los datos arrojados por los modelos y del método en sí, con el fin de emitir un juicio de evaluación, así como crear una ba se de datos adecuada.

Para este estudio, la realización del modelo de RM cumplió con dos objetivos, el primero, la selección de variables que serian introducidas a ambos modelos (RM y RNA) y el segundo la realización del modelo en Regresión Multivariable.

Un modelo de RM puede se r más controlado respecto del modelo de RNA, ya que en este último únicamente se tiene control sobre las funciones de transferencia, el valor de error, valor del momentum, mientras que en el RM se tiene control sobre las variables seleccionadas, así como la selección de la mejor relación que muestran las variables independientes con respecto a la dependiente, (cúbica, cuadrática, etc.) al ver el cambio en el valor del coeficiente de correlación.

Ambos pueden tener mejoras con el tiempo, dicha actualización se basará en el aum ento de las b ase s de datos de calibración obteniendo con esto una mejoría en el desem peño al contemplar una sene de tiempo más amplia.

6 .3 P A R Á M E T R O S M Á S IM P O R T A N T E S EN LA P R E D IC C IÓ N D E N IV E L E S

DE C A L ID A D D E L A IR E EN LA ZM G

Es importante analizar los parámetros que afectan o benefician en la predicción de los niveles de la calidad del aire en la ZMG, siendo éste uno de los objetivos del trabajo, refiriéndose a! contam inante ozono.

75

Page 87: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 6 - A N Á L I S I S D E R E S U L T A D O S

El desem peño real de los modelos fue evaluado sobre una base de datos con lecturas observadas para un periodo de Enero — Junio del 2005. Si bien las variables en conjunto otorgaron los resultados encontrados por los modelos, se pueden considerar algunas de é s ta s como las variables m ás relevantes dada su importancia respecto a la formación de ozono y su grado de correlación encontrado para la ZMG

El modelo de RM presentado (considerando 6 años, 1999-2004), mostró un valor de R2 de 0.41409, tal que, si se analizan los valores de R2 obtenidos por las diferentes variables respecto al ozono, tendríamos las variables que presentan mayor relevancia en la formación y dispersión de ozono- Ozono del día anterior, Temperatura, Radiación solar, Óxidos de nitrógeno, Velocidad del viento y Precipitación, así como el factor de rem anencia (F), correspondiente a una fracción del ozono del día anterior.

De las variables m encionadas en el párrafo anterior se analizan en orden descenden te las tres más importantes Ozono del día anterior, Temperatura y Radiación Solar; como se muestra en la tabla 6.3, al aplicarles una regresión no lineal son las que mayor valor de R2 presentan, a excepción de la radiación, pero en ba se a un análisis meteorológico se decidió por esta variable, pues afecta directamente dentro del ciclo fotolítico (capítulo 1) y en el valor de la temperatura, esto nos muestra la importancia que guardan para la estimación de ozono y por ello fueron tom adas en sus valores máximos dentro de la base de datos.

Tabla 6.3. Tabla comparativa de los coeficientes de correlación para cada variable con la ecuación que presentómayor R2

OZONO vs. TIPO DE RELACIÓN R2VELOCIDAD DEL VIENTO CUBICA .016

TEMPERATURA CUBICA .180PRESION CUBICA .004HUMEDAD CUBICA .057

LLUVIA CÚBICA .027RADIACION CUBICA .049

N 02 ANTERIOR CUBICA .001NOx ANTERIOR CUBICA .0170 3 ANTERIOR CUBICA .418

76

Page 88: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 6 - A N Á L I S I S D E R E S U L T A D O S

Otro parámetro importante considerar es que los valores de los Óxidos de Nitrógeno (N 02 y NOx) son valores máximos, esto por que son elem entos que intervienen igualmente en el ciclo fotolítico, afectando directamente en la formación del ozono (Capitulo 1), é s to s son medidos de las 15 a las 23 horas del día anterior, debido a que la formación de ozono se da entre las 11 y las 14 horas, por lo que no hay consumo de estos dos contam inantes y las cantidades que se acumulan de e sto s óxidos en la tarde fungirán como materia prima para el día siguiente.

Una vez analizadas las variables precursoras del Ozono e s importante analizar las variables que ayudan a la disminución del contam inante tal como la velocidad del viento, que puede dispersar los precursores del ozono o a é s te mismo haciendo una disminución o concentración del contam inante. La otra variable, e s la precipitación, ya que é s ta lavará la atmósfera haciendo que disminuya la concentración de Ozono, así como de los p recursores y otros contam inantes (esto se puede observar, un día d espués de haber llovido, ya que en la m añana tiende a esta r despejado en las primeras horas)

Aunado a lo an tes mencionado e s de gran importancia considerar las características propias de la cuenca de Jalisco que se encuentra a 1583 metros sobre el nivel del mar5, con parques industriales al NO, SE y SO, rodeado por la Sierra Madre Occidental con m ese tas y el Eje Neovolcánico.

Las sierras Los Huicholes, Los Guajolotes y San Isidro, el cerro Gordo y el volcán de Tequila forman parte de la Sierra Madre Occidental, el Eje Neovolcánico o Eje Volcánico T ransversal comprende las sierras Cacoma, Manantlán, Tapalpa y Lalo, entre otras. También sobresalen los cerros El Tigre y García, Cerro Viejo Volcán de Tequila y al sur, el Nevado de Colima y el Volcán de Colima, los cuales generan una estructura de cuenca muy particular y patrones de formación y dispersión contam inantes específicos para la ZMG que afectan directam ente en el desem peño del modelo.

5 CNA. Registro de Temperatura y Precipitación.77

Page 89: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C A P I T U L O 6 - A N Á L I S I S D E R E S U L T A D O S

6 .4 B E N E F IC IO S , A P L IC A C IO N E S Y N O V E D A D E S Q U E D E JA EL

T R A B A J O

Este trabajo tiene una gran importancia, tanto a nivel estatal como a nivel nacional, ya que es la segunda ciudad donde se realiza este tipo de estudio, Monterrey fue la primera, e impulsó a realizar e s te trabajo, por lo que se espera que así mismo e s ta tesis sirva como apoyo para nuevos estudios en otras ciudades contam inadas de la República Mexicana (como son el Valle de México, Toluca, Mexicali, Tijuana, León) o se hagan mejoras a esto s modelos, para optimizar su desem peño .

S e planea que estos dos modelos de predicción de ozono, sean utilizados de m anera regular por las estaciones de monitoreo ambiental para el pronóstico de dicho contam inante, tomando las medidas preventivas y alertar a la población, principalmente a niños, pe rsonas asm áticas y de la tercera edad.

Estos modeíos, tienen como característica una fácil implementación y requerim ientos tecnológicos moderados, ya que para el modelo de Regresión Multivariable, el programa que se requiere para la obtención del modelo e s SPSS y para el pronóstico de 0 3 e s Excel, siendo éste de fácil a cceso y manejo. Para utilizar el modelo de RNA, se utiliza el programa Matlab, también de fácil acceso pero requiere de mayores conocim ientos técnicos tanto del idioma inglés como del programa. Ambos modelos son de estructuras sencillas y de fácil entendimiento, lo que les confiere costos de operación mínimos.

78

Page 90: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C O N C L U S I O N E S Y R E C O M E N D A C I O N E S

C O N C L U S I O N E S Y R E C O M E N D A C I O N E S

C O N C L U S IO N E S

Con la finalidad de cumplir con los objetivos planteados al inicio de esta tesis, se generaron dos modelos de predicción:

Modelo pronóstico de Regresión Multivariable (RM)Modelo pronóstico de R edes Neuronales Artificiales (RNA), del tipo retropropagación.

Dichos modelos fueron calibrados para el periodo comprendido entre los años 1999 y 2004 en la Zona Metropolitana de Guadalajara (ZMG) y su desempeño fue evaluado con los datos referentes al periodo Enero - Junio del 2005 con datos proporcionados por SMN e INE. La forma de evaluar y comparar el desem peño de ambos modelos fue realizando una comparación de la concentración de Ozono pronóstico y el Ozono Observado (real) en tres rango de concentraciones (llamado porciento de aciertos) referidos a la norma NOM-020- SSA1-1993: bajo (C 0 ¡< 0.060 ppm), medio (0 .060<COi <0.110 ppm) y alto (C a > 0 110ppm), considerando que las concentraciones altas son valores que sob repasan la norma, según lo expuesto anteriormente.

Los modelos de RM y RNA tienen un desem peño aceptable en cuanto al pronóstico de Ozono en el rango bajo y medio, sin embargo el objetivo de este estudio fue poder pronosticar concentraciones e levadas del contam inante en cuestión, por lo que se hizo necesario el uso del factor de escalam iento con el fin de que los modelos pronosticaran concentraciones en el rango alto. Este factor fue obtenido en la calibración de los modelos a partir de la igualación de los d ías observados y los d ías pronosticados que sobrepasaron dicha norma.

79

Page 91: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C O N C L U S I O N E S Y R E C O M E N D A C I O N E S

Las características generales del modelo de RM son las siguientes

9 variables independientes (3 químicas y 6 meteorológicas)29 coeficientes de regresión que involucran las 9 variables y el factor de rem anencia del ozono del día anteriorEste modelo es capaz de pronosticar el 22% de concentraciones m enores a 0 060 ppm, es decir, acertó 17 de los 79 días para e ste rango; el 78% de acierto en el rango de concentraciones de 0.060 - 0.110 ppm, esto e s 60 días de 77 registrados y el 65% en concentraciones mayores a 0.110 ppm, es decir, 11 de los 17 d ías registrados para el periodo del año 2005.Factor de escalam iento de 1.265.La eficiencia global del modelo para el periodo Enero - Junio 2005 fue de 50.87% con factor de escalam iento y 54.34% sin dicho factor.

Las características generales que presenta el modelo de RNA son:

9 variables independientes (3 químicas y 6 meteorológicas)- Arreglo estructural de la red de 9x12x1 (Entrada x Oculta x Salida)

Funciones de transferencia: sigmoidal en la capa oculta y lineal en la capa d e salida. Función de entrenam iento TRAINLM Función de aprendizaje LEARNGDM

- Función de desem peño MSE (Media del cuadrado del error)- Este modelo e s capaz de pronosticar el 22% de concentraciones m enores a 0.060

ppm, es decir, acertó 17 de los 79 días para e s te rango; el 74% de acierto en el rango de concentraciones de 0.060 - 0.110 ppm, esto e s 57 días de 77 registrados y el 65% en concentraciones mayores a 0.110 ppm, e s decir 11 de los 17 d ías registrados para el periodo del año 2005.Factor de escalam iento de 1.216.

- La eficiencia global del modelo para el periodo Enero - Junio 2005 fue del 49.13% con factor de escalam iento y 54.34% sin dicho factor

80

Page 92: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C O N C L U S I O N E S Y R E C O M E N D A C I O N E S

NOTA. Se observa que la eficiencia global de !os modelos aumenta cuando no operan con el factor de escalam iento, ya que hay un mayor acierto en el rango bajo de concentraciones, pero éste no e s de nuestro interés, por lo que al momento de introducir e s te factor, disminuye el acierto en el rango bajo, pero aum enta considerablemente en el rango alto, el cual e s de nuestro interés.

En base a los resultados obtenidos por los modelos y las variables se leccionadas, se concluye que para la ZMG las variables que tienen una mayor relevancia en la formación y dispersión de ozono considerando su s relaciones físicas y quím icas son: tem peratura máxima, radiación solar máxima, ozono del día anterior, velocidad del viento promedio, precipitación y óxidos de nitrógeno (NOx y N 02). Aunado a esto se encuen tran también las características propias de la cuenca de Guadalajara, Jalisco, como son: la dirección de los vientos reinantes, topografía, ubicación de las zonas industriales.

Los modelos obtenidos tienen la capacidad de pronosticar concentraciones máximas de Ozono en ppm, para la ZMG, utilizando variables meteorológicas máximas de tem peratu ra y radicación solar, así como valores promedio de velocidad del viento, presión barométrica, precipitación pluvial, humedad relativa, todas ellas del día de interés; así como variables químicas máximas del día anterior como son- Ozono, NOx y N 02 (es ta s dos últimas con un horario de las 15 - 23 horas).

Debido a que los resultados de los pronósticos de am bos modelos son muy sim ilares no es factible seleccionar una de las dos técnicas como la mejor, ya que am bos cumplen con el objetivo de pronosticar concentraciones altas de Ozono, por lo que la diferencia radica en el manejo de los datos y de los programas. Lo óptimo e s realizar un modelo utilizando las dos herram ientas computacionales (SPSS y Matlab). El procedimiento sugerido e s el siguiente: el programa SPSS se utilizará para la selección de las variables meteorológicas y quím icas, así como para determ inar que variables son m ás importantes para la predicción del contam inante en cuestión, lo cual se hará por medio de un análisis estadístico (t-ratio y R2); posteriormente en el programa Matlab, se introducirá la b ase de datos con las variables seleccionadas, obteniendo así los pesos y por lo tanto el modelo final.

81

Page 93: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

C O N C L U S I O N E S Y R E C O M E N D A C I O N E S

R E C O M E N D A C IO N E S

Una vez realizados esto s dos modelos e s importante presentar algunas recom endaciones que se deben tener para su operación.

Los resultados obtenidos con esto s dos modelos son exclusivamente para la Zona Metropolitana de Guadalajara, Jalisco, ya que cada ciudad presenta diferentes condiciones ambientales. Si se realizara algún estudio en otras ciudades (citadas en el capitulo 6), se puede efectuar la prueba con este modelo, para tener una referencia, pero no así para realizar pronósticos, por lo mencionado anteriormente.

Otro aspecto que hay que tomar en cuenta son los valores de las variables, ya que como se dijo anteriormente se utilizan valores máximos y promedios, pero e s posible utilizar dichos modelos con valores máximos, teniendo en cuenta que el modelo p resen ta rá una incertidumbre en la concentración pronosticada, por lo que esta opción de operación resultará práctica pero no recomendable, este tipo de consideración se hará en el caso de no contar con el valor correcto de la variable en cuestión

El programa SPSS es un programa muy completo, ya que en él se puede realizar tanto el análisis de las variables independientes, como la construcción y evaluación del modelo, pero son necesarias muchas horas - hombre En Matlab no e s posible realizar el análisis de dichas variables, por lo que e s necesario el análisis de é s ta s utilizando una herram ienta externa, sin embargo este programa proporciona una rápida estructuración del modelo. Debido a e s ta s observaciones es necesario el uso de ambos programas, porque am bos se complementan, ya que el tiempo extra que se requiere para hacer el modelo de regresión puede ser aprovechado en el entrenam iento para la realización del modelo de redes neuronales, obteniendo así mejores resultados.

82

Page 94: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

B I B L I O G R A F Í A

B I B L I O G R A F Í A

• Ayllón Torres, María Teresa. “Elementos de meteorología y climatología”. México, Trillas, 1996 Pág. 83 - 129.

• Chao, Lincoln L. “Statics methods and analysis”, Me Graw Hill, New York, 2da edición, Pág. 512

• Dixon, Wilfrid J; Massey, Frank J. Jr., “Introducción al análisis estad ístico”, México, Me Graw Hill, Pág. 489.

• Fajardo Hernández, Franco “Contaminación fotoquímica del aire”. Tesis IQI — ESIQIE — IPN. México. 1982. Pág. 1-31.

• García Sánchez, I. “Aplicación de Modelos Semiempiricos para el Análisis y pronóstico de la Calidad del Aire en el á rea metropolitana de Monterrey, N. L.”, tesis de m aestría, ITESM, Monterrey, México, (2003).

• Gutiérrez Avedoy, Víctor. “Sistem as para prevenir y controlar la contam inación del aire” Tesis IQI — ESIQIE — IPN. México 1977. Pág. 134

• Henry, J Glynn; Heinke, Gary “Ingeniería Ambiental”, Prentice Hall, México, 1999, 2da edición. Pág. 216 -223

• Hernández Vázquez, Armando. “Estudio de la problemática de la contam inación del aire en le valle de México” Tesis IQI — ESIQIE — IPN. México. 1982. Pág. 117.

• Hilera, Jo sé R; Martínez Víctor J, “R edes Neuronales Artificiales, Fundam entos, Modelos y Aplicaciones”, USA, 1995.

• Hubbard, M.; Cobourn, W.G. “Development of a regresión model to forecast ground — ievel ozone concentration in Louiville, KY. Atmosspheric environmenf. 2001.

• Kolehmainen M.; Martikainen H. y Ruuskanen J., “Neural Networks and Periodic Components Used in Air Quality Forecasting”, Atmospheric Environment, 35, 815-825 (2001)

• INE (Instituto Nacional de Ecología). “Segundo Informe sobre la Calidad del Aire en C iudades M exicanas 1997”. litografía helio México, D. F., 1998

• Martínez Lozano, Gonzalo. “Análisis del comportamiento de ozono en la ciudad de México”. Tesis IQI — ESIQIE — IPN. México. 1996. Pág. 109

• Ortiz Ramírez, Ricardo. “Estudio experimental sobre la influencia del g as L.P. en la formación de ozono en la atmósfera de la ciudad de México”. Tesis IQI - ESIQIE — IPN. México. 1996. Pág. 117

83

Page 95: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

B I B L I O G R A F Í A

• Pun, B K , Liuis, J — F , Pa¡, P.; Seigneur, C. ; Altshuler, S. , Franco, G. “Ozone formation in California’s San Joaquín Valley . A critical a sse ssm en t of modeling and data needs”. J Air & W aste Manage. Assoc. 2000, 961-971.

• Raga G B. y Raga A.C , “On the Formation of an Elevated Ozone Peak in México City”, Atmospheric Enviroment, 34, 4097-4102 (1999)

• Romero Gómez, Jaime. “Evaluación de la contaminación del aire originada por fuentes fijas en la colonia Agrícola Oriental”. Tesis IQI — ESIQIE - IPN. México. 1988. Pág. 289.

• Schifter, I.; Magdalena, M.; Diaz, L.; Melgarejo, L. A., Barrera, A.; Kriger, B.; Arriaga, J. L.; López — Salinas, E. “Contribution of LPG - derived em issions toa ir poluution in the Metropolitan Area of Guadalajara City”. J. Air & W aste Manage. Assoc. 2000b, 1857 - 1864.

• Seinfeld, John “Contaminación Atmosférica; Fundamentos Físicos y Quím icos”,McGraw-Hill, Madrid, 1978. Pág. 120-121.

• Seoánez Calvo, Mariano. “Tratado de climatología aplicada a la ingenieríamedioambiental”, Madrid España, Mundiprensa, 2002. Pág. 207 - 273.

• Wark, Kenneth, Warner, Cecil F.” Contaminación del aire: Origen y control”, México D. F : Limusa Noriega, 1998 Pág. 5 1 0 -5 3 0 .

Aire• http //sem ades jalisco gob.mx/site/indexaire htm 12 Febrero 2005• h ttp //sem ades jalisco gob mx/site/planeacion/index htm. 12 Febrero 2005

Jalisco• http://www.elbalerogob.mx/explora/htm l/home.htm l. 16 Enero 2006.

Red de monitoreo ambiental, Guadalajara.• h ttp //sem ades jalisco gob.mx/site/proteccion2002 htm. 14 Marzo 2005• http://sinaica.ine.gob.mx/ramas.htm l. 14 Marzo 2005• http://www.jornada.unam.mx/2001/mar01/010326/eco-aire.html. 17 Marzo 2005• h ttp //sem ades jalisco.gob.mx/site/infoyestadframeset.htm . 20 Marzo 2005

84

Page 96: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

B I B L I O G R A F Í A

Red de monitoreo del aire, Guadalajara• http //sem ades jalisco gob mx/site/indexaire htm 26 Abril 2005• http //www ine gob.mx/dgicurg/calaire/difusion.html 26 Abril 2005

Redes Neuronales• http://ohm utp.edu co/neuronales/Capitulo1/RNArtificial htm. 12 Febrero 2005• http://es wikipedia org/wiki/Redes_neuronales_arfíciales. 15 Febrero 2005• http://www.itlp.edu.mx/publica/revistas/revistali/anteriores/diciembre98/redesneuro.ht

mi. 2 Marzo 2005• http://tesia cuao .edu.co/proyectos/ic/Rnalntro.html#definicion. 2 Marzo 2005• http://www.monogravias.com/cgi-

bin/search.cgi?substring=1&bool=and&query=redes+neuronales. 10 Abril 2005

85

Page 97: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

A N E X O S A

A N E X O A

Valores de los coeficientes para el modelo de Regresión Multivariable

Coeficiente Valor ErrorEstándar

Intervalo He Confianza asintótico al 95%Inferior Superior

BO 15125 873015 1 38163E+13 -2 70954E+13 2.70954E+13VO -13430 72055 35164 621893 -82393 06919 55531 628095V1 - 000442427 000462155 -001348772 000463918V2 2 64212E-06 000015262 - 000027290 000032574V3 -1 22198E-06 1 06500E-06 -3 31057E-06 8 66618E-07TO 1768.5600145 10786 840008 -19385.82133 22922 941360T1 -018248604 006152951 - 030315333 - 006181875T2 000657396 000219166 000227584 .001087209T3 -6 95252E-06 2.60207E-06 - 000012056 -1 84953E-06HO 16968 528695 138235 38352 -254128 8470 288065 90440H1 000838111 000460496 - 000064980 001741202H2 - 000011084 7 96296E-06 - 000026700 4 53282E-06H3 2 63989E-08 4 45256E-08 -6 09215E-08 1 13719E-07PO 7264 3758375 21782 768248 -35454 43578 49983187457P1 049333743 036868987 - 022971086 121638571P2 - 000052146 000039576 - 000129759 000025467P3 1 83443 E-08 1 41384E-08 -9 38289E-09 4 60715E-08RO 7251 8971659 20571 418573 -33091 30186 47595 096193R1 -029570120 039947782 - 107912861 048772622R2 081588256 263771862 - 435702309 598878822R3 - 050477268 386124189 -807716490 706761955SO -32219 92045 2 39865E+29 -4 70407E+29 4 70407E+29S1 -3 66368E-06 000016511 - 000036044 000028717S2 5 20153E-08 2 85771 E-08 -4 02798E-09 1 08059E-07S3 -3 54671E-11 1 52881 E-11 -6 54490 E-11 -5 48521E-12

NXO -28596 75261 4 13680E+45 -8 11280E+45 8 11280E+45NX1 - 086407362 .040643146 - 166113801 - 006700922NX2 356163054 242955739 - 120304414 832630523NX3 - 429250845 397825395 -1 209437638 350935948N20 25852.796462 4.13680E+45 -8 11280E+45 8 1 1280E+45N21 - 021038496 034984620 - 089647838 047570847N22 121758411 186082439 -243173198 486690020N23 - 018731663 307498510 -621775811 584312484F 478928225 018228083 443180608 514675842

Page 98: DIRECTOR: ING. IGNACIO GARCÍA SÁNCHEZ

A N E X O S B

A N E X O B

R E D N E U R O N A L 9 X 1 2 X 1

MATRIZ DE P E S O S EN LA PRIM ER CAPA

[0.014821 0.18415 0.0099338 -0.1201 5.1662 -0.061949 2 5847 2.0174 -11.833; 0.051477 0.077492 -0.075854 0.03802 3.4172 -0.00043207 12.4017 -5 8606 -9.7417; -0.088454 0.38243 0.077651 -0.021757 -5.7469 -0.0041529 8.7744 -6.7426 1.8567;0 081341 -0.17421 0.047978-0.0059121 107.264 0.0032112 4.1992-1.6234-19.7144; 5.839 19.3181 -0.27757 -1.2796 6.7946 0.42951 -23.5956 4.6264 20.2558;0 088146 -0.38314 -0.077596 0.021792 5.7659 0.0041647 -8.7531 6.7328 -1.8424; 0.21868 3.3669 0.85503 -0.15931 -45.3508 -0.052033 87.4713 -72.2697 131.8557; -0.052044 -0.076718 0.075682 -0.037939 -3.4437 0.00041957 -12.3863 5.861 9.7399; 0.12516 -0.21104 -0.014371 0.0018293 11.3816 0 0058687 -8.758 2.0938 58.8057;0 2314 -0.21239 0.013295 0.18548 79.3044 0.0077257 5.0765 -2.73 -44.3954;-3 6488 -6.9605 2.1792 -0.21642 -114.3933 0.073308 -165 6657 75.5604 -203.491; -4.8688 -17.5632 0 24746 1.3193 1.3273 -0.40554 36.8352 -14 8385 -27 6797]

V E C T O R D E P E S O S EN LA S E G U N D A C A P A

[0 52218 17.2412 17.9956 -0.15029 -77.1182 17 9828 0.011966 17.246 0.043245 0.076368 -0 011276 -77.1147]

V E C T O R A D Y A C E N T E EN LA P R IM E R C A P A

[2 7738;-28 2845;10.8694;6 9315;-96.1582;-10.892;31.903;28.2286;-3 8924;-156.2992;222.8782;-34.2767]

V E C T O R A D Y A C E N T E EN LA S E G U N D A C A P A

[41.96]