Geoestadística
(Variograma, Kriging Ordinario y Simulacion Condicional)
Victor Daniel Mamani Laura
Albert Justin Ramos Fuentes
Alberto Andre Caceres Mamani
Yeyson Angel Mamani Condori
Universidad Nacional de Moquegua – UNAM
Escuela Profesional de Ingenieria de Minas - EPIM
IMCAPEL: Computacion Aplicada II
MSc. MBA Ing. Walter Cahuana Ochoa
08 de Noviembre de 2020
GEOESTADÍSTICA 2
Tabla de Contenido
Resumen ........................................................................................................................................11
Objetivo .........................................................................................................................................12
Capítulo I: Marco Teórico ............................................................................................................ 13
1.1. Reseña Histórica............................................................................................................. 13
1.2. Geoestadística................................................................................................................. 14
1.2.1. Análisis Exploratorio De Los Datos ................................................................... 15
1.2.2. Análisis Estructural ............................................................................................ 15
1.2.3. Variable Regionalizada ...................................................................................... 15
1.2.4. Estacionariedad .................................................................................................. 16
1.2.5. Curva Tonelaje Ley ............................................................................................. 16
1.2.6. Decluster o Desagrupamiento ............................................................................ 16
1.2.7. Estimación de Kriging ........................................................................................ 16
1.2.8. Estudio Variográfico........................................................................................... 17
Capítulo II: Variograma .................................................................................................................18
2.1. Elementos Del Variograma ............................................................................................ 20
2.1.1. Efecto Nugget (Co) ............................................................................................. 20
2.1.2. Sill (C) ................................................................................................................. 20
2.1.3. Rango (a) ............................................................................................................ 20
2.1.4. Meseta (Ct).......................................................................................................... 21
GEOESTADÍSTICA 3
2.2. Cálculo Del Variograma Experimental .......................................................................... 21
2.2.1. Cálculo Del Semivariograma Experimental ....................................................... 26
2.3. Modelos Teóricos Del Variograma ................................................................................ 27
2.3.1. Efecto Pepita Puro .............................................................................................. 27
2.3.2. Modelo Exponencial ........................................................................................... 28
2.3.3. Modelo Esférico .................................................................................................. 29
2.3.4. Modelo Gaussiano .............................................................................................. 30
2.3.5. Modelo Potencia ................................................................................................. 30
2.3.6. Modelo Lineal ..................................................................................................... 31
2.4. Variograma Omnidireccional ......................................................................................... 32
2.5. Isotropía.......................................................................................................................... 32
2.6. Anisotropía ..................................................................................................................... 33
2.6.1. Anisotropía geométrica....................................................................................... 33
2.6.2. Anisotropía zonal ................................................................................................ 34
2.6.3. Anisotropía híbrida ............................................................................................. 34
2.7. Casos particulares respecto a los modelos de semivariograma ...................................... 35
2.7.1. Semivariograma con tendencias ......................................................................... 35
2.7.2. Semivariograma con efecto agujero ................................................................... 36
2.7.3. Semivariograma compuesto ................................................................................ 36
2.8. Cálculo Del Variograma A Malla Irregular ................................................................... 37
GEOESTADÍSTICA 4
Capítulo III: Kriging Ordinario .....................................................................................................39
3.1. Definición De Kriging .................................................................................................... 39
3.2. Hipótesis Del Kriging Ordinario .................................................................................... 40
3.3. Varianza De Predicción Del Kriging Ordinario ............................................................. 43
3.4. Estimación De Ponderaciones Por Medio De La Función De Semivarianza ................ 44
3.5. Validación Del Kriging .................................................................................................. 46
3.6. Representación De Las Predicciones ............................................................................. 47
3.7. Intervalos De Confianza ................................................................................................. 48
3.8. Ejemplo de Aplicación del Kriging Ordinario ............................................................... 48
3.9. Diferencias entre kriging simple y kriging ordinario ..................................................... 50
3.10. Ventaja del Kriging Ordinario........................................................................................ 51
3.11. Diferencias entre Kriging Ordinario y Simulación Condicional .................................... 51
Capítulo IV: Simulación Condicional ...........................................................................................56
4.1 Objetivo .......................................................................................................................... 56
4.2 Estimación Y Simulación ............................................................................................... 57
4.3 Métodos De Simulación ................................................................................................. 58
4.4. Requisitos para Realizar una Simulación ....................................................................... 59
4.5. Ejemplos de Funciones Aleatorias .................................................................................. 60
4.6. Aspectos del Problema de Simulación ............................................................................ 63
4.7. Desagrupamiento de Datos (Declustering) ..................................................................... 63
GEOESTADÍSTICA 5
4.8. Desagrupamiento de Datos por el Método de Celdas ..................................................... 64
4.8.1. Método de la celda .............................................................................................. 66
4.9. Transformación Gaussiana (anamorfosis) ...................................................................... 69
4.10. Modelo multi-Gaussiano ................................................................................................. 74
4.10.1. Hipótesis ............................................................................................................. 74
4.11. Validación ....................................................................................................................... 75
4.12. Simulación Condicional .................................................................................................. 79
4.13. Algoritmo Secuencial ...................................................................................................... 79
4.14. Resumen: pasos a seguir para la simulación ................................................................... 82
Conclusiones ..................................................................................................................................84
Recomendaciones ..........................................................................................................................85
Referencias ....................................................................................................................................86
GEOESTADÍSTICA 6
Índice de Figuras
Figura 1 Dos puntos a la distancia vectorial h. .......................................................................... 18
Figura 2 Relación entre lados de un triangulo ........................................................................... 19
Figura 3 Cálculo del cuadro de los brazos promedio ................................................................. 19
Figura 4 Elementos Del Variograma .......................................................................................... 21
Figura 5 Intervalo mínimo del muestreo ..................................................................................... 22
Figura 6 Muestra de cálculo de LAG2. ....................................................................................... 22
Figura 7 Muestra de cálculo de LAGs. ....................................................................................... 23
Figura 8 Muestra de taladros en el muestreo. ............................................................................ 23
Figura 9 Variograma de taladros en el muestreo ....................................................................... 24
Figura 10 Variograma relativo.................................................................................................... 25
Figura 11 Variograma logarítmico. ............................................................................................ 26
Figura 12 Efecto Pepita .............................................................................................................. 27
Figura 13 Efecto Pepita en yacimiento aurífero ......................................................................... 28
Figura 14 Modelo Exponencial ................................................................................................... 28
Figura 15 Modelo Esférico ......................................................................................................... 29
Figura 16 Modelo Gaussiano...................................................................................................... 30
Figura 17 Modelo Potencia......................................................................................................... 31
Figura 18 Modelo Lineal............................................................................................................. 31
Figura 19 Direcciones del semivariograma similar ................................................................... 32
Figura 20 Anisotropía Geométrica ............................................................................................. 33
Figura 21 Anisotropía Zonal ....................................................................................................... 34
Figura 22 Anisotropía Híbrida ................................................................................................... 35
GEOESTADÍSTICA 7
Figura 23 Semivariograma con tendencias. ............................................................................... 35
Figura 24 Semivariograma con efecto agujero........................................................................... 36
Figura 25 Semivariograma compuesto. ...................................................................................... 37
Figura 26 Variograma a malla irregular.................................................................................... 37
Figura 27 Variograma en la dirección E-W con una ventana de 15° ........................................ 38
Figura 28 Consideraciones para el computo del variograma .................................................... 39
Figura 29 Datos observados ....................................................................................................... 48
Figura 30 La simulación condicional en este caso en un banco de una mina de cobre,
proporciona una estimación más realista de un yacimiento. Fuente: ´´La simulación condicional
en un depósito minero`` ................................................................................................................ 56
Figura 31 Simulación condicional y krigeado. El krigeado establece que en la parte norte las
impurezas tienen leyes inferiores a 0.8% de alcalinos. La simulación nos indica que podría
existir problemas, los cuales hay que tener presente en la planificación. Fuente: ´´La simulación
condicional en un depósito minero`` ............................................................................................ 57
Figura 32 Esquema sintético del modelamiento geoestadístico. Esperanza, varianza, covarianza
y variograma sólo proporcionan un resumen de las características de la función aleatoria. ..... 59
Figura 33 Realizaciones de dos funciones aleatorias con la misma distribución univariable y el
mismo variograma. ....................................................................................................................... 60
Figura 34 Realizaciones de funciones aleatorias con mismas distribuciones univariables,
bivariables (luego, mismos variogramas) y trivariables. ............................................................. 60
Figura 35 Realizaciones de tres modelos de variables continuas. ............................................. 61
Figura 36 Realizaciones de tres modelos de variables categóricas. .......................................... 61
Figura 37 Realizaciones de tres modelos de conjuntos aleatorios. ............................................ 62
GEOESTADÍSTICA 8
Figura 38 Realizaciones de tres modelos de redes de fracturas. ................................................ 62
Figura 39 Realizaciones de cuatro modelos de procesos puntuales ........................................... 63
Figura 40 Depósito de Cobre 0.6 km x 0.6 km ............................................................................ 64
Figura 41 Muestras con su respectiva ley................................................................................... 65
Figura 42 Presencia de cluster en el depósito de cobre ............................................................. 65
Figura 43 Desagrupamiento por Celdas: Cell Declustering ...................................................... 66
Figura 44 Ponderadores de celdas ............................................................................................. 67
Figura 45 Celda 1A y sus respectivas muestras.......................................................................... 67
Figura 46 Ponderadores de celdas ............................................................................................. 68
Figura 47 Distribución de media y desviación estándar. ........................................................... 68
Figura 48 Construcción grafica de la anamorfosis Gaussiana .................................................. 69
Figura 49 Construccion de la anamorfosis con ayuda de las funciones de distribución
F(variable original) y G (variable Gaussiana). ........................................................................... 70
Figura 50 Función de anamorfosis. En este ejemplo (variable Z con una distribución
lognormal), se trata de una función exponencial. ........................................................................ 71
Figura 51 Determinación de la anamorfosis empírica ............................................................... 73
Figura 52 Función de anamorfosis empírica .............................................................................. 73
Figura 53 Anamorfosis empírica (línea punteada) y modelada (línea continua) ........................ 74
Figura 54 Nubes de correlación diferida en forma de elipses ..................................................... 76
Figura 55 Realizaciones de cuatro modelos de función aleatoria. Sólo el modelo en la lámina A
es compatible con la distribución multi-Gaussiana, pues no presenta agrupación espacial de los
valores extremos. .......................................................................................................................... 78
GEOESTADÍSTICA 9
Figura 56 Sesgo en la reproducción del variograma producido por el algoritmo secuencial
implementado con una vecindad móvil ......................................................................................... 82
Figura 57 Secuencia de una Simulación Gaussiana .................................................................... 83
GEOESTADÍSTICA 10
Índice de Tablas
Tabla 1 Resultados ...................................................................................................................... 25
Tabla 2 Resultados de las distancias de taladros......................................................................... 25
Tabla 3 Distancias entre los sitios ............................................................................................... 49
Tabla 4 Métodos y Características de la Simulación .................................................................. 58
GEOESTADÍSTICA 11
Resumen
La geoestadística es una rama de la estadística aplicada que se especializa en el análisis y la
modelación de la variabilidad espacial en ciencias de la tierra. Su objeto de estudio es el análisis
y la predicción de fenómenos en espacio y/o tiempo, tales como: ley de metales, porosidades,
concentraciones de un contaminante. El análisis estructural con variogramas es uno de los temas
más importantes de la geoestadística puesto que se encarga de la caracterización de la estructura
espacial de una propiedad o fenómeno regionalizado. Es el proceso en el marco del cual se
obtiene un modelo geoestadístico para la función aleatoria que se estudia. El análisis estructural
consiste en estimar y modelar una función que refleje la correlación espacial de la variable
regionalizada a partir de la adopción razonada de la hipótesis más adecuada acerca de su
variabilidad. En dependencia de las características de estacionariedad del fenómeno se modelará
la función de covarianzas o la de semivarianzas. Por su importancia y generalidad estudiaremos
el proceso de estimación y modelación de la función de semivarianzas o semivariograma.
Palabras Clave: semivariograma, variable regionalizada, modelo geoestadístico, análisis
estructural, correlación espacial.
GEOESTADÍSTICA 12
Objetivo
Objetivo General
• El objetivo general de este trabajo comprende definir la geoestadística, el proceso de
implementación de estimación y simulación de variables continuas y categóricas, al variar
en el espacio las proporciones de las categorías.
Objetivos Específicos
• Se espera cuantificar la incertidumbre en la extensión espacial de unidades geológicas a
través de propuesta de variante al kriging ordinario y simulación condicional de indicadores
con medias localmente variables.
• Tener un conocimiento solido sobre las herramientas geoestadísticas como el variograma,
kriging ordinario y simulación condicional.
GEOESTADÍSTICA 13
Capítulo I: Marco Teórico
1.1. Reseña Histórica
La Geoestadística surge en la década del 50 a partir de estudios previos de H. Sichel,
D.G. Krige, y B. Matern, con el objetivo de obtener una mayor precisión en la estimación de
las reservas minerales. Su punto de partida es el análisis de los fenómenos distribuidos en el
espacio, por ejemplo, la mineralización. La evolución de la Geoestadística se ha dividido en
algunas generaciones (Matheron, y Kleingeld,1987), las cuales son:
• La Geoestadística Lineal 1945-1965, la ciencia, ahora llamada Geoestadística, tuvo su
comienzo en los trabajos de H.S. Sichel en 1947 y 1949, en la aplicación de la
distribución lognormal en minas de oro, seguido por la contribución de D.G. Krige en la
aplicación del análisis de regresión entre muestras, los cuales fijaron la base de la
Geoestadística Lineal, además de la introducción de la teoría de funciones aleatorias por
B. Matern en el estudio de la variación espacial. La generación de la Geoestadística
Lineal culmina en el trabajo de G. Matheron en su tesis doctoral de 1965 titulada: "Las
variables regionalizadas y su estimación".
• La Geoestadística No Lineal 1966-1974, en mayo de 1968, fue creado en Fontainebleau
el Centro de Geoestadística, según Matheron (1987). Importantes contribuciones fueron
hechas en este período por los autores M. David, A.G. Journel, Ch. J. Hiujbregts, P.
Delfiner, P. Chauvet y J.P. Chiles y muchos otros autores.
• La tercera generación 1974-1987, estuvo dedicada a resolver problemas más complejos,
Matheron introduce el modelo de Kriging, la primera aplicación práctica del Kriging fue
desarrollada por A. Maréchal en 1975. Durante este período, fue también desarrollado
por A.G.Jounel el Kriging de Indicadores y una forma especial de Kriging Disyuntivo.
GEOESTADÍSTICA 14
En la actualidad, los métodos Geoestadísticos han sido extendidos a los más diversos
campos de la Ciencias de la Tierra. El desarrollo de la informática moderna ha propiciado
condiciones para su divulgación y su aplicación a un grupo cada vez mayor de problemas,
pueden encontrarse en el mercado informático programas profesionales que ofrecen
opciones para la aplicación de estas técnicas.
Hoy por hoy, los dominios de aplicación de la Geoestadística son amplios, ya que, a
partir del estudio de la variabilidad de sus variables, se obtienen elementos para predecir sus
características. Además de la minería que es el campo que le dio origen, se pueden
mencionar otras áreas de estudio tales como: el petróleo, (estimaciones de sismos), la pesca
(estimación provisiones de peces, profundidad, temperatura del agua), la salud (distribución
espacial de enfermedades) ingeniería civil (obras de grandes dimensiones que exigen del
conocimiento de la variabilidad espacial del terreno), las finanzas (relación entre el análisis
técnico con el análisis económico), la cartografía, la hidrogeología, el medio ambiente, entre
otros.
En su surgimiento y desarrollo hay tres elementos importantes que destacar: la
consolidación de la Geoestadística con los trabajos de G. Matheron en 1965, D.G. Krige, el
establecimiento de la escuela de Fontainebleau, y finalmente el desarrollo de la
Geoestadística asociada con la informática.
1.2.Geoestadística
Geoestadística es una ciencia que comprende un conjunto de herramientas y técnicas
que sirven para analizar y predecir los valores de una variable que está distribuida en el
espacio de una forma continua, es conocida también como estadística espacial. La aplicación
de la geoestadística está orientada a los SIG “Sistemas de información Geográfica”
GEOESTADÍSTICA 15
(Conjunto de programas informáticos que sirven para captar, almacenar, recuperar,
transformar, Mostrar y analizar diversos tipos de datos espaciales), por esto se la puede
definir también como estadística relacionada con datos geográficos. Para realiza un trabajo
estadístico es necesario llevar a cabo los pasos siguientes:
1.2.1. Análisis Exploratorio De Los Datos
Básicamente es una etapa de aplicación de la estadística, se estudian los datos
puros sin tener en cuenta su distribución geográfica en el espacio. Se verifica la
normalidad de los datos y se aplica la transformada de los datos si fuera necesario.
1.2.2. Análisis Estructural
Se estudia la continuidad espacial, es indispensable conocer la distribución
geográfica de las variables para realizar esta etapa del estudio. Se calculan los
variogramas que expliquen la variabilidad espacial y se ajustan a un variograma
teórico.
1.2.3. Variable Regionalizada
Es una función que describe un fenómeno natural geográficamente
distribuido. El dato inicial obtenido es conocido como variable aleatoria, además de
su valor este dato está distribuido en el espacio y tiene coordenadas geográficas, por
esta característica es conocido como variable regionalizada.
Variable Regionalizada, matemáticamente es una función z(x) donde x es un
punto o un vector en Rn, representando a una función aleatoria Z(x). La finalidad es
encontrar las características de la función Z(x) para hacer las estimaciones de
posibles puntos desconocidos. Variable Regionalizada presenta una estructura
espacial de correlación (autocorrelación). Toda variable regionalizada está formada
GEOESTADÍSTICA 16
por dos componentes, una estructurada (marca la relación entre el valor de la variable
y puntos próximos) y una segunda componente aleatoria (representa un valor
desconocido).
1.2.4. Estacionariedad
Es la base de la estadística, hace referencia al valor de una variable entre
pares de muestras (puntos) es similar a lo largo del yacimiento y que depende de la
distancia y orientación entre los pares de muestreo.
1.2.5. Curva Tonelaje Ley
La curva de Tonelaje Ley es una representación gráfica del inventario de
material en términos de tonelaje y ley en leyes de corte específicos. La gráfica es una
gráfica bidimensional con un eje x y dos ejes y. Los ejes Y izquierdo y derecho se
utilizan para leer el tonelaje y la ley promedio, respectivamente.
1.2.6. Decluster o Desagrupamiento
El desagrupamiento o “declustering” se emplea para calcular el histograma y
las estadísticas generales corrigiendo los efectos provocados por las irregularidades
de la malla de muestreo. La idea central consiste en que las muestras espacialmente
cercanas deben ser ponderadas en menor medida que aquellas más aisladas.
1.2.7. Estimación de Kriging
El estimador de kriging como tal es una combinación de variables aleatorias y
por tanto una cantidad aleatoria, el área o vecindad donde se realiza la estimación
kriging se desarrolla de manera general en zonas de búsqueda sobre todos los nodos
de la grilla que cubre el bloque definiéndose la forma y tamaño de vecindad que
GEOESTADÍSTICA 17
estará en función a los datos disponibles y la forma en función a la anisotropía de la
variable.
1.2.8. Estudio Variográfico
Tiene como objetivo conocer la continuidad espacial de la variable en
estudio, debido a que los valores observados en distintos puntos del espacio pueden
estar correlacionados. Para desarrollar este estudio se utiliza una función llamada
variograma, el cual representa el análisis de la variabilidad espacial de los valores
que toma la variable de estudio. Los parámetros que se deben especificar en la
construcción de un variograma experimental son; (a) dirección de interés; (b)
distancia de interés paso “Lag”; (c) tolerancia en la dirección, tolerancia angular y
ancho de banda y (d) tolerancia en las distancias.
GEOESTADÍSTICA 18
Capítulo II: Variograma
El variograma es la herramienta geoestadística básica. Permite la cuantificación de los
parámetros geológicos y expresa la correlación espacial entre los valores muestreados. El
variograma puede ser estimado a partir de datos experimentales (por ejemplo, las leyes
provenientes de una campaña de muestreo) empleando la fórmula general. El variograma es una
función que constituye la herramienta fundamental de la geoestadística.
Sean “x” y “x + h” dos puntos en el espacio:
Figura 1
Dos puntos a la distancia vectorial h.
Nota. Representación de dos puntos a la distancia vectorial h en el espacio. Tomado de Alfaro, 2007, Cgensmp
(http://cg.ensmp.fr).
Entonces el variograma puede entenderse como el momento de inercia sobre la línea x-y,
por ende, el brazo de ese momento en un punto dado puede calcularse geométricamente como:
GEOESTADÍSTICA 19
Figura 2
Relación entre lados de un triangulo
Nota. Momento de inercia sobre la línea x-y. Tomado de Sánchez, 2017,
(http://drluisalejandrosanchez.blogspot.com/ ).
Ahora considerando el cálculo del cuadro de los brazos promedio para varios pares de puntos.
Figura 3
Cálculo del cuadro de los brazos promedio
Nota. Promedio para varios pares de puntos. Tomado de Sánchez, 2017,(
http://drluisalejandrosanchez.blogspot.com/).
La definición teórica de la función variograma γ(h) es la siguiente fórmula:
1 2
⃗ ) = 𝐸 [(𝑍(𝑥 + ℎ
𝛾(ℎ ⃗ ) − 𝑍(𝑥 )) ]
2
Sin embargo, en la práctica siempre se utiliza el algoritmo siguiente:
GEOESTADÍSTICA 20
1
𝛾(ℎ⃗) = 𝑃𝑟𝑜𝑚𝑒𝑑𝑖𝑜{(𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎𝑠)2 𝑑𝑒 𝑙𝑒𝑦𝑒𝑠 𝑒𝑛 𝑝𝑢𝑛𝑡𝑜𝑠𝑞𝑢𝑒 𝑒𝑠𝑡á𝑛 𝑎 𝑙𝑎 𝑑𝑖𝑠𝑡𝑎𝑛𝑐𝑖𝑎 ℎ⃗}
2
Esta ecuación es la que hay que adaptar en cada situación práctica (mallas regulares e
irregulares en el espacio de n dimensiones, n = 1, 2, 3). Las propiedades de γ(h), que se deducen
fácilmente de la definición son:
𝛾(0) = 0
𝛾(ℎ) ≥ 0
⃗ ) = 𝛾(ℎ
𝛾(−ℎ ⃗)
2.1. Elementos Del Variograma
2.1.1. Efecto Nugget (Co)
Por lo general, el variograma no tiende a cero como lo hace la distancia h, el
efecto nugget es una discontinuidad de salto en el origen conocido también como
efecto Pepita, representa la discontinuidad en el semivariograma para distancias que
sean menores que la menor distancia dada entre los puntos muestrales. Esta
discontinuidad se puede dar también debido a errores en la medición o a una pobre
precisión analítica.
2.1.2. Sill (C)
El sill conocido también como La “Meseta” es el valor máximo que alcanza
el semivariograma cuando la variable es estacionaria. Teóricamente, la meseta
coincide con el valor de la varianza y por tanto un buen estimador de la misma será
la varianza experimental de los datos.
2.1.3. Rango (a)
Conocido también como Alcance, el Rango es la distancia a la cual el
variograma se estabiliza y las muestras se relacionan espacialmente.
GEOESTADÍSTICA 21
2.1.4. Meseta (Ct)
Es el valor tal que Co + C = Meseta
Figura 4
Elementos Del Variograma
Nota. El grafico representa a los elementos del variograma. Tomado de Goovaerts,1997, Oxford
University.
2.2.Cálculo Del Variograma Experimental
La función variograma o semivariograma, define la correlación espacial entre los
valores muestreados. El variograma o semivariograma se obtiene calculando, para cada
distancia de separación entre las muestras. “Lag” en una determinada dirección, la diferencia
al cuadrado de los valores de dichas muestras. Es decir, para cada separación “h” se calcula
el valor de y’(h) mediante la fórmula:
1
𝛾 ′ (ℎ) = ∑[𝑓(𝑋1 ) − 𝑓(𝑋1+ℎ )]2
2𝑁
Donde:
N: Número de pares de datos
f(x1) : El valor de la variable regionalizada en el punto i.
f(x1+h) : El valor de la variable regionalizada tomada a una distancia h.
GEOESTADÍSTICA 22
Figura 5
Intervalo mínimo del muestreo
Nota. Representación de Intervalo mínimo del muestreo LAG. Tomado de Alfaro, 2007, Cgensmp
(http://cg.ensmp.fr).
LAG: Espaciado con que se calculan las diferencias al cuadrado entre muestras.
Ejemplo: LAG1 incluye las muestras adyacentes A y B, B y C, C y D, etc. La distancia que
representa el LAG,1 es el intervalo mínimo del muestreo.
Figura 6
Muestra de cálculo de LAG2.
Nota. Representación de Intervalo mínimo del muestreo LAG 1. Tomado de Alfaro, 2007, Cgensmp
(http://cg.ensmp.fr).
Ejemplo: LAG2 requiere que se calcule las diferencias al cuadrado entre muestras
alternativa A y C, B y D, C y E, etc. Y así sucesivamente.
GEOESTADÍSTICA 23
Figura 7
Muestra de cálculo de LAGs.
Nota. Representación de Intervalo mínimo del muestreo LAG 2. Tomado de Alfaro, 2007, Cgensmp
(http://cg.ensmp.fr).
El número máximo de LAGs, es decir, de distancias n para calcular el Y´(h) suele
establecerse en la mitad de la distancia muestreada.
Longitudes mayores generan pocos pares de muestras por lo que estadísticamente no es
representativo. Se tienen 4 taladros de muestreo en una dirección determinada, calcular: a) el
variograma, b) Var. Relativo y c) el Var. Logarítmico.
Figura 8
Muestra de taladros en el muestreo.
Nota. Muestra de taladros en el muestreo. Tomado de Alfaro, 2007, Cgensmp (http://cg.ensmp.fr).
GEOESTADÍSTICA 24
a) El Variograma
1
𝛾 ′ (ℎ) = ∑[𝑓(𝑋1 ) − 𝑓(𝑋1+ℎ )]2
2𝑁
(10 − 50)2 + (50 − 20)2 + (20 − 60)2
𝛾(1) = = 683.3
2∗3
(10 − 20)2 + (50 − 60)2
𝛾(2) = = 50
2∗2
(10 − 60)2
𝛾(3) = = 1250
2∗1
2N: 2 (Número de pares), en este caso es tres pares.
Figura 9
Variograma de taladros en el muestreo
1400
1200
1000
800
y(h)
600
400
200
0
1 2 3
h
Nota. Representación de Variograma de taladros en el muestreo. Tomado de Alfaro, 2007, Cgensmp
(http://cg.ensmp.fr).
b) Variograma relativo
10 + 50 + 20 + 60
𝑋1 = = 35
4
10 + 50 + 20 + 60
𝑋2 = = 35
4
10 + 60
𝑋3 = = 35
2
GEOESTADÍSTICA 25
Tabla 1
Resultados
h 𝛾(ℎ) X 𝑋2 𝛾(ℎ)/𝑋 2
1 683.3 35 1225 0.56
2 50 35 1225 0.041
3 1250 35 1225 1.02
Nota. Resultados de las ecuaciones aplicadas. Tomado de Alfaro, 2007, Cgensmp (http://cg.ensmp.fr).
Figura 10
Variograma relativo.
1,2
0,8
y(h)/x 2
0,6
0,4
0,2
0
1 2 3
h
Nota: Representación de variograma relativo. Tomado de Alfaro, 2007, Cgensmp (http://cg.ensmp.fr).
c) Variograma logarítmico
Análisis estructural mediante variogramas:
Tabla 2
Resultados de las distancias de taladros
Z(x) 10 50 20 60
LN(Z(x)) 2.30 3.91 2.96 4.09
Nota. Resultados de las ecuaciones aplicadas. Tomado de Alfaro, 2007, Cgensmp (http://cg.ensmp.fr).
GEOESTADÍSTICA 26
(2.30 − 3.91)2 + (3.91 − 2.96)2 + (2.96 − 4.09)2
𝛾(1) = = 0.81
2∗3
(2.30 − 2.96)2 + (3.91 − 4.09)2
𝛾(2) = = 0.11
2∗2
(2.30 − 4.09)2
𝛾(3) = = 1.61
2∗1
Figura 11
Variograma logarítmico.
0.9
0.8
0.7
0.6
0.5
y(h)
0.4
0.3
0.2
0.1
0
1 2 3
h
Nota. Representación de variograma logarítmico. Tomado de Alfaro, 2007, Cgensmp (http://cg.ensmp.fr).
2.2.1. Cálculo Del Semivariograma Experimental
• El semivariograma experimental, posee numerosas zonas donde no existen valores
concretos.
• Únicamente existen valores definidos en aquellos lugares donde se ha realizado el
muestreo.
• Por lo tanto, es necesario definir el valor de la variable en puntos donde el
semivariograma experimental no ofrece información suficiente.
• Para ello es necesario construir un modelo que nos permita obtener dicha
información.
GEOESTADÍSTICA 27
2.3.Modelos Teóricos Del Variograma
Los modelos teóricos se ajustan a un modelo de variograma experimental y son
capaces de explicar los diferentes comportamientos que pueden tener las variables en el
espacio. Los modelos más comunes son El Efecto Pepita Puro, Gaussiano, Potencia y
Exponencial. Las dos características más importantes en el modelado de Variogramas son:
• Su comportamiento en el origen, el cual puede ser lineal, parabólico y con efecto de
pepita
• La presencia o ausencia de meseta.
2.3.1. Efecto Pepita Puro
Figura 12
Efecto Pepita
Nota. Modelo Efecto Pepita representa un fenómeno completamente aleatorio. Tomado de
Goovaerts,1997, Oxford University.
El modelo Efecto Pepita representa un fenómeno completamente aleatorio,
conocido también como ruido blanco, en el cual no hay correlación espacial en las
muestras independiente de cuál sea la distancia h que las separe. S representa el valor
del sill.
La discontinuidad aparente que se aprecia cerca del origen, se le conoce como
efecto de pepita, este efecto puede deberse a la presencia de micro estructuras, y
artificialmente se puede generar por errores en el muestreo (toma de muestras,
GEOESTADÍSTICA 28
preparación, manipulación y análisis de leyes) y también debido a las tasas de
recuperación. Este nombre común en el lenguaje geoestadístico tiene sus raíces en
los yacimientos auríferos de África del Sur – presencia de pepitas de oro-, que al
representar en un plano la ley versus la distancia se obtiene el gráfico.
Figura 13
Efecto Pepita en yacimiento aurífero
Nota. Presencia de microestructuras en yacimiento aurífero Núñez, 2001, Lima - Perú.
2.3.2. Modelo Exponencial
Figura 14
Modelo Exponencial
GEOESTADÍSTICA 29
Nota. Modelo exponencial, podemos observar que crece inicialmente más rápido y después se
estabiliza de forma asintótica. Tomado de Goovaerts,1997, Oxford University.
En este modelo podemos observar que crece inicialmente más rápido y
después se estabiliza de forma asintótica. Como la meseta no se alcanza a una
distancia finita, se usa con fines prácticos el “alcance efectivo” o “alcance práctico”,
se considera que el rango a, es la distancia para la cual el valor del variograma es el
95% de la meseta.
2.3.3. Modelo Esférico
Figura 15
Modelo Esférico
Nota. Modelo esférico, es una expresión polinomial simple. Tomado de Goovaerts,1997, Oxford
University.
Por lo general es de todos los modelos el más utilizado para análisis
geoestadístico, es una expresión polinomial simple, en el gráfico se puede observar
GEOESTADÍSTICA 30
un crecimiento casi lineal y después a cierta distancia finita del origen se alcanza una
estabilización, la meseta.
2.3.4. Modelo Gaussiano
Figura 16
Modelo Gaussiano
Nota. Representación de un comportamiento parabólico en el origen. Tomado de Goovaerts,1997,
Oxford University.
Este es un modelo continuo, inicialmente presenta un comportamiento
parabólico en el origen, después al igual que en el modelo Exponencial se alcanza la
meseta de forma asintótica. Constituye el único modelo estacionario con un punto de
inflexión.
2.3.5. Modelo Potencia
GEOESTADÍSTICA 31
Este es un modelo sin meseta, su forma se representa con la intersección de
tres líneas. Se aproxima a un comportamiento parabólico conforme p tiende a 2.
Figura 17
Modelo Potencia
Nota. Modelo Potencia representa la intersección de tres líneas. Tomado de Goovaerts,1997, Oxford
University.
2.3.6. Modelo Lineal
Figura 18
Modelo Lineal
Nota. Modelo utilizado para modelar fenómenos que presentan capacidad infinita de dispersión.
Tomado de Goovaerts,1997, Oxford University.
GEOESTADÍSTICA 32
El modelo Lineal no tiene sill ni rango. El sill continúa aumentando mientras la
distancia h aumenta, es utilizado para modelar fenómenos que presentan capacidad
infinita de dispersión.
2.4.Variograma Omnidireccional
Es aquel que no depende de la dirección, se obtiene al escoger la tolerancia angular
Δθ de forma tal que las direcciones θ + Δθ y θ – Δθ y sean opuestas y perpendiculares a la
dirección θ. Se puede pensar como el promedio del variograma experimental en todas las
direcciones posibles.
2.5.Isotropía
Un fenómeno se dice isótropo cuando la magnitud del vector h permanece constante
cualquiera sea la dirección (θ) del vector, es decir, la variabilidad es simétrica.
En este caso es suficiente ajustar el variograma omnidireccional (γ(θomni., h ).
Figura 19
Direcciones del semivariograma similar
GEOESTADÍSTICA 33
Nota. Comportamiento del semivariograma es similar para las cuatro direcciones consideradas. Tomado de
Nuñez, 2001, Lima - Perú.
2.6.Anisotropía
Anisotropía se da generalmente cuando el variograma experimental es calculado en
diferentes direcciones y este presenta distintos comportamientos con la variación de la
distancia, para conocer si tenemos existencia de anisotropía o no es recomendable hacer uso
del diagrama de rosa. Existen 3 tipos de anisotropía Geométrica, zonal e híbrida.
2.6.1. Anisotropía geométrica
Es aquella en la que el variograma en distintas direcciones presenta el mismo
sill pero rangos distintos. Presenta mayor continuidad espacial en la dirección de
mayor rango y menor continuidad espacial en la dirección de menor rango.
Figura 20
Anisotropía Geométrica
GEOESTADÍSTICA 34
Nota. Representación de variograma en distintas direcciones presenta el mismo sill pero rangos
distintos. Tomado de Goovaerts,1997, Oxford University.
2.6.2. Anisotropía zonal
Es aquella en la que el variograma en distintas direcciones presenta el mismo
rango, pero diferente sill.
Figura 21
Anisotropía Zonal
Nota. Representación de variograma en distintas direcciones presenta el mismo rango, pero diferente
sill. Tomado de Goovaerts,1997, Oxford University.
2.6.3. Anisotropía híbrida
GEOESTADÍSTICA 35
Es aquella en la que el variograma en distintas direcciones presenta rangos
diferentes y distintos sill.
Figura 22
Anisotropía Híbrida
Nota. Representación de variograma en distintas direcciones presenta rangos diferentes y distintos sill.
Tomado de Goovaerts,1997, Oxford University.
2.7.Casos particulares respecto a los modelos de semivariograma
2.7.1. Semivariograma con tendencias
Cuando existe ruptura de estacionariedad (cambio en la tendencia de la
meseta) Se produce unan distancia superior al alcance. No tiene incidencia en la
estimación local de los bloques definidos para el yacimiento. Cuando este tipo de
semivariograma domina, es necesario utilizar la técnica de Krigeage universal, en
lugar de krigeage ordinario que se aplica en las situaciones de estacionariedad.
Figura 23
Semivariograma con tendencias.
GEOESTADÍSTICA 36
Nota. Representación de Semivariograma con tendencias. Tomado de Henao,2011, Universidad
Nacional Colombia.
2.7.2. Semivariograma con efecto agujero
Este efecto ocurre cuando se alternan áreas con alta ley y áreas con baja ley. El
resultado es una pseudoperiocidad, reflejada en una oscilación de semivariograma
alrededor de una aparente meseta. Aplicación en yacimientos aluviales.
Figura 24
Semivariograma con efecto agujero.
Nota. Alternación de áreas con alta ley y áreas con baja ley. Tomado de Henao,2011, Universidad
Nacional Colombia.
2.7.3. Semivariograma compuesto
GEOESTADÍSTICA 37
Esta situación aparece cuando se obtienen diferentes semivariogramas a lo
largo de diversas direcciones del yacimiento. Esto significa que en vez de tener un
área de búsqueda isótropa (círculo o esfera) se posee una zona elíptica o elipsoidal.
Esto es evidente en yacimientos aluviales, donde se tiene alcance en dirección
perpendicular al yacimiento.
Figura 25
Semivariograma compuesto.
Nota. Representación de Semivariograma compuesto. Tomado de Henao,2011, Universidad Nacional
Colombia.
2.8. Cálculo Del Variograma A Malla Irregular
Un muestreo de puntos como el de la figura, conlleva a que los variogramas en las
direcciones N-S y E-W, no encuentren ninguna o pocas parejas debido a la irregularidad del
muestreo, este hecho es frecuente en fenómenos geológicos-mineros. En tales
circunstancias, al calcular el variograma, se toman en cuenta ciertos aspectos, como:
Figura 26
Variograma a malla irregular
GEOESTADÍSTICA 38
Nota. Calculo del variograma a malla irregular en dos dimensiones. Tomado de Nuñez, 2001, Lima -
Perú.
Generar ventanas horizontales y verticales, de tal manera que permitan aceptar los
compósitos como pares válidos en una cierta dirección, aunque ellos no estén ubicados
exactamente en ella. Por ejemplo, si calculamos un variograma en la dirección E-W con una
ventana de 15° , significa que las ventanas abarcarán compósitos en ±15° con respecto a la
dirección E-W (véase la siguiente figura). Entender que los anchos de banda son regiones
que toman como referencia a la línea de la dirección del variograma en el cual se localizan
los pares bajo una tolerancia angular establecida (referencia figura adjunta).
Figura 27
Variograma en la dirección E-W con una ventana de 15°
GEOESTADÍSTICA 39
Nota. Calculo de variograma en la dirección E-W con una ventana de 15°. Tomado de Nuñez, 2001,
Lima - Perú.
Figura 28
Consideraciones para el computo del variograma
Nota. Combinación de sector con banda. Tomado de Nuñez, 2001, Lima - Perú.
Capítulo III: Kriging Ordinario
3.1. Definición De Kriging
GEOESTADÍSTICA 40
La palabra kriging (expresión anglosajona) procede del nombre del geólogo
sudafricano D. G. Krige, cuyos trabajos en la predicción de reservas de oro, realizados en la
década del cincuenta, suelen considerarse como pioneros en los métodos de interpolación
espacial. Kriging encierra un conjunto de métodos de predicción espacial que se
fundamentan en la minimización del error cuadrático medio de predicción.
Además, el kriging se divide en 2 tipos de predictor lineal y no lineal, en este caso, el
kriging ordinario se encuentro en lineal, siendo una de sus propiedades que son óptimos si
hay normalidad multivariada y es independiente de la distribución son los mejores
predictores linealmente insesgados.
3.2. Hipótesis Del Kriging Ordinario
Suponga que se hacen mediciones de la variable de interés Z en los puntos xi, i= 1,
2,..., n, de la región de estudio, es decir se tienen realizaciones de las variables Z(x1),...,
Z(xn), y se desea predecir Z(x0), en el punto x0 donde no hubo medición. En esta
circunstancia, el método kriging ordinario propone que el valor de la variable puede
predecirse como una combinación lineal de las n variables aleatorias así:
Z*(x0) = λ1 Z(x1) + λ2 Z(x2) + λ3 Z(x3) + λ4 Z(x4) + λ5 Z(x5) + . . . + λn Z(xn)
= ∑𝑛𝑖=1 𝜆𝑖 𝑍(𝑥𝑖 )
En donde los representan los pesos o ponderaciones de los valores originales.
Dichos pesos se calculan en función de la distancia entre los puntos muestreados y el punto
donde se va a hacer la correspondiente predicción. La suma de los pesos debe ser igual a uno
para que la esperanza del predictor sea igual a la esperanza de la variable. Esto último se
conoce como el requisito de insesgamiento. Estadísticamente la propiedad de insesgamiento
se expresa a través de:
GEOESTADÍSTICA 41
E(Z*(x0)) = E(Z (x0))
Asumiendo que el proceso es estacionario de media m (desconocida) y utilizando las
propiedades del valor esperado, se demuestra que la suma de las ponderaciones debe ser
igual a uno:
𝑛
𝐸(∑ 𝜆𝑖 𝑍(𝑥𝑖 )) = 𝑚
𝑙=1
∑ 𝜆𝑖 𝐸(𝑍(𝑥𝑖 )) = 𝑚
𝑙=1
∑ 𝜆𝑖 𝑚 = 𝑚
𝑙=1
𝑛 𝑛
𝑚 ∑ 𝜆𝑖 = 𝑚 → ∑ 𝜆𝑖 = 1
𝑙=1 𝑙=1
Se dice que Z*(x0) es el mejor predictor, lineal en este caso, porque los pesos se
obtienen de tal manera que minimicen la varianza del error de predicción, es decir que
minimicen la expresión:
V(Z*(x0)-Z(x0))
Esta última es la característica distintiva de los métodos kriging, ya que existen otros
métodos de interpolación como el de distancias inversas o el poligonal, que no garantizan
varianza mínima de predicción (Samper y Carrera, 1990). La estimación de los pesos se
obtiene minimizando
V[Z*(x0) - Z(x0)] sujeto a ∑𝑛𝑙=1 𝜆𝑖 = 1.
Se tiene que V[Z*(x0) - Z(x0)] = V[Z*(x0)] – 2COV [Z*(x0), Z(x0)] + V[Z(x0)]
Desagregando las componentes de la ecuación anterior se obtiene los siguiente:
GEOESTADÍSTICA 42
𝑛 𝑛 𝑛
V[Z ∗ (𝑥0 )] = V[∑ 𝜆𝑖 𝑍(𝑥𝑖 )] = ∑ ∑ 𝜆𝑖 𝜆𝑗 𝐶𝑂𝑉[𝑍(𝑥𝑖 ), 𝑍(𝑥𝑗 )]
𝑖=1 𝑖=1 𝑗=1
En adelante se usará la siguiente notación: COV[Z(xi ), Z(x j )] = Cij y V[Z( x0)]=
De lo anterior COV [Z ∗ (x0), Z(x0)] = COV[∑𝑛𝑖=1 𝜆𝑖 𝑍(𝑥𝑖 ), 𝑍(𝑥0 )
𝑛 𝑛
= ∑ 𝜆𝑖 𝐶𝑂𝑉[𝑍(𝑥𝑖 ), 𝑍(𝑥0 )] = ∑ 𝜆𝑖 𝐶𝑖0
𝑖=1 𝑖=1
Entonces reemplazando, se tiene que:
𝑛 𝑛 𝑛
V[Z ∗ (x0) − Z(x0)] = ∑ ∑ 𝜆𝑖 𝜆𝑗 𝐶𝑖𝑗 − 2 ∑ 𝜆𝑖 𝐶𝑖0 + 𝜎 2 (0)
𝑖=1 𝑗=1 𝑖=1
Luego se debe minimizar la función anterior sujeta a la restricción ∑𝑛𝑖=1 𝜆𝑖 = 1. Este
problema de minimización con restricciones se resuelve mediante el método de
multiplicadores de Lagrange.
Siguiendo el procedimiento acostumbrado para obtener valores extremos de una función, se
deriva e iguala a cero, en este caso con respecto a 𝜆𝑖 𝑦 𝜇:
De manera análoga se determinan las derivadas con respecto a 2 , ..., n:
GEOESTADÍSTICA 43
por último, derivamos con respecto a
De (1), (2), (3), (4) resulta un sistema de (n + 1) ecuaciones con (n + 1) incógnitas, que
matricialmente puede ser escrito como:
Por lo cual los pesos que minimizan el error de predicción se determinan mediante la
función de covariograma a través de:
= Cij -1 Ci0
Encontrando los pesos se calcula la predicción en el punto x0. De forma análoga se procede
para cada punto donde se quiera hacer predicción.
3.3. Varianza De Predicción Del Kriging Ordinario
GEOESTADÍSTICA 44
Multiplicando (1), (2) y (3) por se obtiene:
Sumando las n ecuaciones
Sustituyendo la expresión anterior en (0)
3.4. Estimación De Ponderaciones Por Medio De La Función De Semivarianza
Los pesos pueden ser estimados a través de la función de semivarianza, para lo
cual se requiere conocer la relación entre las funciones de covariograma y de semivarianza.
Antes de esto conveniente tener en cuenta la siguiente notación:
= V((x)) ij = (h) donde h es la distancia entre los puntos i y j y análogamente Cij =
C(h).
La relación entre las dos funciones en cuestión es la siguiente:
GEOESTADÍSTICA 45
Reemplazando (6) en (1), (2) y (3) se determinan los pesos óptimos en términos de la
función de semivarianza:
Similarmente,
El sistema de ecuaciones se completa con (4). De acuerdo con lo anterior los pesos se
obtienen en términos del semivariograma a través del sistema de ecuaciones:
GEOESTADÍSTICA 46
Para establecer la expresión de la correspondiente varianza del error de predicción en
términos de la función de semivarianza se reemplaza (6) en (5), de donde:
Los pesos de kriging ordinario también pueden ser estimados mediante el uso del
correlograma aplicando la siguiente relación: ij = Cij , caso en el que la correspondiente
varianza de predicción estaría dada por (Isaaks y Srivastava, 1989):
3.5. Validación Del Kriging
Existen diferentes métodos para evaluar la bondad de ajuste del modelo de
semivariograma elegido con respecto a los datos muestrales y por ende de las predicciones
hechas con kriging. El más empleado es el de validación cruzada, que consiste en excluir la
observación de uno de los n puntos muestrales y con los n-1 valores restantes y el modelo de
GEOESTADÍSTICA 47
semivariograma escogido, predecir vía kriging el valor de la variable en estudio en la
ubicación del punto que se excluyó. Se piensa que, si el modelo de semivarianza elegido
describe bien la estructura de autocorrelación espacial, entonces la diferencia entre el valor
observado y el valor predicho debe ser pequeña. Este procedimiento se realiza en forma
secuencial con cada uno de los puntos muestrales y así se obtiene un conjunto de n “errores
de predicción”. Lo usual es calcular medidas que involucren a estos errores de predicción
para diferentes modelos de semivarianza y seleccionar aquel que optimice algún criterio
como por ejemplo el del mínimo error cuadrático medio (MECM). Este procedimiento es
similar a la conocida técnica de remuestreo Jacknife (Efron, 1982) empleada en diversos
contextos estadísticos para calcular varianzas de estimación, entre otros aspectos. Una forma
descriptiva de hacer la validación cruzada es mediante un gráfico de dispersión de los
valores observados contra los valores predichos. En la medida en que la nube de puntos se
ajuste más a una línea recta que pase por el origen, mejor será el modelo de semivariograma
utilizado para realizar el kriging.
3.6. Representación De Las Predicciones
Una vez se ha hecho la predicción en un conjunto de puntos diferentes de los
muestrales vía kriging, se debe elaborar un mapa que dé una representación global del
comportamiento de la variable de interés en la zona estudiada. Los más empleados son los
mapas de contornos, los mapas de residuos y los gráficos tridimensionales. En el caso de los
mapas de contornos, en primer lugar, se divide el área de estudio en un enmallado y se hace
la predicción en cada uno de los nodos de éste mismo. Posteriormente se unen los valores
predichos con igual valor, generando así las líneas de contorno (isolíneas de distribución).
Este gráfico permite identificar la magnitud de la variable en toda el área de estudio. Es
GEOESTADÍSTICA 48
conveniente acompañar el mapa de interpolaciones de la variable con los correspondientes
mapas de isolíneas de los errores y de las varianzas de predicción (posiblemente estimados a
través de métodos matemáticos), con el propósito de identificar zonas de mayor
incertidumbre respecto a las predicciones.
3.7. Intervalos De Confianza
Asumiendo que los errores de predicción siguen una distribución normal estándar y
que son independientes, un intervalo de confianza del 100(1-) , 0< <1, para Z(x) es: [Z
* (x) – Z1-/2 k , Z * (x) + Z1-/2 k] con Z * (x) el valor calculado de la predicción y Z1-/2 el
percentil de una normal estándar.
3.8. Ejemplo de Aplicación del Kriging Ordinario
Suponga que se tiene una configuración de datos como la que se presenta en el
esquema de abajo. Con base en siete datos observados (valores al lado del signo + por fuera
de los círculos numerados de 1 a 7) se quiere predecir un valor de la variable en el punto
donde se encuentra el signo de interrogación, por fuera del circulo con el número cero.
Figura 29
Datos observados
GEOESTADÍSTICA 49
Nota. Configuración de datos con valores al lado del signo+ por fuera de los círculos enumerados de 1 a 7.
Tomado de Henao, R. 2011. Universidad Nacional de Colombia.
La matriz de distancia euclidianas entre los sitios es la siguiente:
Tabla 3
Distancias entre los sitios
Sitio 0 1 2 3 4 5 6 7
0 0.00 4.47 3.61 8.06 4.49 6.71 8.94 13.45
1 0.00 2.24 10.44 13.04 10.05 12.17 17.80
2 0.00 11.05 13.00 8.00 10.05 16.97
3 0.00 4.12 13.04 15.00 11.05
4 0.00 12.37 13.93 7.00
5 0.00 2.24 12.65
6 0.00 13.15
7 0.00
Nota. Se tomaron las distancias entre los sitios obteniendo estos valores. Tomado de Henao, R. 2011.
Universidad Nacional de Colombia.
Asumiendo que la estructura de correlación espacial entre los datos es estimada por
un modelo exponencial (h) =10 (1 − exp(− 3h/ 10))(pepita cero, meseta 10 y rango 10) o
en términos de la función de autocovarianza por C(h) =10 (exp(− 3h/ 10)), se encuentran las
siguientes matrices que permiten encontrar los pesos para la predicción:
GEOESTADÍSTICA 50
con base en el vector estimado de parámetros se encuentra que
Z0* = ∑7𝑖=1 𝜆𝑖 𝑍𝑖 = (0.173) (477) + (0.318) (696) + ... + (0.086) (783) = 592
Con k2 = 2 - ∑7𝑖=1 𝜆𝑖 𝐶𝑖0 − 𝜇 =10 − [(0.173) (2.61) +…+ (0.086) (0.18)]− 0.907 = 7.14218
3.9. Diferencias entre kriging simple y kriging ordinario
Las diferencias entre kriging simple y kriging ordinario suelen producirse en zonas
que poseen escasos datos y en situaciones de extrapolación, en cuyos casos: El kriging
simple acerca el valor estimado a la media, mientras que el kriging ordinario da una media
local calculada con los datos contenidos en la vecindad. El kriging simple a diferencia del
kriging ordinario, en este caso no existen restricciones para las ponderaciones tendientes al
cumplimiento de la condición de insesgamiento.
A) Kriging simple
• Estacionariedad de segundo orden.
• Media constante y conocida.
GEOESTADÍSTICA 51
• Difícilmente aplicable por requerir demasiado conocimiento de la variable.
• Siempre insesgado (sin ninguna restricción).
• No es preciso que se cumpla que ∑𝑛𝑖=1 𝜆𝑖 = 1
• Varianza menor a la de la variable en estudio sin regionalizar
B) Kriging Ordinario
• Media constante pero desconocida
• Puede usarse ya sea en presencia de estacionariedad de segundo orden o de
estacionariedad intrínseca
• Para cumplir la propiedad de insesgamiento, requiere ser sometido a la
restricción de que ∑𝑛𝑖=1 𝜆𝑖 = 1.
3.10. Ventaja del Kriging Ordinario
La ventaja de trabajar con este interpolador es que no solamente tiene en cuenta los
valores vecinos al momento de realizar la predicción, sino que realiza los cálculos en
función de la variabilidad espacial o llamada autocorrelación espacial asegurando la
mínima varianza.
3.11. Diferencias entre Kriging Ordinario y Simulación Condicional
El kriging permite estimar una variable regionalizada por medio de una
combinación lineal ponderada de los datos. Este estimador verifica las siguientes
propiedades:
1) Interpolación exacta: el kriging devuelve el valor medido en cada sitio con dato.
2) Insesgo: el error de estimación tiene una esperanza nula.
3) Precisión: el error de estimación tiene una varianza mínima.
GEOESTADÍSTICA 52
4) Suavizamiento (alisamiento): la dispersión de los valores estimados es menor que la
dispersión de los valores verdaderos. Esta propiedad tiene varias consecuencias:
• El variograma de los valores estimados no tiene efecto pepita, aunque no sea el caso
con los valores reales, y su meseta es menor que el variograma de los datos.
• La variabilidad de los valores estimados no es uniforme en el campo: disminuye al
alejarse de los sitios con datos (es decir, el mapa los valores estimados muestra más
dispersión en las zonas donde el muestreo es más denso y es más suave en las zonas
con escasos datos).
• El rango de los valores estimados suele ser menor que el rango de los valores reales;
por lo tanto, el kriging no permite predecir adecuadamente la ocurrencia de valores
extremos.
• No se puede manipular los valores estimados como si fueran los valores verdaderos.
Por ejemplo, la cantidad de valores estimados que superan un umbral determinado no
es la misma que la cantidad de valores reales sobre este mismo umbral. Dicho de otra
manera, existe un sesgo en la estimación de funciones que involucran a valores
umbrales (sólo hay insesgo cuando se estima la variable misma).
5) La varianza de kriging: no depende de los valores de los datos, sino que solamente de
su posición en el espacio y del modelo de variograma. Por lo tanto, no mide todas las
fuentes de incertidumbre: intuitivamente, la incertidumbre es mayor cuando los datos
tienen valores más dispersos que cuando tienen valores parecidos.
El principio de una simulación consiste en construir una variable ficticia que
reproduce la continuidad/variabilidad espacial de la variable regionalizada z = {z(x), x
D}. Esta construcción se basa en la interpretación de z como una realización particular de
GEOESTADÍSTICA 53
una función aleatoria Z = {Z(x), x D}. La idea es generar otras realizaciones de esta
función aleatoria. Mientras que el kriging y otros métodos de interpolación conducen a una
imagen suavizada de la realidad, las realizaciones de Z presentan la misma variabilidad
espacial que la variable regionalizada real, en particular, el mismo histograma y el mismo
variograma. En consecuencia, la “respuesta” de una simulación a una operación (por
ejemplo, selección sobre un valor umbral) es similar a la respuesta que daría la variable
real.
La simulación tendrá las siguientes propiedades:
1) Interpolación: exacta cuando es “condicional”.
2) Insesgo: la variable regionalizada o, más generalmente, una función de esta variable
puede ser estimada sin sesgo (es decir, con un error de esperanza nula) por la misma
función aplicada a los valores simulados.
3) No suaviza: la dispersión de los valores simulados es la misma que la dispersión de los
valores verdaderos.
4) No es precisa: el error entre valor real y valor simulado no tiene una varianza mínima.
Para remediar a esta última limitación, la idea es no utilizar una simulación única,
sino que un conjunto grande de simulaciones, cada una de las cuales representa un
“escenario” plausible. Así, para evaluar una magnitud cualquiera, basta con efectuar los
cálculos sobre un gran número de simulaciones, como si se tratara de los valores reales, y
posteriormente tomar la media como estimación de la magnitud buscada. Mejor aún: la
distribución de los resultados obtenidos sobre el conjunto de simulaciones da una imagen
de la incertidumbre asociada a la magnitud estudiada, lo que permite medir la precisión de
la estimación (por una varianza o por intervalos de probabilidad).
GEOESTADÍSTICA 54
Ejemplo: datos de contaminación de suelo
Supongamos que el umbral de toxicidad para la concentración de cobalto es de 12
ppm (según la norma regulatoria) y que el valor estimado por kriging en una determinada
unidad de remediación es de 10 ppm. El medio-ambientalista quiere saber si debe extraer
esta unidad para tratamiento o dejarla intacta in situ.
Ahora, como el kriging tiende a suavizar los valores, existe la posibilidad de que la
verdadera concentración de cobalto sea mayor que el umbral de toxicidad, por lo cual la
decisión de extraer o no la unidad de remediación debe considerar no sólo el valor
estimado por kriging (10 ppm), sino que la incertidumbre en torno a este valor. Sería
entonces interesante caracterizar esta incertidumbre por la probabilidad de que la
concentración de cobalto supere el umbral de 12 ppm.
Una primera opción consiste en suponer que el valor verdadero tiene una
distribución normal (Gaussiana) con media igual al valor estimado por kriging y varianza
igual a la varianza de kriging, lo que permite determinar la probabilidad buscada. Sin
embargo, las hipótesis en las cuales se basa este cálculo son difícilmente controlables: ¿por
qué el valor verdadero debería de tener una distribución Gaussiana? También se sabe que
la varianza de kriging no depende de los valores de los datos, por lo cual puede no ser una
medida realista de la dispersión del valor verdadero en torno al valor estimado. El uso de
simulaciones entrega una alternativa más confiable. Podríamos proceder de la siguiente
forma:
1) Discretizar la unidad de remediación en varios puntos (por ejemplo, 10 × 10).
2) Simular 100 veces la concentración de cobalto en estos puntos.
3) En cada realización, rebloquear (promediar) los valores simulados para obtener la
GEOESTADÍSTICA 55
concentración promedio en la unidad de remediación.
4) Construir el histograma de los 100 valores rebloqueados y determinar la frecuencia
con la cual se está sobre el umbral de 12 ppm.
5) Identificar esta frecuencia con la probabilidad buscada.
Además de calcular el riesgo de sobrepasar cualquier umbral, el histograma construido en
la etapa 4) permite también darse una idea del valor máximo que se puede encontrar en la
unidad de remediación. A veces, interesa más conocer este máximo para tomar la decisión
de remediación, por ejemplo, si el elemento analizado es muy tóxico para la salud humana.
Situaciones que ameritan recurrir a simulaciones
• Problemas de estimación: se resuelven al promediar los escenarios (para estimar la
variable misma) o al calcular la frecuencia de ocurrencia de un evento (para estimar la
probabilidad de este evento, por ejemplo, la probabilidad de que la variable tenga un
valor mayor que un umbral dado).
• Medición de incertidumbre: se analiza las variaciones observadas entre un escenario y
otro, pudiendo definir intervalos de probabilidad para los valores desconocidos de la
variable regionalizada.
• Análisis de riesgo: proponer diversos escenarios (uno optimista, uno pesimista, uno
intermedio) para analizar el impacto en los resultados y guiar la toma de decisión.
GEOESTADÍSTICA 56
Capítulo IV: Simulación Condicional
La simulación condicional consiste en construir una realización que posee el mismo
histograma, por consiguiente, la misma ley media y la misma varianza, el mismo variograma que
los datos disponibles, además de estar condicionada por estos datos experimentales.
Figura 30
La simulación condicional en este caso en un banco de una mina de cobre, proporciona una estimación más realista
de un yacimiento. Fuente: ´´La simulación condicional en un depósito minero``
Nota. M. Alfaro, 2015.
4.1 Objetivo
El objetivo de la simulación condicional es reproducir los dos primeros momentos
experimentales (media y covarianza C(h) o Semivariograma γ(h)) de los datos reales, así
como el histograma, es decir, se reproducen las principales características de dispersión del
fenómeno real de acuerdo a la información disponible. Los objetivos de usar simulaciones
condicionales siempre están relacionados con la característica fundamental de las
simulaciones que es reproducir la la variabilidad espacial real de la variable regionalizada.
GEOESTADÍSTICA 57
4.2 Estimación Y Simulación
Para estimar los recursos de un yacimiento, habitualmente la mineralización se
representa por medio de una malla de bloques en tres dimensiones, estimándose la ley de
cada a partir de los sondajes de exploración disponibles. Si se utiliza alguna forma de
kriging en la estimación, se obtiene previamente un modelo de continuidad espacial a partir
de los mismos sondajes, el cual se incorpora en el algoritmo de estimación. Los recursos
estimados de esta manera tienen dos características importantes.
Figura 31
Simulación condicional y krigeado. El krigeado establece que en la parte norte las impurezas tienen leyes
inferiores a 0.8% de alcalinos. La simulación nos indica que podría existir problemas, los cuales hay que tener
presente en la planificación. Fuente: ´´La simulación condicional en un depósito minero``
Nota. M. Alfaro, 2015.
No reproducen las estadísticas básicas de los datos de partida. En particular, el
histograma y el modelo de continuidad espacial. A lo sumo, si la técnica es aplicada
correctamente, se puede asegurar que, en promedio, los valores estimados promedios serán
similares a los valores verdaderos (y desconocidos).
GEOESTADÍSTICA 58
• Las estimaciones dependen fuertemente número de puntos y de su distribución espacial.
• Las estimaciones no requieren de mucho esfuerzo de cómputo.
• Las simulaciones no dependen tan fuertemente del número de puntos y de su distribución
espacial.
• Las simulaciones son más demandantes computacionalmente.
4.3 Métodos De Simulación
Las aplicaciones de la simulación de funciones aleatorias en los últimos tiempos han
adquirido una importancia cada vez mayor en la industria del petróleo, en geofísica e
hidrogeología lo cual ha hecho que esta área de la geoestadística sea la que más activamente
se ha desarrollado. Debido a esto se han diversificado los métodos de simulación, por lo que
intentar establecer alguna clasificación sistemática de los mismos resulta una tarea compleja
y difícil. Aquí intentaremos dar una idea general de los métodos más conocidos y sus
características.
Tabla 4
Métodos y Características de la Simulación
Modelo de Simulación Condicionado Gaussiano Malla Regular
Matricial Si Si No
Espectral No Si No
Bandas rodantes No Si No
Secuencial Gaussiano Si Si No
Secuencial Indicador Si No No
Gaussiano Truncado Si Si No
Recocido Simulado Si No Si
Nota. M. Alfaro, 2015.
GEOESTADÍSTICA 59
4.4. Requisitos para Realizar una Simulación
A diferencia del kriging que sólo requiere conocer la covarianza o el variograma, la
simulación geoestadística necesita definir completamente la función aleatoria que se desea
simular. Esto es, conocer la distribución espacial de esta función aleatoria, es decir, todas sus
distribuciones de probabilidad multivariables:
• Distribución univariable (histograma)
• Distribuciones bivariables
• Distribuciones trivariables,
En particular, es insuficiente conocer la media y el variograma, como lo demuestran
los ejemplos siguientes.
Figura 32
Esquema sintético del modelamiento geoestadístico. Esperanza, varianza, covarianza y variograma sólo
proporcionan un resumen de las características de la función aleatoria.
Nota. Geoestadística, Xavier E., 2013.
GEOESTADÍSTICA 60
Figura 33
Realizaciones de dos funciones aleatorias con la misma distribución univariable y el mismo variograma.
Nota. Geoestadística, Xavier E., 2013.
Figura 34
Realizaciones de funciones aleatorias con mismas distribuciones univariables, bivariables (luego, mismos
variogramas) y trivariables.
Nota. Geoestadística, Xavier E., 2013.
4.5. Ejemplos de Funciones Aleatorias
Existe una gran diversidad de modelos de función aleatoria que pueden ser simulados
por técnicas geoestadísticas. A continuación, mostramos algunos ejemplos, que difieren en
la naturaleza de la variable en estudio.
GEOESTADÍSTICA 61
• Variables continuas, como las concentraciones de elementos contaminantes, leyes de
mineral, pH, conductividad eléctrica, permeabilidad de una roca, carga hidráulica, etc.
Figura 35
Realizaciones de tres modelos de variables continuas.
Nota. Geoestadística, Xavier E., 2013.
• Variables discretas o categóricas, que permiten codificar un conjunto de dominios que
subdividen el espacio (por ejemplo, dominios definidos por tipos de roca) o representar
variables con un número limitado de valores, por ejemplo, las variables de conteo cuyos
valores son enteros.
Figura 36
Realizaciones de tres modelos de variables categóricas.
Nota. Geoestadística, Xavier E., 2013.
• Conjuntos aleatorios, que pueden ser representados por indicadores (variables binarias
que valen 1 cuando se está en el conjunto, 0 cuando se está fuera). Pueden representar
GEOESTADÍSTICA 62
variables que cuentan con solamente dos categorías, por ejemplo, roca permeable versus
roca impermeable.
Figura 37
Realizaciones de tres modelos de conjuntos aleatorios.
Nota. Geoestadística, Xavier E., 2013.
• Redes de fracturas, que son casos particulares de conjuntos aleatorios (porciones de
plano o de recta, con dimensiones y orientación aleatorias en el espacio).
Figura 38
Realizaciones de tres modelos de redes de fracturas.
Nota. Geoestadística, Xavier E., 2013.
• Procesos puntuales, que son otros casos particulares de conjuntos aleatorios. Permiten
modelar fenómenos naturales como: distribución de árboles en un bosque, de piedras
GEOESTADÍSTICA 63
preciosas en un yacimiento, o de epicentros de temblores. También sirven para construir
algunos modelos de funciones aleatorias, de conjuntos aleatorios y de redes de fractura.
Figura 39
Realizaciones de cuatro modelos de procesos puntuales
Nota. Geoestadística, Xavier E., 2013.
4.6. Aspectos del Problema de Simulación
Las etapas y desafíos planteados para simular una función aleatoria son los siguientes:
1) Definir un modelo de función aleatoria (distribución espacial).
2) Inferir los parámetros del modelo (variograma, etc.) y validarlos.
3) Proponer algoritmos para construir realizaciones de la función aleatoria definida.
4) Condicionar las realizaciones a los datos disponibles.
Estos pasos convierten la simulación geoestadística en un enfoque mucho más
complejo que el kriging. En el próximo capítulo, examinaremos un modelo muy sencillo
denominado modelo multi-Gaussiano, que permite simular variables continuas. La
simulación de otros modelos de función aleatoria es un tema que sobrepasa los alcances de
este curso.
4.7. Desagrupamiento de Datos (Declustering)
Se hace un desagrupamiento a la data original, debido a que cuando el muestreo es
irregular, es preferible no atribuir el mismo peso estadístico a todos los datos. La operación
de Desagrupamiento consiste en ponderar los datos en función de su grado de aislamiento:
GEOESTADÍSTICA 64
mientras más aislado, más peso. Se observa un muestreo selectivo en ciertas zonas de la
veta, por lo tanto, se realiza dicho procedimiento, para esto se utilizó el método de las celdas
que consiste en dividir la zona de estudio en celdas rectangulares idénticas y en atribuir a
cada dato un ponderador inversamente proporcional al número de datos presentes en la celda
a la cual pertenece (Emery,2018).
Se prueban diferentes tamaños de celdas para ver el impacto en la media ponderada y
así llegar a una conclusión con el fin de compensar el carácter preferencial del muestreo. Se
consideran dos casos: el primero es que si el muestreo es más denso en zona de alto tenor se
escoge la media ponderada menor resultante y el segundo es que si por el contrario el
muestreo fue selectivo en zonas de bajo tenor se escogería la media ponderada mayor. A
continuación, se resume los resultados con la celda elegida.
4.8. Desagrupamiento de Datos por el Método de Celdas
Tenemos 10 muestras correspondientes a leyes de cobre y buscamos una ley media.
Las cinco muestras agrupadas representan un cluster, observamos que es una zona de
enriquecimiento debido a que muestran leyes más altas que el resto de las muestras.
Figura 40
Depósito de Cobre 0.6 km x 0.6 km
Nota. Desagrupamiento de datos por método de celdas - GLAM 2018. Tomado de Nube Minera, 2019,
(youtube.com).
GEOESTADÍSTICA 65
Es común encontrar estos cluster en las prospecciones
¿Cuál es la ley media del depósito?
Figura 41
Muestras con su respectiva ley
Nota. Desagrupamiento de datos por método de celdas - GLAM 2018. Tomado de Nube Minera, 2019,
(youtube.com).
Figura 42
Presencia de cluster en el depósito de cobre
Nota. Desagrupamiento de datos por método de celdas - GLAM 2018. Tomado de Nube Minera, 2019,
(youtube.com).
GEOESTADÍSTICA 66
Ley media de 2.03%
Podemos observar que menos del 25% del sector tiene muestras con leyes por
encima del promedio, y el resto de muestras tienen leyes muy bajas respecto. Para mejorar
este problema, se utiliza las técnicas de des agrupamiento declustering, en minería se utiliza
el método la celda, (polígonos otros).
4.8.1. Método de la celda
Consiste en dividir el depósito, en celdas con un tamaño el cual pueda ser
influyente en los estadísticos de tendencia central, para este caso, no se hizo celdas
de 100x100, porque la diferencia entre la ley media aritmética y los datos
desagrupados, hubiese sido bastante similar, no hubiese existido mucha diferencia, si
generemos de 200x200m ya podemos agrupar una parte importante del cluster en una
sola celda, y eso nos da una ley media más representativa de dicho deposito.
También mientras mayor es el soporte o la celda, menor es la variabilidad, menor es
la dispersión, de los datos.
Figura 43
Desagrupamiento por Celdas: Cell Declustering
Nota. Desagrupamiento de datos por método de celdas - GLAM 2018. Tomado de Nube Minera,
2019, (youtube.com).
GEOESTADÍSTICA 67
N: Numero de muestras: 10
L: Número de celdas: 9
Lo: Número de celdas que poseen muestras en su interior: 7
Figura 44
Ponderadores de celdas
Nota. Desagrupamiento de datos por método de celdas - GLAM 2018. Tomado de Nube Minera,
2019, (youtube.com).
Wi: ponderador asociado a cada muestra
nl: Número de muestras de muestras que posee la celda
L0: Número total de celdas con muestras del depósito; 7
Figura 45
Celda 1A y sus respectivas muestras
Nota. Desagrupamiento de datos por método de celdas - GLAM 2018. Tomado de Nube Minera,
2019, (youtube.com).
GEOESTADÍSTICA 68
A1: 1/ (4*7) = 0.03571=0.04
Figura 46
Ponderadores de celdas
Nota. Desagrupamiento de datos por método de celdas - GLAM 2018. Tomado de Nube Minera,
2019, (youtube.com).
1.28% ley media, mucho menor a la ley sin desagrupar, pero más representativa.
Proportional effect
Dentro del tema simulación condicional es muy importante que cuando la
varianza y la desviación estándar son proporcionales a la media; es decir, en zonas
con leyes altas la varianza es mayor (el dominio no es estacionario con respecto a la
varianza).
Figura 47
Distribución de media y desviación estándar.
Nota. Desagrupamiento de datos por método de celdas - GLAM 2018. Tomado de Nube Minera,
2019, (youtube.com).
GEOESTADÍSTICA 69
4.9. Transformación Gaussiana (anamorfosis)
Es poco frecuente que la variable estudiada pueda ser considerada como Gaussiana: a
menudo, la distribución univariable (histograma de los valores medidos) es asimétrico y no
es compatible con un modelo Gaussiano. Una transformación – llamada anamorfosis – es
necesaria para convertirla en una distribución Gaussiana. Gráficamente, la transformación
consiste en deformar el histograma de los datos en un histograma Gaussiano estándar, es
decir, de media 0 y varianza 1.
Figura 48
Construcción grafica de la anamorfosis Gaussiana
Nota. Geoestadística, Xavier E., 2013.
GEOESTADÍSTICA 70
A continuación, denotaremos como
• Z = {Z(x), x є D} la función aleatoria que representa a la variable original
• Y = {Y(x), x є D} la función aleatoria que representa a la variable transformada
• F(z) la función de distribución (histograma acumulado) de Z
• G(y) la función de distribución de Y (Gaussiana de media 0 y varianza 1).
En los histogramas acumulados, la transformación consiste en asociar a cada valor z de
la variable original el valor Gaussiano y que tiene la misma frecuencia acumulada, es decir,
se plantea que F(z) = G(y).
Figura 49
Construccion de la anamorfosis con ayuda de las funciones de distribución F(variable original) y G (variable
Gaussiana).
Nota. Geoestadística, Xavier E., 2013.
Se denomina función de anamorfosis Gaussiana a la función que relaciona los
valores Gaussianos con los valores originales. Conforme a lo anterior, esta función se
escribe como: f = F-1 ◦ G y se puede plantear:
GEOESTADÍSTICA 71
Figura 50
Función de anamorfosis. En este ejemplo (variable Z con una distribución lognormal), se trata de una función
exponencial.
Nota. Geoestadística, Xavier E., 2013.
Observaciones
La construcción de la anamorfosis no es posible cuando la función de distribución F
no es invertible. Esto es el caso cuando la variable en estudio es discreta o categórica, o
cuando los datos presentan una proporción importante de valores iguales. Por ejemplo, si
una variable positiva cuenta con 50% de valores nulos – que deberían corresponder al 50%
de valores Gaussianos negativos – no se puede asignar de manera unívoca un valor
Gaussiano a cada uno de los valores nulos.
Conocer la función de anamorfosis es equivalente a conocer la función de
distribución F (la función de distribución Gaussiana G ha sido tabulada), es decir, el
histograma de la variable original Z.
GEOESTADÍSTICA 72
Complemento: determinación práctica
Para determinar numéricamente la función de anamorfosis, se empieza por ordenar
los datos en orden creciente:
z < z <...< zn
con probabilidades de ocurrencia p1, p2... pn. En primera aproximación, se puede identificar
estas probabilidades con los ponderadores de desagrupamiento (normalizados de modo que
su suma sea igual a 1):
Los valores de los datos están asociados a las frecuencias acumuladas empíricas:
Se asocia a cada valor zi el valor Gaussiano yi de misma frecuencia acumulada, es
decir
tal que lo que define la función de anamorfosis empírica, denotada como Ф.
Si Y es una variable Gaussiana estándar, entonces Ф(Y) tiene exactamente la distribución
empírica de los datos originales.
GEOESTADÍSTICA 73
Figura 51
Determinación de la anamorfosis empírica
Nota. Geoestadística, Xavier E., 2013.
Figura 52
Función de anamorfosis empírica
Nota. Geoestadística, Xavier E., 2013.
Varias razones justifican la necesidad de efectuar un suavizamiento de Ф:
• Obtener una función de anamorfosis invertible, que permite asociar un valor Gaussiano a
cualquier valor de la variable Z y vice-versa (la anamorfosis empírica no es invertible,
pues es una función escaloneada).
GEOESTADÍSTICA 74
• Suavizar la anamorfosis empírica equivale a suavizar el histograma experimental de Z,
luego permite modelar su distribución univariable de manera más aceptable que por su
distribución empírica.
• El valor Gaussiano asociado con el dato mínimo es infinito: y1 = – ∞, pues G(y1) = F(z1)
= 0. Esta situación desaparece después del suavizamiento de la función de anamorfosis.
Existen varios métodos de suavizamiento de la anamorfosis empírica, en particular con
ayuda de polinomios.
Figura 53
Anamorfosis empírica (línea punteada) y modelada (línea continua)
Nota. Geoestadística, Xavier E., 2013.
4.10. Modelo multi-Gaussiano
4.10.1. Hipótesis
Se supone que el conjunto de valores Gaussianos tiene una distribución
multivariable Gaussiana (multi-Gaussiana), es decir, la densidad de probabilidad de
los valores ubicados en los sitios {x1,... xn} es
GEOESTADÍSTICA 75
donde y es el vector (y1,... yn), mientras que C representa la matriz de varianza-
covarianza de los datos Gaussianos. Se ve que, en este caso muy particular, la
función de covarianza (o, en forma equivalente, el variograma) permite obtener las
distribuciones de probabilidad multivariables, es decir, caracteriza completamente
la función aleatoria Gaussiana. Se trata, por lo tanto, de un modelo extremadamente
sencillo, puesto que bastará con realizar el análisis variográfico de los datos
Gaussianos para determinar el modelo.
4.11. Validación
Por construcción, el histograma de los datos transformados es Gaussiano, por lo
cual su distribución univariable es consistente con el modelo. Sin embargo, hace falta
verificar que las distribuciones de orden superior (bivariables, trivariables...) sean también
compatibles con la hipótesis multi-Gaussiana. Desde un punto de vista teórico, tal
verificación es muy exigente y difícil de confirmar con los datos experimentales
disponibles. Por esta razón, en la práctica, uno se contenta con validar que la hipótesis
multi-Gaussiana se cumple a nivel de las distribuciones bivariables (es decir, aquellas que
involucran a dos valores Gaussianos a la vez).
Primer test: nubes de correlación diferida
Consideremos un par de valores Gaussianos (Y(x), Y (x + h)) en dos sitios separados por
un vector h. La densidad de probabilidad conjunta de estos valores es:
Las curvas de isodensidad g (y1, y2) = constante son elipses concéntricas:
GEOESTADÍSTICA 76
En la práctica, esto significa que la nube de correlación diferida calculada con los datos
Gaussianos para el vector h, debe tener una forma elíptica. Además, cuando la norma de h es
muy grande, la nube de correlación diferida se vuelve circular (señal de que ya no existe
correlación entre Y(x) e Y (x + h) para las distancias grandes). Al contrario, cuando |h| tiende a
0, la nube se restringe en torno a la primera bisectriz, ya que Y (x + h) está cada vez más
correlacionado con Y(x).
Figura 54
Nubes de correlación diferida en forma de elipses
Nota. Geoestadística, Xavier E., 2013.
Segundo test: comparación entre variograma y madograma
El madograma (o variograma de orden 1) de la variable Gaussiana para un vector h se
define como:
GEOESTADÍSTICA 77
Dado que la distribución multi-Gaussiana está enteramente caracterizada por la función
de covarianza (o por el variograma γ(h)), se puede expresar este madograma en función del
variograma. Se tiene la siguiente relación:
Basta con verificar esta relación con los variograma y madograma experimentales de los
datos Gaussianos.
Tercer test: variogramas de indicadores
Un indicador es una función binaria definida por referencia a un umbral y:
Al igual que para el test anterior, existe una relación entre el variograma de la variable
Gaussiana y el variograma γI,y(h) de la variable indicador:
donde G(.) es la función de distribución Gaussiana estándar.
El test propuesto consiste en los siguientes pasos:
1) Modelar el variograma γ(h) de los datos Gaussianos.
2) Deducir el variograma γI,y(h) del indicador asociado a un determinado umbral y.
3) Codificar los datos Gaussianos en indicador (0 ó 1) según si superan o no el umbral y.
4) Calcular el variograma experimental de los datos de indicador.
5) Comparar este variograma experimental con la expresión teórica obtenida en el paso 2).
6) Repetir el procedimiento (pasos 2 a 5) para varios valores del umbral y, por ejemplo, para los
cuartiles de la distribución.
GEOESTADÍSTICA 78
7) Concluir si los variogramas teóricos de indicador se ajustan razonablemente bien a los
variogramas experimentales.
Propiedades Características del Modelo Multi-Gaussiano
1) Si el umbral y tiende a infinito, el variograma gI,y(h) tiende a su meseta G(y) [1 − G(y)]
cualesquiera h, es decir, los variogramas de indicadores asociados a umbrales extremos se
vuelven pepíticos. En otras palabras, la ocurrencia de valores extremos es puramente
aleatoria, de modo que el modelo multi-Gaussiano es inapropiado cuando los valores
extremos están espacialmente correlacionados, en particular cuando están agrupados en
ciertas zonas del campo.
Figura 55
Realizaciones de cuatro modelos de función aleatoria. Sólo el modelo en la lámina A es compatible con la
distribución multi-Gaussiana, pues no presenta agrupación espacial de los valores extremos.
Nota. Geoestadística, Xavier E., 2013.
GEOESTADÍSTICA 79
2) La expresión del variograma de indicador gI,y es invariante cuando se cambia y en –y: la
continuidad espacial de los indicadores es simétrica con respecto al umbral mediano (0).
Esto se traduce por una igualdad entre los variogramas de indicadores asociados con
cuantiles simétricos con respecto a la mediana. En términos más intuitivos, las
características (anisotropía, continuidad a pequeña escala...) que se manifiestan para los
valores bajos también caracterizan los valores altos.
4.12. Simulación Condicional
Una vez que se ha comprobado la validez de la hipótesis multi-Gaussiana, el
modelo queda enteramente caracterizado por la función de anamorfosis y por el
variograma de los datos Gaussianos. Falta ahora definir un algoritmo para poder construir
realizaciones de este modelo y condicionarlas a los datos disponibles. Entre los algoritmos
que responden a este problema, el más sencillo es el llamado “método secuencial
Gaussiano”.
4.13. Algoritmo Secuencial
Supongamos que se busca simular una función aleatoria multi-Gaussiana Y de
media 0 y variograma (h) en los sitios {u1,... um} del espacio, condicionada a los datos
Gaussianos disponibles en los sitios {x1,... xn}. El algoritmo secuencial procede de la
siguiente manera. Para cada sitio ui (i = 1,... m):
1) Realizar el kriging de Y(ui) a partir de los datos condicionantes {Y(x1),... Y(xn)} y de los
valores previamente simulados {Y(u1),... Y(ui-1)}. Como resultado, se obtiene un valor
estimado Y*(ui) y una desviación estándar Ϭ*(ui).
2) Simular un valor Gaussiano, cuya media es igual a Y*(ui) y cuya desviación estándar es
igual a Ϭ*(ui):
GEOESTADÍSTICA 80
donde Ni es una variable aleatoria Gaussiana de media 0 y varianza 1, independiente de
N1... Ni-1 y de los datos originales Y(x1),... Y(xn).
Asi pues, en la i-esima etapa, se simula el valor Gaussiano en el sitio ui y se agrega
el valor simulado a los datos condicionantes para simular los sitios siguientes, de donde
viene el nombre “secuencial”. En teoría, se requiere usar un kriging simple (de media
conocida = media de la variable Gaussiana = 0).
Las ventajas del algoritmo secuencial radican en su sencillez y facilidad de
ejecución, así como en el hecho de que proporciona directamente simulaciones
condicionales a datos. En contrapartida, su principal desventaja es su lentitud, debido a que
el sistema de kriging se vuelve cada vez más grande a medida que se desarrolla la
simulación. En la práctica, se debe restringir los datos condicionantes (datos iniciales +
valores previamente simulados) a los más cercanos del sitio a simular, es decir, se utiliza
una vecindad móvil en lugar de la vecindad única requerida en teoría. A su vez, esta
restricción introduce aproximaciones / imprecisiones en los valores simulados, lo que
requiere ciertos “trucos” para minimizar sus efectos:
• Uso de grillas múltiples (cuando los sitios a simular están ubicados en una grilla): se
hace la simulación primero en una malla amplia, luego en mallas más pequeñas. Por
ejemplo, se simula uno de cada 10 sitios en cada dirección de la grilla, luego uno de
cada 5 sitios y finalmente los sitios restantes. La idea es que la simulación en mallas
amplias puede hacerse con una vecindad única (por ende, sin aproximación) puesto
que estas mallas contienen pocos sitios, luego la simulación en las mallas pequeñas se
apoyara en estos valores “bien” simulados.
GEOESTADÍSTICA 81
• Aleatorización de la secuencia de simulación: el orden según el cual se simula los
distintos sitios es elegido al azar. Esto se debe a que el uso de una secuencia regular
(por ejemplo, simular los nodos de una grilla en 2D fila por fila) suele provocar la
aparición de artefactos cuando se utiliza una vecindad móvil. Para cada realización que
se quiere construir, es recomendable definir una secuencia distinta.
A modo de ejemplo, la Figura 9 muestra los variogramas experimentales calculados
en 100 realizaciones de una función aleatoria Gaussiana de variograma esférico (alcance
50) + pepita, realizadas con el algoritmo secuencial en un dominio de 400 × 400 nodos. No
se han considerado datos iniciales, por lo que las realizaciones obtenidas no son
condicionales. La lámina de la izquierda corresponde a una vecindad de kriging que
contiene hasta 20 valores previamente simulados, mientras que la lámina de la derecha
corresponde a una vecindad con 100 valores previamente simulados.
En ambos casos existe un sesgo en la reproducción del variograma, ya que el
promedio de los variogramas experimentales no coincide con el modelo teórico de
variograma, aunque el sesgo disminuye notablemente cuando se utiliza la vecindad más
exigente.
Es interesante notar que siempre existe una discrepancia entre el variograma
simulado (o sea, el variograma experimental calculado sobre una realización de la función
aleatoria) y el modelo de variograma. Esta discrepancia, llamada fluctuación estadística o
fluctuación ergódica, se debe a que la realización no posee un campo infinito. La teoría
indica que la fluctuación esperada es pequeña cerca del origen y aumenta con la distancia.
GEOESTADÍSTICA 82
Figura 56
Sesgo en la reproducción del variograma producido por el algoritmo secuencial implementado con una
vecindad móvil
Nota. Geoestadística, Xavier E., 2013.
4.14. Resumen: pasos a seguir para la simulación
Los pasos a seguir para la simulación condicional son finalmente los siguientes:
1) Desagrupar los datos originales.
2) Transformar estos datos en datos Gaussianos, tomando en cuenta los ponderadores de
desagrupamiento.
3) Realizar el análisis variográfico de los datos Gaussianos.
4) Validar la hipótesis multi-Gaussiana (nubes de correlación diferida, comparación entre
variograma y madograma, variogramas de indicadores).
5) Simular la función aleatoria Gaussiana
• Elegir un algoritmo de simulación
• Construir varias realizaciones
• Condicionar a los datos Gaussianos disponibles si el algoritmo escogido no lo hace
directamente.
GEOESTADÍSTICA 83
6) Transformación Gaussiana inversa, para volver a la variable original.
7) Procesar los resultados.
Figura 57
Secuencia de una Simulación Gaussiana
Nota: Modelos de simulación, Díaz. R., 2015
GEOESTADÍSTICA 84
Conclusiones
• La geoestadística es una herramienta muy importante en el estudio de la distribución
espacial y leyes de los yacimientos metálicos. El análisis estructural de variogramas es muy
útil para la interpretación de estos.
• •Los modelos teóricos se ajustan a un modelo de variograma experimental y son capaces de
explicar los diferentes comportamientos que pueden tener las variables en el espacio, como
su comportamiento en el origen, el cual puede ser lineal, parabólico y con efecto de pepita,
la presencia o ausencia de meseta.
• Cabe destacar que el kriging ordinario es uno de los métodos más utilizados, debido a que es
un estimador insesgado y utiliza datos obtenidos del modelamiento de variograma para
determinar la dirección de anisotropía.
• En el proceso de simulación se obtiene una representación con iguales características de
variabilidad y correlación espacial que la realidad estudiada. Este proceso se concentra
fundamentalmente en la generación de valores a partir de una función de covarianza fija.
• Un análisis más detallado en la interpolación de kriging ordinario se puede lograr a través de
la elaboración de variogramas con dirección, y no solo omnidireccionales, para lo cual es
necesario añadir a la base de datos los ángulos entre las estaciones en los ejes xyz (tres
dimensiones).
• La simulación, a diferencia de la estimación que proporciona una representación suave o lisa
de la realidad, es considerada como una de las posibles realizaciones de una función
aleatoria, de la cual la realidad se considera también como una realización particular.
GEOESTADÍSTICA 85
Recomendaciones
• Tratar de ejemplificar los variogramas, aplicados al ámbito netamente minero. Corregir los
errores de cálculo que se pueden generar en la elaboración del informe
• Hacer hincapié en una mejor investigación del análisis estructural con variogramas,
herramientas y técnicas que sirven para analizar y predecir los valores de una variable que
está distribuida en el espacio de una forma continua.
• Con la utilización de variogramas obtenidos a partir de información georreferenciada, se
conoció la variación de parámetros y permitió comprender la utilización de la interpolación
y estimación de variables regionalizada
• Al momento de realizar el análisis de datos para el procedimiento del EDA, es necesario
tener un tamaño de muestra considerable para la simulación.
• Es recomendable siempre realizar métodos de simulación geoestadística (Bandas Rotantes,
Secuencial Gaussiano, etc.) para las estimaciones, que permitan representar la variabilidad
real en el área de interés
GEOESTADÍSTICA 86
Referencias
Alfaro, M. A. (julio de 2007). cg.ensmp.fr. Obtenido de
http://cg.ensmp.fr/bibliotheque/public/ALFARO_Cours_00606.pdf
Alfaro M. (2015). La simulación Condicional en un Depósito Minero. Santiago de Chile:
Universidad de Chile.
Emery, X. (2002). Analisis Geoestadistico de Datos Funcionales. Santiago de Chile:
Universidad de Chile.
Goovaerts, P. (1997). Geostatistics for Natural Resources Evaluation. Reino Unido: Oxford
University.
Henao, R. G. (2011). Introducción a la Geoestadistica. Bogotá: Universidad Nacional de
Colombia.
Isaaks, E. & R. M. Srivastava. 1989. Applied Geostatistics. Oxford University Press, New York.
Nuñez, R. V. (2001). Geoestadistica. En R. V. Nuñez, Geoestadistica (pág. 127). Lima: RNMA.
Samper, F.J. & J. Carrera 1990. Geoestadística. Aplicaciones a la Hidrogeología Subterránea.
Centro Internacional de Métodos Numéricos en Ingeniería. Universitat Politécnica de
Catalunya. Barcelona.
Sánchez, L. A. (7 de Mayo de 2017). drluisalejandrosanchez. Obtenido de
http://drluisalejandrosanchez.blogspot.com/
Vera, M. A. (2000). Geoestadistica Aplicada. Habana Cuba: CITMA.
Xavier Emery. (2013). Geoestadística. Facultad de ciencias físicas y matemáticas Universidad de
Chile.
GEOESTADÍSTICA 87
Youtube. 2020. Nube Minera. [online] Disponible en:
<https://www.youtube.com/watch?v=OPy1jBGdiuI&t=4s> [Consultado el 4 de
noviembre de 2020].