A Geoestatística teve sua origem na área de mineração e, atualmente, com o desenvolvimento da tecnologia, é inegável a importância dos métodos geoestatísticos como ferramenta relevante para entender uma aparente aleatoriedade dos dados e fornecer uma medida da correlação espacial e, assim, utilizá-la para as mais diferentes necessidades. O Comunitexto convida o geólogo Paulo Landim, autor do livro Análise estatística de dados geológicos multivariados, para falar um pouco mais sobre o tema, suas dificuldades e implicações. Confira!
Comunitexto: A agricultura de precisão é uma das áreas em que a Geoestatística é necessária. Como o uso de dados específicos auxilia essa prática?
Paulo Landim (PL): Essa tecnologia baseia-se num conceito bastante intuitivo que é a variabilidade espacial dos solos. Em fotos de satélite, por exemplo, percebe-se com nitidez que existem áreas com tonalidades diferentes indicando solos com características próprias e, portanto, com necessidades específicas de fertilizantes ou de corretivos para acidez.
CT: Uma das dificuldades encontradas na Geoestatística, especialmente nas aplicações relacionadas à mineração, está em como avaliar as incertezas, as quais são baseadas em um modelo de distribuição de probabilidades. Quais soluções podem ser apontadas para eliminar ou abrandar esse problema?
PL: Na avaliação de incertezas, em geologia ambiental, por exemplo, existem fundamentalmente dois erros de classificação:
a) classificar como segura uma localização contaminada;
b) classificar como contaminada uma localização segura.
Uma localização é classificada como segura quando a respectiva estimativa calculada se encontra abaixo do limite máximo permitido para o contaminante de interesse. Essa localização não estará sujeita a nenhum tratamento ou remediação. Caso contrário, será classificada como contaminada e estará sujeita a tratamento.
Em determinadas circunstâncias, a variância da krigagem é utilizada como uma medida de confiança da estimativa da krigagem. Assim, para estabelecer a incerteza em locais não amostrados, calculam-se estimativas do valor desconhecido e sua respectiva variância s*2(u) para construir um intervalo de confiança do tipo gaussiano. Esse enfoque é restritivo porque supõe uma função de distribuição normal dos valores.
Em vez de assumir uma função de distribuição normal para cada local a ser estimado, uma alternativa é utilizar o modelo não linear da krigagem indicativa, que modela a incerteza sobre o valor desconhecido a partir da função de distribuição acumulada condicional, daquela variável. Esse procedimento estabelecido para diversos níveis de corte (cutoff) de uma distribuição acumulada como, por exemplo, os quartis, ou mesmo percentis, conduz a uma estimativa de vários valores dessa distribuição em um determinado local, cuja função poderá ser ajustada. A transformação não linear sobre o conjunto de dados amostrais é denominada codificação por indicação.
Sendo uma técnica não paramétrica, nenhum tipo de distribuição para a variável aleatória é considerado a priori, o que possibilita uma estimativa da sua função de distribuição, permitindo a determinação de incertezas e a inferência de valores do atributo em locais não amostrados. Essa técnica também possibilita a modelagem de dados com grande variabilidade espacial. O conceito da transformação indicativa, em valores binários, com apenas duas possibilidades 0 e 1, é simples. Os valores 0’s e 1’s podem ser usados para designar duas diferentes classes: 0 = minério e 1 = rejeito. Podem também ser usados para separar uma variável contínua em duas categorias, por exemplo, 0: Pb £ 10 ppm e 1: Pb > 10 ppm.
Neste tipo de transformação, os maiores valores abaixo do nível de corte terão 100% de probabilidade de ocorrência e os maiores valores acima do nível de corte, 0% de probabilidade. A escolha dos níveis de corte pode se basear num conhecimento a priori ou na distribuição de probabilidades acumuladas. Os objetivos podem ser a procura de valores acima do nível de corte, como na determinação de teores anômalos de um determinado bem mineral, ou a procura de valores abaixo do nível de corte, como em análise ambiental para a determinação de níveis de poluição abaixo de um certo teor.
CT: Existe uma maneira eficaz de solucionar esse problema das amostragens? Quais preocupações que se deve ter na coleta de amostragens do solo para possibilitar uma análise mais eficaz?
PL: Pergunta de difícil resposta, pois, em síntese, se ocorrer baixa variabilidade dos dados será necessária uma amostragem com poucos valores, porém se a variabilidade for alta a amostragem deve ser mais densa. Como saber qual a variabilidade presente? Cada caso é um caso e, muitas vezes, deve-se aplicar não os métodos de estimativa, como a krigagem, mas sim métodos de simulação geoestatística.
CT: Conte alguns casos em que a Geoestatística trouxe resultados positivos para agricultores, mineradores, entre outros.
PL: Não sei apontar especificamente casos concretos. Posso, porém, adiantar que grandes empresas como a Petrobrás, a Vale do Rio Doce e mesmo a Embrapa possuem departamentos e técnicos especializados no tratamento de dados espaciais por metodologia geoestatística. Sei também que existem grandes centros de pesquisa dedicados à aplicação da geoestatística, principalmente voltados ao petróleo e ao gás, em Stanford/EUA, Alberta/Canadá, Nancy/França, Instituto Superior Técnico/Portugal etc.
Tudo a ver
Confira nosso catálogo de Geoestatística!
Análise estatística de dados geológicos multivariados, de Paulo Landim
Estatística, análise e interpolação de dados geoespaciais, de Jorge Kazuo Yamamoto