Fazer gráficos de um observável em função de outro é bastante comum no dia a dia da pesquisa com o objetivo de se extrair alguma informação deste conjunto de dados. Por exemplo, de um gráfico de velocidade em função do tempo para a queda de um objeto pode-se extrair a aceleração do objeto. Do gráfico da massa em função do volume pode-se extrair a densidade do material. Os exemplos são muitos. Uma vez que os dados estão graficados, a extração das informações relevantes é feita através do ajuste de uma expressão matemática, ou função, a estes dados onde os parâmetros desta função correspondem à grandezas de interessa, tais como a aceleração, densidade, etc. Isso pode ser feito visualmente, com uma régua e intuição, mas atualmente é muito mais simples utilizar programas de análise gráfica. Há muitos disponíveis por ai. Como isso é feito? Qual o procedimento matemático que é utilizado para se determinar qual é o melhor conjunto de parâmetros que, em uma função matemática qualquer, descreve o comportamento dos dados da melhor forma possível? Há vários métodos estatísticos disponíveis. Vamos abordar o método dos mínimos quadrados.nnFazer gráficos de um observável em função de outro é bastante comum no dia a dia da pesquisa com o objetivo de se extrair alguma informação deste conjunto de dados. Por exemplo, de um gráfico de velocidade em função do tempo para a queda de um objeto pode-se extrair a aceleração do objeto. Do gráfico da massa em função do volume pode-se extrair a densidade do material. Os exemplos são muitos. Uma vez que os dados estão graficados, a extração das informações relevantes é feita através do ajuste de uma expressão matemática, ou função, a estes dados onde os parâmetros desta função correspondem à grandezas de interessa, tais como a aceleração, densidade, etc. Isso pode ser feito visualmente, com uma régua e intuição, mas atualmente é muito mais simples utilizar programas de análise gráfica. Há muitos disponíveis por ai. Como isso é feito? Qual o procedimento matemático que é utilizado para se determinar qual é o melhor conjunto de parâmetros que, em uma função matemática qualquer, descreve o comportamento dos dados da melhor forma possível? Há vários métodos estatísticos disponíveis. Vamos abordar o método dos mínimos quadrados.
n
n
O método dos mínimos quadrados
nConsidere um conjunto de dados onde
são incertezas na variável
(mais a frente vamos ver como tratar casos onde há incertezas também em
). Podemos fazer um gráfico de
em função de
, obtendo algo similar à figura 1.
n
n

nFigura 1 – Gráfico de em função de xnn.
nn




n
n

nFigura 2 – Ajuste de uma reta.
nn


n
n

nFigura 3 – Reta com valores de e
que não descrevem os dados.
nn


n
nVamos olhar então o nosso conjunto de dados , que consiste em
pontos
, independentes um do outro. Além disso, os valores de
possuem funções densidade de probabilidade gaussianas em relação ao seu valor verdadeiro
com desvio padrão
. Os valores verdadeiros
dependem do valor de
. Neste caso, a probabilidade de se fazer uma medida
é proporcional à esta função densidade de probabilidade, ou seja:
n
n

n
n
nQueremos estimar, da melhor forma possível, os valores verdadeiros de tal forma que a probabilidade seja máxima. Vamos tentar descrever os valores verdadeiros por uma função
, que depende de
, com
parâmetros
, a serem determinados, ou seja:
n
n

n
n




n
n

n
n
nA probabilidade total de encontrarmos o conjunto de dados medido consiste no produto da probabilidade de medir cada ponto , ou seja:n
n
n

n
n
n
nn
n
nnConcluimos que a expressão para a probabilidade total é:n
n
n

n
n

n
n

n
n

n
nAjustar uma função a um conjunto de dados consiste, então, em determinar os valores dos parâmetros , conhecendo-se a fórmula para
de modo a minimizar o valor para
. Esté é o chamado método dos mínimos quadrados. Note que fizemos duas suposições importantes: a primeira é que os pontos
são independentes um dos outros de modo que podemos calcular a probabilidade total como o produto das probabilidades individuais e elas são calculadas independentemente uma das outras. A segunda, mais importante, é que as funções densidade de probabilidade de cada ponto são gaussianas. Sem esta condição, nem sempre é possível maximizar a probabilidade minimizando o
.n
n
n
O método dos mínimos quadrados (MMQ) aplicado a alguns casos
nVamos então aplicar o método dos mínimos quadrados em alguns casos simples:
n
n
- n
-
, ou seja, uma função constante;n
-
, ou seja, uma reta passando na origem;n
-
, ou seja, uma reta qualquer.n
n
n
O MMQ para uma constante
nImagine um gráfico como o da figura 4. Aparentemente é uma constante, independentemente dos valores de
. Neste caso,
pode ser uma boa expressão para descrever os dados acima. n
n
n

nFigura 4 – Alguns dados a serem ajustados.
n
n





n
n

n
n


n
n

n
n
n
n

n
n
n
n

n
n

n
n

n
n

n
n

n
n



n
nNa figura 5 mostramos a função ajustada aos dados da figura 4. Note como os dados ficam distribuídos em torno da constante ajustada.
n
n

nFigura 5 – Constante ajustada aos dados.
n
n

n
n

n
n

nn
O MMQ para uma reta passando na origem
nImagine agora a situação na qual a função que queremos ajustar aos dados seja uma reta que passa na origem, . Devemos então achar a constante
, que é o coeficiente angular da reta, utilizando o MMQ. Neste caso, o
pode ser escrito como:n
n
n

n
n



n
n

n
n
n
n

nn
n
n

n
n

n
n
n
n
n
n
n

n
n
n
O MMQ para uma reta qualquer
nNo caso de uma reta genérica, , devemos encontrar os valores de
e
que minimizam, simultaneamente, o
dos dados obtidos em relação a esta função. Seguindo os exemplos anteriores, a expressão para o
pode ser escrita como:n
n
n

n
n


n
n

n
nn
n
n


n
nVou deixar como exercício a resolução das duas derivadas acima e também a resolução do sistema de equações que surge. É muito interessante que isso seja feito com calma e atenção. O MMQ é uma importante ferramenta de análise de dados e vai estar presente no dia a dia nosso. Resolvendo o sistema de equações encontra-se que:n
n
n

n
nn
n
n

n
n

n
nn
n
nn
n
nn
n
nn
n
n
n
n

nFigura 6 – Ajuste de uma reta a pontos experimentais.
n
n
Incerteza dos parâmetros ajustados
nNote que, como os parâmetros das funções são extraídos de um conjunto de dados, é natural pensar que flutuações estatísticas neste conjunto de dados afetem os valores dos parâmetros ajustados. Se repetirmos o mesmo experimento, com o mesmo procedimento, várias vezes, é natural imaginar que, a cada vez, um conjunto de parâmetros diferente será extraído. Ou seja, os parâmetros extraídos também estão sujeitos a flutuações e, consequentemente, possuem incertezas. Como obter as incertezas dos parâmetros ajustados?
n
nA incerteza dos parâmetros ajustados pode ser obtida através de propagação de incertezas. Sendo uma função onde cada medida
possui uma incerteza
, a incerteza de
pode ser calculada através de:n
n
n

n
n





n
nn
Incerteza no ajuste de uma constante
nComo vimos acima, se fizermos um ajuste de uma constante, ou seja, , aos dados, o MMQ resulta em:
n
n

n
n

n
n

n
n

n
n

n
n
n
n

n
n
n
n

n

n
n

n
n
nn
Incerteza no ajuste de uma reta passando pela origem
nNo caso de um ajuste de uma reta passando na orígem, , a constante
, conforme deduzimos, vale:n
n
n

n
n
n

n
n

n
n
n
n
n

n
n
n
Incerteza no ajuste de uma reta qualquer
nNo caso de uma reta qualquer, , os parâmetros ajustados são dados por:n
n
n

n
nn
n
n


n
n

n
nn
n
n





n
n

n
n
Ajustes com incertezas na variável x
n O MMQ que desenvolvemos até aqui supôs que ou seja, não há incertezas nas variáveis
. Mas em muitas situações práticas, tanto as variáveis
quanto
possuem incertezas. O método formal para isso é chamado de método dos mínimos quadrados totais (ver esse link). Vamos aqui tentar simplificar um pouco e tentar compreender a ideia por trás de uma minimização onde consideramos incertezas em
e
.
n
nNo MMQ somente com incertezas em nós calculamos os resíduos entre os pontos experimentais e a função ajustada, dados por:n
n
nn
n
n
n
nn
n
n

n
nO que estamos fazendo, quando obtemos os resíduos desta forma, é calcular a “distância” entre os pontos experimentais e a função ajustada em unidades de incerteza. Quando só há incerteza em , a incerteza da diferença entre
e
é dada pela própria incerteza em
ou seja,
.
n
nQuando há incerteza em , a o valor da função em
está sujeita a uma incerteza. Sabendo que a diferença entre o ponto experimental e a função ajustada pode ser escrita como:n
n
nn
n
n
n
nn
n
n
n
nn
n
n
n
nn
n
n



n
n
- n
- Faça o ajuste da função considerando apenas as incertezas em
, ou seja, assuma que
.n
- De posse dos parâmetros ajustados, calcule incertezas “efetivas” para
dadas por:
n
- Faça novamente o ajuste da função considerando agora que as incertezas em
são as efetivas, calculadas no passo (2).n
- De posse dos novos parâmetros ajustados, repita os passos (2) e (3) até que a diferença entre uma repetição e a anterior para os valores dos parâmetros ajustados seja pequeno, se comparada à incerteza desses parâmetros. n
n
nnÉ um método trabalhoso mas com uma ou duas interações, em geral, a resposta converge e o resultado é bastante satisfatório do ponto de vista prático.
Deixe um comentário