Curso 161000 Aula 08 v3
Curso 161000 Aula 08 v3
Autor:
Equipe Exatas Estratégia
Concursos
Aula 08
17 de Fevereiro de 2021
Sumário
1.3.1 – Mediana 16
1.3.2 – Moda 17
1.3.4 – Variância 23
3. Transformação de Variáveis 30
4. Distribuições Conjuntas 34
4.1.1 – Propriedades 36
5 - Distribuições Contínuas 53
Resumo da Aula 87
Variáveis Contínuas 90
Distribuições Conjuntas 98
Gabarito 134
Olá, concurseiro!
Sou a professora Luana Brandão! Tenho mestrado e doutorado em Engenharia de Produção pela
Universidade Federal Fluminense, além de já ter sido concurseira! Passei nos concursos de analista
e auditor da RFB e de auditor da SEFAZ/RJ, onde trabalho desde 2010.
Vamos começar?
Vamos começar com um exemplo de variável contínua: a altura de um adulto normal. Essa variável
pode assumir qualquer valor entre, digamos, 1,40m e 2,20m. Podemos encontrar valores como
1,70 ou 1,83, ou podemos melhorar a precisão da medição e encontrar 1,704 ou 1,829.
Aumentando ainda mais a precisão, podemos encontrar 1,7043 ou 1,8291,...
Considerando que podemos sempre acrescentar mais uma casa decimal na medida, há infinitos
valores possíveis para a altura. E isso vale para qualquer variável contínua.
Dessa forma, a probabilidade de uma variável assumir exatamente um valor específico (por
exemplo, exatamente 1,82908) é minúscula. Mais precisamente, essa probabilidade é zero!
Por isso, para variáveis contínuas, associamos as probabilidades a um intervalo de valores (ou
conjunto de intervalos). Ou seja, podemos calcular a probabilidade de a altura estar entre, por
exemplo, 1,82 e 1,83 ou entre 1,80 e 1,90.
Assim, em vez de termos uma função de probabilidade da forma 𝑓(𝑥) = 𝑃(𝑋 = 𝑥), como no caso
de variáveis discretas, para as variáveis contínuas, temos uma função densidade de probabilidade
(f.d.p.).
𝑓(𝑥) ≥ 0
ii) A probabilidade associada a todo o Espaço Amostral é igual a 100% = 1. Logo, a área
abaixo de toda a f.d.p. é igual a 1.
Altura
Base
"#$%×'()*+#
Á𝑟𝑒𝑎 𝑇𝑟𝑖â𝑛𝑔𝑢𝑙𝑜 = 𝟐
Altura
Base
Altura
Base Maior
Se a f.d.p. for uma curva, então precisaremos calcular a área por meio da integral
dessa função. Por isso, veremos agora um breve resumo das operações mais
comuns envolvendo integral.
Para uma potência qualquer de 𝑥 (exceto para 𝑛 = −1), a integral é dada por:
𝒙𝒏"𝟏
∫ 𝒙𝒏 . 𝒅𝒙 = 𝒏2𝟏
Por exemplo:
8 $"% 8&
∫ 𝑥 ! . 𝑑𝑥 = !29
= :
8 '$"% 8 '%
∫ 𝑥 ;! . 𝑑𝑥 = ;!29
= ;9
9
Se 𝑛 = −1, temos a integral de 𝑥 ;9 = 8, cujo resultado é o logaritmo na base e:
9
∫ 8 . 𝑑𝑥 = log % 𝑥 = ln 𝑥
8 ("%
∫ 𝑎. 𝑥 3 . 𝑑𝑥 = 𝑎. 329
8) 8* 8+
Por exemplo, ∫ 3𝑥 < . 𝑑𝑥 = 3. = , ∫ 9> . 𝑑𝑥 = 9>×?
∫ 𝑎. 𝑑𝑥 = 𝑎. 𝒙
Por exemplo, ∫ 𝑑𝑥 = ∫ 1. 𝑑𝑥 = 𝒙, ∫ 3. 𝑑𝑥 = 3𝒙
∫ 𝑒 8 𝑑𝑥 = 𝑒 8
iv) A integral de uma soma (ou subtração) de expressões equivale à soma (ou
subtração) das integrais de cada expressão.
Por exemplo, para calcular a integral de 𝑓(𝑥) = 3𝑥 ! no intervalo (0,1), aplicamos o resultado da
8&
integral 𝐹(𝑥) = ∫ 3𝑥 ! . 𝑑𝑥 = 3 :
= 𝑥 : no ponto 𝒙 = 𝟏, 𝑭(𝟏) = 𝟏𝟑 = 𝟏, e no ponto 𝒙 = 𝟎, 𝑭(𝟎) =
𝟎𝟑 = 𝟎, e subtraímos esses valores:
9
1: 0:
𝑃(𝟎 < 𝑋 < 𝟏) = W (3𝑥 ! ). 𝑑𝑥 = 3. − 3. = 1 − 0 = 1
> 3 3
Para variáveis contínuas, não importa se definimos um intervalo com sinal de < ou
de ≤. Como a probabilidade de ser igual a um valor específico é zero, ou seja, P(X
= a) = 0 e P(X = b) = 0, então:
Vimos que a probabilidade associada a todo o Espaço Amostral é igual a 1, certo? Então, para
uma f.d.p. cujo valor mínimo é 𝑥D e o valor máximo é 𝑥E , a integral definida nesse intervalo é igual
a 1, ou seja:
𝒙
𝑃(𝑆) = ∫𝒙 𝑺 𝑓(𝑥). 𝑑𝑥 = 1
𝑰
Se a f.d.p. apresentar uma função para toda a reta real, então temos 𝒙𝑰 = −∞ e 𝒙𝑺 = ∞.
É possível que uma variável tenha uma f.d.p. para um intervalo e outra f.d.p. para
outro intervalo, conforme exemplo da Banca CESPE abaixo.
!
:
𝑥, 𝑠𝑒 0 ≤ 𝑥 < 1
𝑓(𝑥) = _− 8 + = , 𝑠𝑒 1 ≤ 𝑥 ≤ 3b
< H
0, 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟á𝑟𝑖𝑜
9 ! 9,= 8 =
𝑃(0,5 < 𝑥 < 1,5) = ∫>,= d: 𝑥e 𝑑𝑥 + ∫9 d− < + He 𝑑𝑥
(2017 – TRF 2ª Região) Se x é uma variável aleatória contínua, então fx(x) pode ser da forma:
10
1
|𝑥| ≥
2
9 9 9
Logo, temos 𝑓(𝑥) ≥ 0 apenas quando |𝑥| ≥ !, ou seja, para 𝑥 ≤ − ! ou 𝑥 ≥ !, e não para todo o
:
intervalo 𝑥 ∈ d0, !e. Portanto, a afirmativa I está incorreta.
28 28
W 𝑑𝑥 = 𝑥
37 37
11
5. 𝑥 < 11. 𝑥
𝑓(𝑥) = − ≥0
11 13
5. 𝑥 < 11. 𝑥
≥
11 13
:
Como sabemos que 𝑥 ≠ 0, porque 𝑥 ∈ d! , 2e, então podemos dividir ambos os lados por 𝑥:
5. 𝑥 : 11
≥
11 13
121
𝑥: ≥
65
& 121
𝑥≥t ≅ 1,23
65
:
Logo, 𝑓(𝑥) ≥ 0 para 𝑥 ≥ 1,23. Como 𝑥 ∈ d! , 2e, ou seja, 𝑥 > 1,5, então 𝑓(𝑥) atende à primeira
condição. Vejamos a segunda:
8/ ! ! !
5. 𝑥 < 11. 𝑥 5. 𝑥 < 11. 𝑥
W 𝑓(𝑥). 𝑑𝑥 = W o − p . 𝑑𝑥 = W . 𝑑𝑥 − W . 𝑑𝑥
80 9,= 11 13 9,= 11 9,= 13
5. 𝑥 < 5. 𝑥 <29 5. 𝑥 = 𝑥=
W . 𝑑𝑥 = = . 𝑑𝑥 =
11 11 × (4 + 1) 11 × 5 11
(CESPE/2013 – CNJ)
12
A função f(t) mostrada acima corresponde à função densidade de probabilidade do tempo gasto
(t, em meses) para se analisar um processo em determinada vara civil. Com relação essa função,
julgue os itens seguintes.
(CESPE/2013 – CNJ) A probabilidade de um processo, escolhido ao acaso, demorar menos de
três meses para ser analisado é superior a 0,99.
Comentários:
Por se tratar de uma variável contínua, temos 𝑃(𝑡 < 3) = 𝑃(𝑡 ≤ 3).
Pelo enunciado, observamos que para t > 3, a função densidade é igual a zero, ou seja:
𝑃(𝑡 > 3) = 0
Logo, a probabilidade complementar é:
𝑃(𝑡 ≤ 3) = 1 − 𝑃(𝑡 > 3) = 1 − 0 = 1
Como 1 é superior a 0,99, o item está certo.
Gabarito: Certo.
13
Assim como para variáveis discretas, a função de distribuição acumulada (f.d.a.) ou função de
distribuição cumulativa, ou simplesmente, função de distribuição, para variáveis contínuas
também é definida como a probabilidade acumulada desde o início até o ponto indicado:
𝐹(𝑘) = 𝑃(𝑋 ≤ 𝑘)
𝟎 ≤ 𝑭(𝒙) ≤ 𝟏
Formalmente, dissemos que quando x tende a menos infinito (ou seja, x apresenta
valores muito pequenos), a f.d.a. é igual a 0 e quando x tende a mais infinito (ou seja, x
apresenta valores muito grandes), a f.d.a. é igual a 1:
14
Observe que a função é crescente. Além disso, sabemos que o valor da f.d.a. no
extremo inferior é igual a zero, 𝐹(𝐼) = 𝟎 e no limite superior, igual a 1, 𝐹(𝑺) = 𝟏.
Assim, podemos observar pelo gráfico que 𝑥 pertence ao intervalo (0; 0,7).
(Adaptada: 2017 – TRF 2ª Região) Seja FX a função de distribuição cumulativa da variável aleatória
X e FY a função de distribuição cumulativa da variável aleatória Y. Sobre as propriedades da função
de distribuição cumulativa, julgue os itens a seguir.
I. FX é não decrescente, isto é, FX(a) ≤ FX(b) sempre que a < b, ∀ a,b, ∈ |R.
II. limx→ – ∞ FX (x) = 0 e limx→ ∞ FX (x) = 1.
Comentários:
Em relação ao item I, sabemos que uma função de distribuição acumulada é não decrescente. Ou
seja, se a < b, então o valor da função acumulada no ponto a é menor ou igual ao seu valor no
ponto b: F(a) < F(b). Portanto, o item I está certo.
Em relação ao item II, vimos que, quando x tende a menos infinito, a função acumulada é igual a
0 e, quando x tende a mais infinito, a função acumulada é igual a 1. Portanto, o item II está certo.
Resposta: Itens I e II certos.
15
A partir da f.d.p. ou da f.d.a., podemos calcular as medidas de tendência central (mediana, moda
e média) e de dispersão (variância e desvio padrão), como veremos nesta seção.
1.3.1 – Mediana
De aulas anteriores, sabemos que a mediana divide a distribuição em duas partes iguais, de modo
que metade das observações são superiores e metade das observações são inferiores, ou seja:
𝐹(𝑥/N ) = 0,5
:
3𝑥/N = 0,5
: >,= 9
𝑥/N = :
=H
& 9
𝑥/N = •H ≅ 0,55
16
1.3.2 – Moda
Como vimos em aulas anteriores, a moda corresponde ao valor com maior probabilidade. A moda
pode ser visualmente identificada, a partir do gráfico da f.d.p., pois é o valor de 𝑥 associado ao
maior valor da função densidade de probabilidade, 𝑓(𝑥).
Se a f.d.p., definida em determinado intervalo, for uma função que sabemos ser
decrescente ou crescente, então a moda será o extremo inferior ou superior,
respectivamente, do intervalo da função.
Moda Moda
17
Se a f.d.p. for uma parábola com concavidade voltada para cima, a moda será
um dos extremos (ou ambos). Nessa situação, teste os dois extremos para saber
qual corresponde ao maior valor da f.d.p.; ou se ambos apresentam o mesmo
valor, caso em que haverá duas modas.
Moda(?) Moda(?)
Se for uma parábola com concavidade voltada para baixo, a moda será a média
entre as raízes. Raízes são os valores de x para os quais a função é igual a zero.
Moda
Porém, se não for possível identificar a moda dessa forma, então será necessário calcular a
derivada da f.d.p. O valor da moda será, então, o valor de 𝑥 para o qual a derivada da f.d.p. seja
igual a zero.
N(8 𝒂 )
N8
= 𝑎. 𝑥 𝒂;𝟏
18
Por exemplo:
N(8 𝟒 )
N8
= 4. 𝑥 𝟒;𝟏 = 4𝑥 :
N(8 '𝟐 )
N8
= −𝟐. 𝑥 ;𝟐;𝟏 = −2𝑥 ;:
N(#)
ii) A derivada de uma constante é zero: N8
=0
N(=) N(!>)
Por exemplo, N8
= 0, N8
=0
iii) A derivada de uma função qualquer 𝑓(𝑥) multiplicada por uma constante 𝒂
é igual ao produto da constante pela derivada da função. Por exemplo:
N(𝒂.8 𝒃 ) N() 𝒃 )
N)
= 𝑎. N)
= 𝑎. 𝒃. 𝑡 𝒃;𝟏
N(𝒆𝒕 )
N)
= 𝒆𝒕
Por exemplo, suponha que 𝑓(𝑥) = 𝑥 − 𝑥 ! , 𝑝𝑎𝑟𝑎 𝑥 ∈ [0,1] seja uma f.d.p. Vamos primeiro derivá-la:
𝑑
(𝑥 − 𝑥 ! ) = 1 − 2𝑥
𝑑𝑥
A moda corresponde ao valor de 𝑥 para o qual essa derivada seja nula, logo:
1 − 2𝑥 = 0
𝑥 = 0,5
𝐸(𝑿) = † 𝒙. 𝑃(𝑥)
19
Para o caso contínuo, a situação é análoga. Porém, como os elementos não são contáveis, não
conseguimos somá-los. Por isso, substituímos a soma do produto, pela integral do produto.
Além disso, substituímos a probabilidade 𝑃(𝑥) pela função densidade de probabilidade da variável
contínua 𝑓(𝑥). Assim, para uma f.d.p. definida no intervalo de 𝑥D a 𝑥E , a esperança é:
8
𝐸(𝑿) = ∫8 / 𝒙. 𝑓(𝑥) . 𝑑𝑥
0
Pontue-se que todas as propriedades de esperança vistas na aula passada valem para variáveis
contínuas:
20
(2014 – DETRAN/RO) Seja X uma variável aleatória contínua com função densidade de
probabilidade dada por:
2. 𝑥Š , 𝑠𝑒 2 < 𝑥 < 3
𝑓(𝑥) = ‰ 5 ‹
0, 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟á𝑟𝑖𝑜
O valor esperado de X é, aproximadamente, igual a
a) 1,0
b) 1,5
c) 2,0
d) 2,5
e) 3,0
Comentários:
O valor esperado (ou média) de uma variável aleatória é definido como:
8/
𝐸(𝑋) = W 𝑥. 𝑓(𝑥). 𝑑𝑥
80
: :
2. 𝑥 2. 𝑥 !
𝐸(𝑋) = W 𝑥. . 𝑑𝑥 = W . 𝑑𝑥
! 5 ! 5
!.8 $ !.8 & !.8 &
Considerando que ∫ =
. 𝑑𝑥 = =×:
= 9=
, então aplicando os limites, temos:
2 2 2 × 19
𝐸(𝑋) = . (3: − 2: ) = . (27 − 8) = = 2,5333 …
15 15 15
Resposta: D.
(CESPE/2013 – CNJ)
21
A função f(t) mostrada acima corresponde à função densidade de probabilidade do tempo gasto
(t, em meses) para se analisar um processo em determinada vara civil. Com relação essa função,
julgue o item seguinte.
(CESPE/2013 – CNJ) Cada processo demora, em média, pelo menos 1,5 mês para ser analisado.
Comentários:
A média (ou esperança) é dada por:
𝐸(𝑋) = W 𝑥. 𝑓(𝑥) . 𝑑𝑥
22
25
𝐸(10. 𝑇) = 10. 𝐸(𝑇) = 10 × ≅ 14
18
Como 14 meses são superiores a 1 ano (composto de 12 meses), o item está correto.
Gabarito: Certo.
1.3.4 – Variância
A variância de uma variável aleatória 𝑋, seja ela discreta ou contínua, pode ser calculada como:
𝐸(𝑋 ! ) = † 𝒙𝟐 . 𝑃(𝑥)
Para variáveis contínuas, substituímos o somatório pela integral e a probabilidade 𝑃(𝑥) pela f.d.p.
𝑓(𝑥):
8
𝐸(𝑿𝟐 ) = ∫8 / 𝒙𝟐 . 𝑓(𝑥). 𝑑𝑥
0
Todas as propriedades de variância vistas na aula passada valem para variáveis contínuas:
i) 𝑉(𝑋 + 𝑘) = 𝑉(𝑋)
ii) 𝑉(𝑘. 𝑋) = 𝑘 ! . 𝑉(𝑋)
V X(V)
iii) 𝑉 dW e = W$
Além disso, vale ressaltar a seguinte propriedade, válida somente para variáveis independentes,
que também se aplica tanto para o caso discreto quanto para o caso contínuo:
Antes de explicá-lo, vale pontuar que existem diversas maneiras de escrever o nome do
matemático russo: Chebyshev, Tchebychev, Tschebyscheff, Chebychov,...
𝝈𝟐
𝑃(|𝑋 − 𝝁| ≥ 𝜹) ≤ 𝜹𝟐
O que essa desigualdade indica é que a probabilidade de X se distanciar da média (para cima ou
𝝈𝟐
para baixo) em mais que um determinado valor 𝜹 é, no máximo, igual à razão 𝜹𝟐 . Atente-se que:
𝑃(|𝑋 − 𝝁| ≥ 𝜹) = 𝑃(𝑋 ≤ 𝝁 − 𝜹 ∪ 𝑋 ≥ 𝝁 + 𝜹)
Vamos supor que uma fábrica produza, em média, 1000 unidades por dia de
determinado medicamento, com variância de 200 unidades2/dia. Com apenas
essas informações, vamos calcular a probabilidade de a fábrica produzir menos
que 900 unidades ou mais que 1100 unidades em um dia.
[$
𝑃(|𝑋 − 𝜇| ≥ 𝛿) ≤ \ $
!>>
𝑃(𝑋 < 900 ∪ 𝑋 > 1100) = 𝑃(|𝑋 − 1000| ≥ 100) ≤ (9>>)$
24
(2011 – TRT 1ª Região) Utilizando o Teorema de Tchebyshev, obteve-se que o valor máximo da
probabilidade dos empregados de uma empresa, que ganham um salário igual ou inferior a R$
1.500,00 ou um salário igual ou maior a R$ 1.700,00, é 25%. Sabendo-se que a média destes
salários é igual a R$ 1.600,00, encontra-se a respectiva variância, em (R$)2, que é
a) 2.500
b) 3.600
c) 4.900
d) 6.400
e) 10.000
Comentários:
Pelo Teorema de Chebyshev, sabemos que:
𝜎!
𝑃(|𝑋 − 𝜇| ≥ 𝛿) ≤
𝛿!
Sendo 𝜇 = 1600, então a distância em relação à média é maior que 𝛿 = 100, pois |1500 – 1600| =
100 e |1700 – 1600| = 100:
𝜎!
𝑃(|𝑋 − 1600| ≥ 100) ≤
100!
[$
O enunciado informa ainda que 𝑃(|𝑋 − 1600| ≥ 100) ≤ 25%, então concluímos que 9>>$
é igual a
25%:
𝜎!
= 25%
100!
𝜎 ! = 0,25 × 100 × 100 = 2500
Resposta: A.
Existe, ainda, uma estimativa para a probabilidade de uma variável se afastar da média apenas
para cima, chamada de versão unilateral de Cantelli da desigualdade de Chebyshev (ou de
desigualdade unilateral de Chebyshev ou, ainda, de desigualdade de Cantelli):
25
𝝈𝟐
𝑃(𝑋 − 𝝁 ≥ 𝜹) ≤ 𝝈𝟐 2𝜹𝟐
[$
𝑃(𝑋 − 𝜇 ≥ 𝛿) ≤ [$ 2\ $
!>>
𝑃(𝑋 − 1000 ≥ 100) ≤ !>>29>.>>>
𝜇𝒌 = 𝐸(𝑋 𝒌 )
Essa definição vale tanto para variáveis discretas, quanto para variáveis contínuas.
Especificamente, para o caso discreto, temos:
E
𝜇𝒌 = 𝐸—𝑋 𝒌 ˜ = W (𝑥0 )𝒌 . 𝑓(𝑥0 ). 𝑑𝑥
D
27
𝜇9 = 𝐸(𝑋9 ) = 𝐸(𝑋)
Essa é a fórmula da esperança matemática. Por isso, dizemos que a esperança corresponde ao
primeiro momento, ou momento de ordem 1.
𝜇! = 𝐸(𝑋 ! )
Essa é a fórmula que utilizamos para o cálculo da variância: 𝜎 ! = 𝐸(𝑋 ! ) − [𝐸(𝑋)]! . Ou seja,
podemos calcular a variância pela diferença entre o segundo momento e o quadrado do
primeiro momento:
Essa definição também vale tanto para variáveis discretas, quanto para variáveis contínuas.
Especificamente, para o caso discreto, temos:
E
𝜇W7 = 𝐸 [(𝑋 − 𝜇)W ] = W (𝑥0 − 𝜇)W . 𝑓(𝑥0 ). 𝑑𝑥
D
𝜇97 = 𝐸(𝑋 − 𝜇)
Ou seja, é o valor esperado da diferença entre os elementos e a média. Pela definição de média,
esse valor é igual a zero. Portanto, o primeiro momento central é sempre nulo.
28
Essa é a definição de variância. Por isso, o segundo momento central, ou momento central de
ordem 2, é igual à variância.
𝒌-ésimo Momento
E
Variável Contínua: 𝜇W = 𝐸(𝑋 W ) = ∫D (𝑥0 )W . 𝑓(𝑥0 ). 𝑑𝑥
E
Variável contínua: 𝜇W = 𝐸 [(𝑋 − 𝜇)W ] = ∫D (𝑥0 − 𝜇)W . 𝑓(𝑥0 ). 𝑑𝑥
29
Comentários:
Em relação ao item I, vimos que o k-ésimo momento de uma variável aleatória é, de fato, 𝜇W =
𝐸(𝑋 W ), logo o item I está correto.
Em relação ao item II, vimos que distribuições de probabilidade distintas podem ter os mesmos
momentos. Logo, variáveis contínuas podem ter f.d.p. distintas e apresentar os mesmos
momentos.
Resposta: Itens I e II Certos.
3. TRANSFORMAÇÃO DE VARIÁVEIS
Utilizamos a técnica da transformação de variáveis, quando conhecemos a função densidade de
probabilidade de uma variável 𝑋 e queremos encontrar a função de outra variável 𝑌, que possui
uma relação conhecida com 𝑋, da forma 𝑌 = ℎ(𝑋). Essa transformação funciona tanto para
variáveis discretas, quanto para variáveis contínuas.
Essa expressão corresponde aos seguintes passos para encontrar 𝑃[𝑌 = 𝑦]:
Por fim, os possíveis valores que 𝑌 pode podem ser calculados como 𝒚 = 𝒉(𝒙).
30
𝑌 = 2𝑋 + 2
]
𝑋 = !+1
^
Em seguida, na expressão de 𝑃[𝑋 = 𝑥] = 0,1 × 0,98;9 , substituímos 𝑥 por ! + 1:
8
𝑃[𝑌 = 𝑦] = 0,1 × 0,9$
Se as probabilidades de X, 𝑃[𝑋 = 𝑥], não forem uma função de 𝑥, ou seja, se elas forem fixas,
então não será necessário calcular a inversa 𝑋 = ℎ;9 (𝑦). Nesse caso, basta encontrar os possíveis
valores 𝒚𝒊 = 𝒉(𝒙𝒊 ) e substituir 𝑥0 por 𝑦0 .
𝑥! 𝑃(𝑥! )
1 15%
3 25%
5 40%
7 20%
Para a transformação de variáveis contínuas, temos uma situação parecida. Porém, ao invés de
substituir a expressão 𝑥 = ℎ;9 (𝑦) em 𝑃[𝑋 = 𝑥 ], utilizamos a Função de Distribuição Acumulada
(chamado Método da Função de Distribuição).
Sendo 𝐹V a f.d.a. de 𝑋 e 𝐹] a f.d.a. de 𝑌, então se 𝑌 = ℎ(𝑋) for uma função crescente, temos:
31
N` '% (^)
𝑓] [𝑦] = 𝑓V [ℎ;9 (𝑦)]. ž N^
ž
]
𝑌 = 2𝑋 à 𝑋 = !
𝑓V (𝑥) = 3𝑥 !
^ ! :
𝑓V [ℎ;9 (𝑦)] = 3 d !e = < 𝑦 !
8
N` '% (^) Na b 9
$
N^
= N^
=!
N` '% (^)
Assim, o produto 𝑓V [ℎ;9 (𝑦)] × ž N^
ž é:
: 9 :
𝑓] [𝑦] = < 𝑦 ! × ! = ? 𝑦 !
32
9
𝑓] [𝑦] = ! 𝑓V —¡𝑦˜ + 𝑓V —−¡𝑦˜¢
√^
Nessa expressão, 𝑓V —¡𝑦˜ significa que, na f.d.p. de 𝑥, substituímos 𝑥 por ¡𝑦, e 𝑓V —−¡𝑦˜ significa
que substituímos 𝑥 por −¡𝑦.
E também:
𝑑ℎ;9 (𝑦) 𝑑𝑦 !
= = 2𝑦
𝑑𝑦 𝑑𝑦
Então, a função densidade de Y é dada por:
𝑒 ;!.^
𝑓] [𝑦] = × 2. 𝑦 = 2. 𝑒 ;!.^
𝑦
Resposta: B.
4. DISTRIBUIÇÕES CONJUNTAS
Nesta seção, estudaremos distribuições conjuntas, que permitem a análise simultânea de duas ou
mais variáveis. Vamos começar os nossos estudos pelas medidas utilizadas nessa análise.
Observe que existem variáveis fortemente relacionadas, como o volume e o peso de água, e outras
nem tanto, como a altura dos pais e a altura dos filhos. Também existem variáveis que se
relacionam em um mesmo sentido (quanto mais altos são os pais, mais altos os filhos tendem a
ser) e variáveis que se relacionam em sentidos opostos (quanto maior o preço, menor a demanda).
A covariância e a correlação caracterizam tanto a força da relação entre duas variáveis, quanto a
sua orientação (se variam no mesmo sentido ou em sentidos opostos). A covariância entre duas
variáveis aleatórias 𝑋 e 𝑌 (contínuas ou discretas), representada por 𝐶𝑜𝑣(𝑋, 𝑌), é, dada por:
34
∑0 𝑥0 . 𝑦0
𝐸(𝑋. 𝑌) =
𝑛
De modo geral, quando a covariância das variáveis é positiva, elas variam no mesmo sentido
(relação positiva), em média; e quando a covariância é negativa, elas variam em sentidos opostos
(relação negativa), em média.
Entretanto, a força da relação entre duas variáveis é difícil de interpretar a partir da covariância.
Para isso, há o conceito de correlação (ou coeficiente de correlação), indicado por 𝝆, em que
dividimos a covariância pelo desvio padrão de ambas as variáveis:
e1f(V,])
𝜌(𝑋, 𝑌) = [9 .[:
Além disso, quando 𝝆 = 𝟏, há uma correlação linear perfeita positiva, ou seja, as variáveis
apresentam uma relação linear entre si. É o caso do volume de água e do peso da caixa d’água.
Quando 𝝆 = −𝟏, há uma correlação linear perfeita negativa. Um exemplo dessa relação seria o
peso da caixa d’água e o seu espaço disponível.
35
4.1.1 – Propriedades
Veremos agora propriedades da covariância e da correlação, que também valem tanto para
variáveis discretas, quanto para variáveis contínuas.
i) 𝑪𝒐𝒗(𝑿, 𝒀) = 𝑪𝒐𝒗(𝒀, 𝑿)
A covariância é uma medida simétrica, ou seja, não importa qual é a variável que aparece primeiro.
36
𝐶𝑜𝑣(𝑋, 𝑋) 𝑉𝑎𝑟(𝑋)
𝝆(𝑿, 𝑿) = = =𝟏
𝜎V . 𝜎V 𝜎V !
iii) 𝑪𝒐𝒗(𝒌, 𝑿) = 𝟎
A covariância entre a soma de variáveis aleatórias X + Y e uma outra variável Z é igual à soma da
covariância entre X e Z com a covariância entre Y e Z.
A covariância entre duas variáveis aleatórias 𝑋 e 𝑌, multiplicadas por constantes, é igual ao produto
das constantes pela covariância entre as variáveis 𝑋 e 𝑌.
Já o coeficiente de correlação será 𝝆(𝒌. 𝑿, 𝒍. 𝒀) = 𝝆(𝑿, 𝒀), se 𝒌. 𝒍 > 𝟎 e que 𝝆(𝒌. 𝑿, 𝒍. 𝒀) = −𝝆(𝑿, 𝒀),
se 𝒌. 𝒍 < 𝟎.
Por fim, pontue-se que quando somamos constantes às variáveis, o coeficiente de correlação não
varia, sejam constantes positivas ou negativas:
𝜌(𝑋 + 𝑎, 𝑌 + 𝑏) = 𝜌(𝑋, 𝑌)
(2015 – Prefeitura de Recife/PE) Uma variável aleatória X tem média igual a 2 e desvio padrão
igual a 2. Se Y = 6 – 2X, então a média de Y, a variância de Y e o coeficiente de correlação entre
X e Y valem, respectivamente,
a) -2, 4 e 1.
b) -2, 16 e 1.
37
c) 2, 16 e -1.
d) 10, 2 e -1.
e) 2, 4 e -1.
Comentários:
Pelas propriedades da esperança, temos:
E(Y) = E(6 – 2X) = 6 – 2.E(X) = 6 – 2.2 = 2
Pela propriedade da variância, temos:
V(Y) = V(6 – 2X) = (-2)2.V(X) = 4.V(X) = 4.22 = 16
Pela propriedade do coeficiente de correlação, temos:
𝜌 (X,Y) = 𝜌 (X,-2X) = - 𝜌 (X,X) = -1.
Resposta: alternativa c.
No caso geral, a variância da soma de duas variáveis aleatórias é dada pela seguinte fórmula:
Para ajudar a lembrar a fórmula, observe a similaridade das fórmulas acima com os produtos
notáveis:
(𝑥 + 𝑦)! = 𝑥 ! + 𝑦 ! + 2. 𝑥. 𝑦
(𝑥 − 𝑦)! = 𝑥 ! + 𝑦 ! − 2. 𝑥. 𝑦
Para variáveis independentes 𝑋, 𝑌, temos 𝐶𝑜𝑣(𝑋, 𝑌) = 0, portanto:
38
(2016 – IBGE) Se duas variáveis aleatórias, X e Y, têm correlação linear negativa, então:
a) Quanto menor for o valor de X, menor será o valor de Y.
b) A soma dos valores esperados de X e Y é menor do que o valor esperado de X + Y.
c) O produto dos valores esperados de X e Y é menor do que o valor esperado do produto X.Y.
d) A soma das variâncias de X e Y é igual ou menor do que as variâncias de X + Y.
e) A soma das variâncias de X e Y é estritamente maior do que a variância de X + Y.
Comentários:
A questão informa que Cov(X,Y) < 0.
Em relação à alternativa A, como a covariância é negativa, então X e Y se relacionam em sentidos
opostos. Assim, quanto menor for o valor de X, maior será o valor de Y (em média).
Portanto: alternativa A incorreta.
Em relação à alternativa B, E(X + Y) = E(X) + E(Y), por definição, para quaisquer variáveis X e Y.
Portanto: alternativa B incorreta.
Em relação à alternativa C, o valor de E(X.Y) pode ser calculado a partir da covariância:
Cov(X,Y) = E(X.Y) – E(X).E(Y)
E(X.Y) = Cov(X,Y) + E(X).E(Y)
Sendo Cov(X,Y) < 0, então E(X.Y) < E(X).E(Y), ou seja, E(X).E(Y) > E(X.Y)
Portanto: alternativa C incorreta.
Em relação às alternativas D e E, o valor de V(X + Y) é:
V(X + Y) = V(X) + V(Y) + 2.Cov(X,Y)
Como Cov(X,Y) < 0, então V(X + Y) < V(X) + V(Y), ou seja, V(X) + V(Y) > V(X + Y).
Portanto: alternativa D incorreta e alternativa E correta.
Resposta: E.
(2015 – TJ/RO) Seja X = número de anos de condenação e Y = nível de renda do condenado (mil
reais). São fornecidas ainda as seguintes informações:
Var(X) = 25; Var (Y) = 16 e Var (X+Y) = 21
39
Resposta: D.
Essas probabilidades são normalmente representadas por uma tabela. A título de ilustração,
suponha 10 bolas numeradas de 1 a 10, em que o sucesso de X, em que X = 1, corresponde à
seleção de número múltiplo de 3 (e os demais resultados, ao fracasso, em que X = 0) e que o
sucesso de Y, em que Y = 1, corresponde à seleção de um número primo (e os demais, ao fracasso,
em que Y = 0).
40
Bola X Y
1 0 0
2 0 1
3 1 1
4 0 0
5 0 1
6 1 0
7 0 1
8 0 0
9 1 0
10 0 0
Esses valores podem ser representado pela seguinte tabela de distribuição conjunta:
Y
0 1
0 40% 30%
X
1 20% 10%
Tanto para o caso discreto quanto para o caso contínuo, a função de distribuição acumulada
conjunta é definida como:
𝐹(𝑥, 𝑦) = 𝑃(𝑋 ≤ 𝑥, 𝑌 ≤ 𝑦)
41
Y
P(X=x)
0 1
0 40% 30% 70%
X
1 20% 10% 30%
P(Y=y) 60% 40% 100%
Ou seja, os valores da probabilidade marginal de X, quais sejam, P(X = 0) e P(X = 1), são obtidos
pela soma das respectivas linhas; e os valores da probabilidade marginal de Y, quais sejam, P(Y =
0) e P(Y = 1), são obtidos pela soma das respectivas colunas.
As probabilidades marginais são muito importantes para sabermos se duas variáveis são
independentes ou não. Para que sejam independentes, é necessário termos a seguinte identidade
para todos os possíveis valores de X = x e Y = y:
Pela tabela acima, observamos que as variáveis não são independentes. Caso fossem
independentes, o valor de cada campo corresponderia ao produto entre a soma da linha e a
soma da coluna, conforme indicado a seguir:
Y
P(X=x)
0 1
0 70% x 60% = 42% 70% x 40% = 28% 70%
X
1 30% x 60% = 18% 30% x 40% = 12% 30%
P(Y=y) 60% 40% 100%
42
𝑃(𝑋 = 𝑥 ∩ 𝑌 = 𝑦)
𝑃(𝑌 = 𝑦|𝑋 = 𝑥) =
𝑃(𝑋 = 𝑥)
Para o exemplo das bolas numeradas de 1 a 10, podemos calcular, por exemplo, a probabilidade
𝑃(𝑌 = 1|𝑋 = 0). Sabendo que 𝑃(𝑌 = 1, 𝑋 = 0) = 30% e 𝑃(𝑋 = 0) = 70%, então:
𝑃(𝑌 = 1 ∩ 𝑋 = 0) 30% 3
𝑃(𝑌 = 1|𝑋 = 0) = = =
𝑃(𝑋 = 0) 70% 7
44
45
𝐸(𝑌|𝑋 = 𝑥) = † 𝑦g . 𝑃—𝑌 = 𝑦g |𝑋 = 𝑥˜
g
Para isso, precisamos do cálculo do segundo momento condicional, 𝐸(𝑌 ! |𝑋 = 𝑥), dado por:
!
𝐸(𝑌 ! |𝑋 = 𝑥) = †—𝑦g ˜ . 𝑃—𝑌 = 𝑦g |𝑋 = 𝑥˜
g
:
𝐸(𝑌 ! |𝑋 = 0) = 𝑃(𝑌 = 1|𝑋 = 0) = J
: : ! !9;h 9!
𝑉(𝑌|𝑋 = 0) = J − dJe = <h
= <h
Vamos exemplificar esses cálculos com base na mesma tabela, replicada a seguir:
Y
P(X=x)
0 1
0 40% 30% 70%
X
1 20% 10% 30%
P(Y=y) 60% 40% 100%
i(]j9,Vj9) 9>% 9
𝐸(𝑌|𝑋 = 1) = 𝑃(𝑌 = 1|𝑋 = 1) = i(Vj9)
= :>% = :
:
Sabendo que 𝐸(𝑌|𝑋 = 0) = J, o valor de 𝐸(𝑌) é:
: 9
𝐸(𝑌) = J × 0,7 + : × 0,3 = 0,3 + 0,1 = 0,4
47
: 9
𝐸(𝑌 ! ) = J × 0,7 + : × 0,3 = 0,3 + 0,1 = 0,4
Ou seja, para encontrar 𝐸(𝑌), podemos multiplicar os valores 𝑦 pelas probabilidades conjuntas e,
em seguida, somar os produtos para todos os possíveis valores 𝑦, como indicado abaixo:
Ou seja, para encontrar 𝐸(𝑌 ! ), podemos multiplicar os valores 𝑦 elevados ao quadrado, pelas
probabilidades conjuntas e, em seguida, somar os produtos:
48
Para X = 1, temos:
1 1
𝐸(𝑌|𝑋 = 1) = (1 × 𝑝(1,1) + 2 × 𝑝(1,2)) = (1 × 0,16 + 2 × 𝑘! )
𝑃(𝑋 = 1) 𝑃(𝑋 = 1)
Sabendo que a soma de todos os campos é igual a 100%, então:
𝑃(𝑈) = 0,14 + 0,03 + 0,08 + 0,12 + 0,16 + 𝑘! + 𝑘9 + 0,25 = 1
𝑃(𝑈) = 0,78 + 𝑘! + 𝑘9 = 1
𝑘! + 𝑘9 = 0,22
49
Se 𝑘9 = 0,08, então:
𝑘! = 0,22 − 0,08 = 0,14
Além disso, sabemos que a probabilidade marginal de X = 1 é dada por:
𝑃(𝑋 = 1) = 0,16 + 𝑘! = 0,16 + 0,14 = 0,3
Portanto, a probabilidade condicional é:
1 1 0,44
𝐸(𝑌|𝑋 = 1) = (1 × 0,16 + 2 × 𝑘! ) = (0,16 + 0,28) = ≅ 1,467
𝑃(𝑋 = 1) 0,3 0,3
Como 1,467 < 1,5, o item está errado.
Resposta: Errado.
A distribuição multinomial considera 𝑁 ensaios independentes, em que cada ensaio pode resultar
em 𝒌 valores distintos, com probabilidades 𝑝9 , 𝑝! , … , 𝑝W , respectivamente, sendo ∑W0j9 𝑝0 = 1 (soma
de todas as probabilidades igual a 1). Nessa situação, as variáveis aleatórias 𝑋9 , 𝑋! , … , 𝑋W , chamadas
multinomiais, representarão o número de vezes que os resultados do tipo 1, 2, … , 𝑘,
respectivamente, forem observados.
l!
𝑝(𝑛9 , 𝑛! , … , 𝑛W ) = 3 × (𝑝9 )3% × (𝑝! )3$ × … × (𝑝W )3;
% !3$ !…3; !
50
Suponha uma caixa com 10 bolas, das quais 4 são pretas, 3 são brancas, 2 são
azuis e 1 é verde, e que vamos selecionar uma bola ao acaso, observar a sua cor e
devolvê-la à caixa. Vamos repetir esse procedimento 5 vezes e calcular a
probabilidade de obter 2 vezes uma bola preta e 1 vez as demais cores.
< ! : ! 9 9
𝑝9 = 9> = = , 𝑝! = 9> , 𝑝: = 9> = = , 𝑝< = 9>
l!
𝑝(𝑛9 , 𝑛! , 𝑛: , 𝑛< ) = 3 × (𝑝9 )3% × (𝑝! )3$ × (𝑝: )3& × (𝑝< )3<
% !3$ !3& !3< !
=! ! ! : 9 9 9 9 9
𝑝(2,1,1,1) = !!9!9!9! × d=e × d9>e × d=e × d9>e
< : 9 9 9<<
𝑝(2,1,1,1) = 5 × 4 × 3 × != × 9> × = × 9> = !=>> = 5,76%
𝐶𝑜𝑣(𝑋* , 𝑋f ) = −𝑛. 𝑝* . 𝑝f
(CESPE/2013 – TRT 17ª Região) Considere que, em um tribunal, os processos sejam classificados
como urgentes (T1) e não urgentes (T2) e que os não urgentes sejam reclassificados como
51
importantes (T2.1) ou não importantes (T2.2). Considere-se, ainda, que a proporção de processos
do tipo T1 seja 0,5 e que, entre os processos do tipo T2, 0,2 sejam do tipo T2.1 e 0,8 do tipo T2.2.
Se X, Y e Z forem, respectivamente, as contagens de processos de tipos T1, T2.1 e T2.2 em
determinado momento, então a distribuição conjunta de (X, Y, Z) é uma multinomial com
parâmetros 0,5, 0,1 e 0,4.
Comentários:
Considerando que há mais do que dois resultados possíveis, não temos uma distribuição binomial,
mas sim uma distribuição multinomial.
Sabendo que X está associado aos processos urgentes (T1), então 𝑝8 = 0,5.
Considerando que Y está associada aos processos não urgentes e importantes (T2.1) e que
corresponde 0,2 dos processos não urgentes, então:
𝑝^ = 0,2 × 0,5 = 0,1
Considerando que Z está associada aos processos não urgentes e não importantes (T2.2) e que
corresponde a 0,8 dos processos não urgentes, então:
𝑝o = 0,8 × 0,5 = 0,4
Gabarito: Certo.
(Adaptada: 2019 – DPE/RJ) O nível de escolaridade dos cidadãos que necessitam recorrer à
Defensoria Pública do RJ segue uma distribuição multinomial com parâmetros p1 = 0,4, p2 = 0,3,
p3 = 0,2 e p4 = 0,1, que são as probabilidades de que pertençam à classe menos instruída (Cp1)
até a classe mais instruída (Cp4). Com base nessa distribuição, julgue o item a seguir.
Selecionando 10 pessoas ao acaso, com reposição, a probabilidade de obter as quantidades Cp1
= 4, Cp2 = 3, Cp3 = 2 e Cp4 = 1 é menor que 30%.
Comentários:
A probabilidade de 𝑛9 = 4, 𝑛! = 3, 𝑛: = 2, 𝑛< = 1 é dada por
𝑁!
𝑝(𝑛9 , 𝑛! , 𝑛: , 𝑛< ) = × (𝑝9 )3% × (𝑝! )3$ × (𝑝: )3& × (𝑝< )3<
𝑛9 ! 𝑛! ! 𝑛: ! 𝑛< !
10!
𝑝(4,3,2,1) = × (0,4)< × (0,3): × (0,2)! × (0,1)9
4! 3! 2! 1!
𝑝(4,3,2,1) = 10 × 9 × 4 × 7 × 5 × 0,0256 × 0,027 × 0,04 × 0,1 ≅ 0,348
Resposta: Errado.
(Adaptada: 2014 – HC-UFPE) Um geneticista acredita que a cor dos olhos, classificada em três
categorias (preto, marrom, verde/azul), ocorre, respectivamente, com as seguintes porcentagens:
30%, 50% e 20%. Com base nessa crença, julgue o item a seguir.
A probabilidade de selecionar ao acaso, com reposição, 3 pessoas com olhos pretos, 4 pessoas
com olhos marrons e 1 pessoa com olhos verdes/azuis é inferior a 10%.
52
Comentários:
A probabilidade de 𝑛9 = 3, 𝑛! = 4, 𝑛: = 1, é dada por
𝑁!
𝑝(𝑛9 , 𝑛! , 𝑛: ) = × (𝑝9 )3% × (𝑝! )3$ × (𝑝: )3&
𝑛9 ! 𝑛! ! 𝑛: !
8!
𝑝(3,4,1) = × (0,3): × (0,5)< × (0,2)9
4! 3! 1!
𝑝(3,4,1) = 8 × 7 × 5 × 0,027 × 0,0625 × 0,2 = 0,0945
Resposta: Certo.
5 - DISTRIBUIÇÕES CONTÍNUAS
Agora, veremos distribuições teóricas de variáveis contínuas, que são bem importantes,
principalmente a distribuição normal.
Vimos que, para variáveis discretas, as distribuições uniformes apresentam o mesmo valor de
probabilidade para todos os resultados possíveis. Para variáveis uniformes contínuas, o
fundamento é o mesmo: a função densidade de probabilidade (f.d.p.) apresenta um valor
constante em todo o intervalo em que a está definida.
A figura abaixo ilustra a f.d.p. de uma variável com distribuição uniforme, que assume um valor
constante 𝑘, em um intervalo (𝑎, 𝑏):
a b
𝑘, 𝑠𝑒 𝑎 < 𝑥 < 𝑏
𝑓(𝑥) = ± ²
0, 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟á𝑟𝑖𝑜
Sabemos que a probabilidade de todo o Espaço Amostral é 100%. Logo, a área sob a função é
igual a 1:
1
𝑘=
(𝑏 − 𝑎)
Ou seja, conhecendo o intervalo (𝑎, 𝑏), podemos calcular o valor da f.d.p. (𝑘). Assim, os limites do
intervalo são os únicos parâmetros da distribuição uniforme.
(𝒏;𝒎)
𝑃(𝒎 < 𝑋 < 𝒏) = (𝒃;𝒂)
a n m b
Lembre-se que, por se tratar de uma variável contínua, temos:
(8;#)
𝐹(𝑥) = (p;#)
(2019 – IF/PB) Daniel sempre pega o mesmo trem para ir ao colégio, pois somente um trem lhe
serve para não chegar atrasado. Ele sempre passa pela estação, de manhã, em qualquer momento,
54
entre 6 horas e 6 horas e 30 minutos. Um dia, Daniel se atrasou e chegou a estação às 6 horas e
24 minutos. Qual a probabilidade de que ele ainda consiga pegar o trem?
a) 16,7%
b) 20,0%
c) 9,6%
d) 49,0%
e) 51,0%
Comentários:
Como o trem passa em qualquer momento entre 6 horas e 6 horas e 30 minutos, temos uma
distribuição uniforme nesse intervalo.
Podemos nos preocupar somente com os minutos dessa hora, fazendo 𝑎 = 0 e 𝑏 = 30. A
probabilidade de o trem passar após 6 horas e 24 minutos, ou seja, entre m = 24 e b = 30 é:
(𝑛 − 𝑚)
𝑃(𝑚 < 𝑋 < 𝑛) =
(𝑏 − 𝑎)
(30 − 24) 6 1
𝑃(24 < 𝑋 < 30) = = = = 20%
(30 − 0) 30 5
Resposta: B.
(2019 – IF/PB) Adriano está muito interessado em comprar uma moto, mas como tem pouco
dinheiro resolveu participar de um leilão de motos, mesmo sabendo que existe outro interessado.
Pelas regras da administradora de leilões, quem der o lance mais alto, acima de R$ 5.000,00,
ganha. Supondo que o lance do seu adversário seja uma variável aleatória, uniformemente
distribuída entre R$ 5.000,00 e R$ 7.500,00. Qual a probabilidade de Adriano vencer, se der um
lance de R$ 6.000?
a) 10%
b) 20%
c) 30%
d) 40%
e) 50%
Comentários:
A probabilidade de Adriano vencer é igual à probabilidade de seu adversário dar um lance inferior
a 6000, considerando os limites a = 5 e b = 7,5
(6 − 5) 1
𝑃(5 < 𝑋 < 6) = = = 40%
(7,5 − 5) 2,5
Resposta: D.
55
p2#
𝐸(𝑋) = !
Ou seja, a esperança matemática (ou média) dessa distribuição segue o conceito de média
aritmética, entre os extremos 𝑎 e 𝑏, conforme ilustrado a seguir.
𝑏+𝑎
a b
2
O valor da variância é:
(p;#)$
𝑉(𝑋) = 9!
(Adaptada: 2017 – IBGE) Sabe-se que o tempo de aplicação de um questionário em uma pesquisa
de campo é uma variável com distribuição uniforme entre 8 e 20 minutos. Um entrevistador
pretende aplicar três questionários.
Logo, é correto afirmar que.
a) a probabilidade de que todas as entrevistas durem mais do que 15 minutos é de 27/64;
b) a probabilidade de que duas entrevistas durem mais do que a média é igual a 5/8;
c) o desvio padrão do tempo de duração de cada entrevista é igual a 2 minutos;
d) a probabilidade de que apenas uma das entrevistas leve menos da metade do tempo máximo
é igual a 25/72.
Comentários:
Em relação à alternativa a, a probabilidade de um questionário durar mais que 15 minutos, sendo
a = 8 e b = 20, é:
56
20 − 15 5
𝑃(𝑋 > 15) = 𝑃(15 < 𝑋 < 20) = =
20 − 8 12
A probabilidade de os 3 questionários durarem mais que 15 minutos é o produto:
5 5 5 125
𝑃(𝑋 > 15) × 𝑃(𝑋 > 15) × 𝑃(𝑋 > 15) = × × =
12 12 12 1728
Portanto, a alternativa a está errada.
Em relação à alternativa b, precisamos calcular a média:
𝑏 + 𝑎 20 + 8
𝜇 = 𝐸(𝑋) = = = 14
2 2
A probabilidade 𝑃(𝑋 > 14) é dada por:
20 − 14 6
𝑃(𝑋 > 14) = 𝑃(14 < 𝑋 < 20) = = = 0,5
20 − 8 12
A probabilidade de 2 questionários, dentre 3, durarem mais que a média, é:
𝐶:,! × 𝑃(𝑋 > 14) × 𝑃(𝑋 > 14) = 3 × 0,5 × 0,5 = 0,75
Portanto, a alternativa b está errada.
Em relação à alternativa c, o desvio padrão é dado por:
(𝑏 − 𝑎)! 𝑏 − 𝑎
𝜎V = ¡𝑉(𝑋) = t =
12 √12
20 − 8 12
𝜎V = = = √12
√12 √12
Portanto, a alternativa c está errada.
Em relação à alternativa d, a probabilidade de uma entrevista levar menos da metade do tempo
máximo, 𝑃(𝑋 < 10) é:
10 − 8 2 1
𝑃(𝑋 < 10) = 𝑃(8 < 𝑋 < 10) = = =
20 − 8 12 6
A probabilidade de apenas um dos questionários durar menos de 10 minutos, e os demais, mais
=
que 10 minutos, com probabilidade 𝑃(𝑋 ≥ 10) = 1 − 𝑃(𝑋 < 10) = H, é:
1 5 5 25
𝑃(𝑋 < 10) × 𝑃(𝑋 ≥ 10) × 𝑃(𝑋 ≥ 10) × 𝐶:,! = × × ×3=
6 6 6 72
Portanto, a alternativa d está correta.
Resposta: D.
57
A distribuição exponencial se caracteriza por ter uma taxa de falha constante, sendo normalmente
associada a tempo, seja de um produto, de um ser vivo (como insetos, bactérias), de um
medicamento no organismo, etc. Uma variável 𝑋 com distribuição exponencial e parâmetro 𝜆 > 0
apresenta a seguinte função densidade:
;𝝀𝒙
𝑓(𝑥) = ±𝝀𝒆 , 𝑠𝑒 𝒙 ≥ 𝟎²
0, 𝑠𝑒 𝑥 < 0
Para ilustrar, podemos supor, como exemplo, que o tempo de vida de um inseto seja uma
9
distribuição exponencial com parâmetro 𝜆 = 9! por dia e que se deseja calcular a probabilidade
de o inseto viver menos de 𝑥 = 3 dias. Outro exemplo seria o de uma lâmpada cuja vida útil siga
9
uma distribuição exponencial com parâmetro 𝜆 = 9>> por hora, em que se deseja calcular a
probabilidade de essa lâmpada durar mais que 100 horas.
Lembre-se que 𝑒, número de Euler, é um número irracional, cujo valor aproximado é 𝑒 ≅ 2,718.
9 9 𝟏
𝑃(𝑋 < 3) = 𝑃(0 < 𝑋 < 3) = −𝑒 ;9!×: + 𝑒 ;9!×> = 𝟏 − 𝒆;𝟒 ≅ 0,22
𝐹(𝑥) = 1 − 𝑒 ;s8
58
Estamos falando em taxa de falha, parâmetro único 𝜆,... Percebeu alguma similaridade com a
distribuição de Poisson? Pois é! Essas distribuições guardam uma relação muito especial entre si:
a distribuição exponencial descreve o tempo entre as ocorrências de eventos sucessivos de uma
distribuição de Poisson!
9
𝐸(𝑋) = s
59
9
𝑉(𝑋) = s$
Vamos considerar um exemplo numérico para facilitar o entendimento. Suponha que a taxa 𝜆
considere horas como unidade de tempo. Assim, sabendo que já se passaram 3 horas desde a
ocorrência do último evento, a probabilidade de se passar pelo menos 2 horas a mais (totalizando
5 horas) é igual à probabilidade de se passar pelo menos 2 horas até a ocorrência de um evento
qualquer.
(Adaptada: 2017 – IBGE) Suponha que o tempo de vida útil da lâmpada de um Scanner seja
distribuído exponencialmente com média de 600 horas.
Se T representa a durabilidade da lâmpada, é correto afirmar que:
a) P(T>600) = 0,50
b) P(200<T<600) = 0,25
c) P(T>1500) = 1 – e-2
d) P(T>1200|T>300) = P(Y>900)
e) P(T<450) = 1 – e-2/5
Comentários:
A partir da média, podemos encontrar o valor do parâmetro:
1
𝐸(𝑋) = = 600
𝜆
1
𝜆=
600
Em relação à alternativa a, temos:
𝑃(𝑋 > 𝑥) = 𝑒 ;s8
H>>
𝑃(𝑋 > 600) = 𝑒 ;H>> = 𝑒 ;9
60
A distribuição normal, também chamada de gaussiana, é uma das distribuições contínuas mais
importantes! Essa distribuição depende dos parâmetros 𝝁, média, e 𝝈𝟐 , variância e está definida
para toda a reta real, 𝑥 ∈ (−∞, ∞). Denotamos essa distribuição por 𝑵(𝝁, 𝝈𝟐 ).
No gráfico abaixo, ilustramos uma f.d.p. com distribuição normal. Observe que a curva apresenta
um formato de sino, o que ocorre para todas as variáveis normais.
61
As distribuições normais são simétricas, ou seja, sua média equivale a sua mediana e a sua moda.
Logo, o valor de 𝝁 divide a distribuição em duas partes iguais. Sabendo que a área total, sob toda
a curva, corresponde à probabilidade de todo o Espaço Amostral e, portanto, a 100%, então:
Mas a simetria não implica somente nisso. A partir da média, toda a distribuição de probabilidades
para os valores superiores é igual à distribuição para os valores inferiores. Assim, para qualquer 𝑘
real, a probabilidade de a variável ser maior do que 𝜇 + 𝑘 é igual à probabilidade de ser menor do
que 𝜇 − 𝑘:
Lembre-se de que a probabilidade de um intervalo corresponde à área sob a f.d.p., limitada por
esse intervalo. Assim, a equivalência descrita acima, pode ser ilustrada, conforme gráfico abaixo:
𝜇−𝑘 𝜇+𝑘
62
𝜇−𝑘 𝜇+𝑘
Podemos observar, ainda, que a curva normal apresenta duas assíntotas. De modo geral, uma
assíntota ocorre quando uma curva se aproxima cada vez mais a uma reta, porém sem tocá-la. A
curva normal se aproxima do eixo x (eixo das abcissas) tanto para 𝑥 → −∞, quanto para 𝑥 → +∞.
Por isso, dizemos que a curva normal é duplamente assintótica.
Podemos observar ainda que existem dois pontos de inflexão na curva normal. Pontos de inflexão
são aqueles em que a concavidade da curva muda. No início da curva normal, a concavidade está
voltada para cima. No ponto (aproximado) indicado pela seta da esquerda, a concavidade muda
para baixo, e no ponto (aproximado) indicado pela seta da direita, a concavidade muda novamente
para cima.
Para calcular os valores de probabilidade, temos uma tabela, que relaciona os valores de intervalo
da variável aos respectivos valores de probabilidade. Essa tabela, inserida abaixo, se refere a uma
distribuição normal 𝑵(𝟎, 𝟏), isto é, com 𝝁 = 𝟎 e 𝝈𝟐 = 𝟏, chamada de normal padrão ou reduzida,
que denotamos por 𝒁.
Observe, pela ilustração gráfica anterior à tabela, que os valores desta correspondem à
probabilidade entre a média 𝜇 = 0 e o valor de 𝑧 indicado na tabela. Assim, os campos da tabela
informam a probabilidade 𝑃(0 < 𝑍 < 𝑧).
63
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995
3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998
3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998
3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
64
E quanto aos valores de 𝑧? O valor de 𝑧 começa a ser lido na primeira coluna (que apresenta a
unidade e os décimos de 𝑧) e termina de ser lido na primeira linha (que apresenta os centésimos
de 𝑧). Assim, a probabilidade 𝑃(0 < 𝑍 < 𝑧) é o valor que está no campo, cuja linha corresponda à
unidade e ao décimo de 𝑧 e cuja coluna corresponda ao centésimo de 𝑧.
Por exemplo, para encontrar o valor de 𝑃(0 < 𝑍 < 1,96), precisamos buscar o número que está na
linha 1,9 e na coluna 0,06, conforme indicado abaixo. Podemos observar que 𝑃(0 < 𝑍 < 1,96) =
0,475.
Também podemos fazer o caminho inverso, qual seja, encontrar o valor de 𝑧 que corresponde à
probabilidade desejada. Vamos encontrar o valor de 𝑧 tal que 𝑃(0 < 𝑍 < 𝑧) = 0,40, por exemplo.
Para isso, devemos buscar o valor 0,40 nos campos da tabela. Como não consta exatamente esse
valor, somente 0,3997 e 0,4015, optamos pelo valor mais próximo, isto é, 0,3997. Este se encontra
na linha 1,2 e na coluna 0,08, conforme indicado abaixo. Logo, concluímos que 𝑧 = 1,28.
Para resolver questões envolvendo a tabela normal padrão é importante lembrar que essa
distribuição é simétrica, com média 𝜇 = 0.
P(Z > z)
z 65
z z
z z
A questão pode solicitar a probabilidade da forma 𝑃(|𝑍| < 𝑧) ou 𝑃(|𝑍| > 𝑧). Para resolvê-las, é
importante lembrar que:
𝑃(|𝑍| < 𝑧) = 𝑃(−𝑧 < 𝑍 < 𝑧) = 𝑃(−𝑧 < 𝑍 < 0) + 𝑃(0 < 𝑍 < 𝑧)
𝑃(|𝑍| > 𝑧) = 𝑃(𝑍 < −𝑧 ∪ 𝑍 > 𝑧) = 𝑃(𝑍 < −𝑧) + 𝑃(𝑍 > 𝑧)
Existem, ainda, outros tipos de tabela para a distribuição normal padrão, que apresentam as
probabilidades para outros intervalos, como 𝑃(−∞ < 𝑍 < 𝑧), que corresponde à função da
distribuição normal acumulada.
A sua prova vai apresentar alguma tabela para a distribuição normal padrão, ou alguns valores que
lhe permita resolver a questão.
Mas, e se a média da distribuição for diferente de zero e/ou a variância for diferente de 1?
Para isso, fazemos uma transformação de uma distribuição normal qualquer para uma distribuição
normal padrão, conforme indicado abaixo:
8;u
𝑧= [
66
Vamos calcular, por exemplo, a probabilidade 𝑃(𝑋 > 7), em que 𝜇 = 1 e 𝜎 = 3. Pela transformação
para a normal padrão, temos:
𝑥−𝜇 7−1
𝑧= = =2
𝜎 3
Pela tabela da normal padrão, temos 𝑃(0 < 𝑍 < 2) = 0,4772, logo:
Também podemos fazer o caminho inverso, encontrando 𝑥, a partir de 𝑧. Por exemplo, podemos
calcular 𝑥 tal que a probabilidade de 𝑃(𝑋 < 𝑥) = 0,8, para a distribuição normal com os mesmos
parâmetros do exemplo anterior.
De maneira geral, quando os intervalos são da forma 𝑃(𝜇 − 𝑘 < 𝑋 < 𝜇 + 𝑘), em
que os extremos são equidistantes da média, basta fazermos a transformação
67
para um dos extremos, pois o outro estará associado ao mesmo valor, porém
multiplicado por –1.
8= ;u u2:;u :
𝑧$ = [
= [
=[
8> ;u u;:;u :
𝑧0 = [
= [
= −[
Pela tabela da curva normal, temos 𝑃(0 < 𝑍 < 1) = 0,3413 e, assim:
𝑃(−1 < 𝑍 < 1) = 𝑃(−1 < 𝑍 < 0) + 𝑃(0 < 𝑍 < 1) = 2 × 0,3413 = 0,6826
Portanto, a probabilidade de uma variável normal qualquer se afastar da média (para cima ou para
baixo) em até 1 desvio padrão é aproximadamente 68%.
𝑃(−2 < 𝑍 < 2) = 𝑃(−2 < 𝑍 < 0) + 𝑃(0 < 𝑍 < 2) = 2 × 0,4772 = 0,9544
Portanto, a probabilidade de uma variável normal qualquer se afastar da média (para cima ou para
baixo) em até 2 desvios padrão é aproximadamente 95%.
Pela tabela, temos 𝑃(0 < 𝑍 < 3) = 0,4987 e, assim, 𝑃(−3 < 𝑍 < 3) = 2 × 0,4987 = 0,9974.
Portanto, a probabilidade de uma variável normal qualquer se afastar da média (para cima ou para
baixo) em até 3 desvios padrão é aproximadamente 99,7%.
Essas probabilidades (68% para 𝜇 ± 𝜎; 95% para 𝜇 ± 2𝜎 e 99,7% para 𝜇 ± 3𝜎) são chamadas de
Regra Empírica.
68
Comentários:
Sendo 𝜇 = 68 e 𝜎 = 11, temos a seguinte transformação para 𝑥 = 90:
𝑥 − 𝜇 90 − 68 22
𝑧= = = =2
𝜎 11 11
Pela tabela, que apresenta a probabilidade 𝑃(0 < 𝑍 < 𝑧), temos:
𝑃(0 < 𝑍 < 2) = 0,4772
Logo:
𝑃(𝑍 > 2) = 𝟎, 𝟓 − 𝑃(0 < 𝑍 < 2) = 𝟎, 𝟓 − 0,4772 = 0,0228
Resposta: E.
(2018 – SES/DF)
(V;u)
A variável normal padronizada Z é dada por 𝑍 = [ , em que X é uma variável que tem
distribuição normal de média µ e variância σ² , conforme a figura apresentada. Considerando uma
variável X que tem distribuição normal de média µ = 15,6 e variância σ² = 0,25, assinale a
alternativa que indica a probabilidade p(15 < X < 16,2).
Dado: Tabela – Áreas de uma distribuição normal padrão
a) 0,1151
b) 0,2302
c) 0,3849
71
d) 0,7698
e) 0,8849
Comentários:
Sendo 𝜎 ! = 0,25, temos 𝜎 = ¡0,25 = 0,5. Sendo 𝜇 = 15,6, temos a seguinte transformação para
𝑥 = 16,2:
𝑥 − 𝜇 16,2 − 15,6 0,6
𝑧= = = = 1,2
𝜎 0,5 0,5
Para 𝑥 = 15, temos:
𝑥 − 𝜇 15 − 15,6 −0,6
𝑧= = = = −1,2
𝜎 0,5 0,5
Pela tabela, que apresenta os valores para 𝑃(0 < 𝑍 < 𝑧), observamos que 𝑃(0 < 𝑍 < 1,2) =
0,3849. Portanto:
𝑃(−2,4 < 𝑍 < 2,4) = 2 × 0,3849 = 0,7698
Resposta: D.
Um dos motivos pelos quais a Distribuição Normal (ou de Gauss) é tão importante em Estatística
decorre do Teorema Central do Limite:
Note que as variáveis podem apresentar qualquer distribuição, mesmo assim, a sua soma seguirá
uma distribuição normal.
Ainda que as variáveis não sejam identicamente distribuídas, isto é, ainda que apresentem
distribuições distintas, mesmo assim, a sua soma terá, aproximadamente, uma distribuição
72
normal, desde que as variáveis sejam independentes e tenham variâncias semelhantes. Nesse
caso, a esperança e variância serão:
(2017 – IBGE) Sejam X1, X2, X3, ..., X64 variáveis aleatórias discretas, com distribuição Binomial,
todas com p = 0,25 e n = 12. Também são conhecidos valores da função distribuição acumulada
da normal-padrão, mais especificamente: ɸ(2) = 0,977, ɸ(1,5) = 0,933, ɸ(1,25) = 0,894.
No caso da extração de uma amostra (n = 64), a probabilidade de que a soma dos valores seja
superior a 207 é igual a:
a) 0,023
b) 0,046
c) 0,067
d) 0,106
e) 0,134
Comentários:
Vimos que, pelo Teorema Central do Limite, a soma de muitas variáveis independentes
identicamente distribuídas Xi, cada uma com média E(X) e variância V(X), é uma variável Y, com
distribuição aproximadamente normal, com média E(Y) = n.E(X) e variância V(Y) = n.V(X).
Para uma distribuição binomial, temos:
𝐸(𝑋) = 𝑛. 𝑝 = 12 × 0,25 = 3
12 × 3 9
𝑉(𝑋) = 𝑛. 𝑝. 𝑞 = 12 × 0,25 × 0,75 = =
4×4 4
Então:
𝜇] = 𝐸(𝑌) = 𝑛. 𝐸(𝑋) = 64 × 3 = 192
9
𝜎]! = 𝑉(𝑌) = 𝑛. 𝑉(𝑋) = 64 × = 144
4
O desvio padrão de Y é, portanto: 𝜎] = ¡𝜎]! = √144 = 12.
Assim, a probabilidade 𝑃(𝑌 > 207) pode ser calculada pela seguinte transformação:
73
𝑥 − 𝜇 207 − 192 15
𝑧= = = = 1,25
𝜎 12 12
O enunciado informa que 𝑃(−∞ < 𝑍 < 1,25) = 0,894 . Logo:
𝑃(𝑍 > 1,25) = 1 − 𝑃(−∞ < 𝑍 < 1,25) = 1 − 0,894 = 0,106
Resposta: D.
Pontue-se que a soma, a subtração, a multiplicação ou a divisão de uma distribuição normal por
uma constante real também apresenta distribuição normal, cuja média e variância podem ser
calculadas pelas propriedades de esperança e variância que vimos nas aulas passadas. Supondo a
variável 𝑌 = 𝑎𝑋 − 𝑏, sendo 𝑎 e 𝑏 constantes reais, então:
74
(2020 – FADESP) A variável aleatória X tem distribuição normal com média µ = 2 e variância σ2 =
9. Seja Y uma variável aleatória definida por Y = 2X + 1. Nestas condições, pode-se afirmar que Y
tem distribuição
a) normal com média µ = 2 e variância σ2 = 30.
b) qui-quadrado com média µ = 5 e variância σ2 = 36.
c) normal com média µ = 5 e variância σ2 = 9.
d) normal com média µ = 5 e variância σ2 = 36.
Comentários:
Vimos que a soma de variáveis normais segue uma distribuição normal, mesmo quando somadas
a uma constante. Logo, a variável Y possui distribuição normal, com média:
E(Y) = E(2X + 1) = 2.E(X) + 1
Sendo E(X) = 2, temos:
E(Y) = 2.2 + 1 = 5
A variância é:
V(Y) = V(2X + 1) = 4V(X)
Sendo V(X) = 36, então:
V(Y) = 4.9 = 36.
Resposta: D.
(2018 – Petrobras) As variáveis aleatórias X e Y são independentes. A variável X segue uma
distribuição Normal com média 4 e variância 16, e a Y segue uma distribuição Normal com média
9 e variância 1. A distribuição de X - Y é Normal com
a) média -5 e variância 15.
b) média -5 e variância 17.
c) média 5 e variância 15.
d) média 5 e variância 17.
75
𝐸(𝑌) = 𝐸(𝑋) = 𝑛. 𝑝
𝑉(𝑌) = 𝑉(𝑋) = 𝑛. 𝑝. 𝑞
Consequentemente, para 𝑛 grande, podemos aproximar a probabilidade de uma variável binomial
𝑋 apresentar valores dentro de um intervalo [𝑎, 𝑏], ou seja, 𝑃(𝑎 ≤ 𝑋 ≤ 𝑏), à probabilidade de uma
variável normal 𝑌 apresentar valores dentro de um intervalo (𝑎, 𝑏):
Correção de Continuidade
Por se tratar de uma distribuição discreta sendo aproximada a uma distribuição contínua, para
melhorar a precisão dos resultados, é necessário introduzir uma correção de continuidade.
Para isso, devemos aumentar o intervalo da binomial da forma [𝑎, 𝑏], isto é, com os extremos
incluídos, em 0,5 unidade para cada extremo. Assim, o intervalo da distribuição normal
correspondente será (𝑎 − 0,5, 𝑏 + 0,5), ou seja:
76
Se o intervalo desejado não incluir um dos extremos, ou ambos, então primeiro ajustamos o
intervalo para incluí-lo(s), somando ou subtraindo 1 unidade, conforme o caso, e, em seguida,
aplicamos essa correção.
Por exemplo, a probabilidade 𝑃(1 < 𝑋 < 5), para uma variável binomial (que assume apenas
valores inteiros), é equivalente à probabilidade 𝑃(2 ≤ 𝑋 ≤ 4). Agora sim, aplicamos a correção de
continuidade:
50 50 50
𝑃(20 ≤ 𝑋 ≤ 30) = d e 0,5!> . 0,5:> + d e 0,5!9 . 0,5!h + ⋯ + d e 0,5:> . 0,5!>
20 21 30
8;u :>,=;!=
𝑧= [
≅ :,=!==
≅ 1,56
Pela tabela normal, podemos observar que 𝑃(0 < 𝑍 < 1,56) = 0,4406. Logo:
77
Logo, para resolver questões envolvendo a aproximação de uma distribuição binomial X a uma
distribuição normal Y, precisamos:
𝒳W! = ∑W0j9(𝑍0 )!
Pontue-se que, se as variáveis normais 𝑋0 não forem reduzidas, ou seja, se apresentarem média
𝜇0 e desvio padrão 𝜎0 , é necessário aplicar a transformação para a normal reduzida, antes de elevar
ao quadrado:
W W
𝑋0 − 𝜇0 !
𝒳W! !
= †(𝑍0 ) = † g h
𝜎0
0j9 0j9
Pode-se observar que as variáveis com distribuição qui-quadrado são não negativas (afinal
correspondem à soma do quadrado de variáveis) e assimétricas à direita.
Observamos, ainda, que quanto maior o grau de liberdade, isto é, quanto mais variáveis normais
ao quadrado são somadas, mais simétrica será a distribuição. Inclusive, pelo Teorema Central do
Limite, a distribuição qui-quadrado se aproxima a uma distribuição normal, para 𝒌 elevado.
1
Gráfico do professor Ivan Balducci da Universidade Estadual Paulista, FOSJC/UNESP, disponível em
https://slideplayer.com.br/slide/45581/.
79
A soma das variáveis 𝒳W!% , 𝒳W!$ , … , 𝒳W!( , com distribuição qui-quadrado, com
𝑘9 , 𝑘! , … , 𝑘3 graus de liberdade, respectivamente, apresenta distribuição qui-
quadrado com 𝑘9 + 𝑘! + ⋯ + 𝑘3 graus de liberdade.
𝐸(𝒳W! ) = 𝑘
𝑉(𝒳W! ) = 2𝑘
Assim como a distribuição normal, a distribuição qui-quadrado também está associada a uma
tabela que associa uma probabilidade 𝑃(𝒳W! < 𝑥) ou 𝑃(𝒳W! > 𝑥) a um valor positivo 𝑥, de acordo
com o grau de liberdade 𝑘. A tabela abaixo apresenta os valores para 𝑃(𝒳W! < 𝑥).
80
A primeira (e a última) coluna apresenta os graus de liberdade 𝑘, nessa tabela denotado por 𝑛. A
primeira linha apresenta os valores de probabilidade 𝑃(𝒳W! < 𝑥) e nos campos da tabela constam
os valores de 𝑥. Por exemplo, a mediana para uma distribuição com 5 graus de liberdade, isto é,
o valor de 𝑥 para o qual 𝑃(𝒳=! < 𝑥) = 50%, conforme se observa na linha 𝑛 = 5 e na coluna 𝑃 =
0,5, é 𝑥 = 4,351.
Pelo fato de a distribuição não ser simétrica, a distribuição acima da média é diferente daquela
abaixo da média. Por isso, a tabela apresenta os valores de probabilidade para toda a distribuição,.
(Adaptada: 2017 – TRF 2ª Região) Sobre a distribuição qui-quadrado, julgue a afirmativa a seguir.
Se X for uma variável aleatória com distribuição qui-quadrado e n graus de liberdade, sua variância
será Var(X) = 2n.
Comentários:
Para a distribuição qui-quadrado com 𝑘 graus de liberdade, temos 𝑉(𝒳W! ) = 2𝑘.
Resposta: Certo.
A distribuição 𝑡 de Student (ou t-Student) é definida da seguinte forma, em que 𝑍 é uma variável
normal padrão, 𝒳W! é uma variável com distribuição qui-quadrado, com 𝒌 graus de liberdade,
sendo 𝑍 e 𝒳W! independentes:
v
𝑇=
$
w𝒳;
;
81
Observa-se que, assim como a normal padrão, a distribuição t-Student é simétrica, com média
𝝁 = 𝟎 e formato de sino, assumindo valores em toda a reta real, (−∞, ∞). Porém, em comparação
com a normal, a curva t-Student é mais baixa na região central e mais larga nos extremos. Ou
seja, a distribuição t-Student apresenta maior variabilidade.
Pode-se observar, ainda, que a distribuição t-Student se aproxima da curva normal à medida que
o grau de liberdade cresce (outra consequência do Teorema Central do Limite).
W
𝑉(𝑇) = W;! , 𝑝𝑎𝑟𝑎 𝑘 > 2
Pontue-se que a variância não é definida para 𝒌 ≤ 𝟐 e a média não é definida para 𝒌 = 𝟏.
v% v% v
𝑇= $
= = v%
x𝒳% xv$$ $
%
2
Obtido na apresentação das aulas da Prof. Tarciana Liberal, da Universidade Federal da Paraíba,
disponível em http://www.de.ufpb.br/~tarciana/Probabilidade2/Aula15.pdf
82
A distribuição t-Student também apresenta uma tabela que associa aos valores de probabilidade
os intervalos de valores de 𝑡, de acordo com o grau de liberdade, conforme indicado a seguir.
Observe pelo gráfico anterior a essa tabela, que os seus valores de probabilidade são da forma
𝑃(𝑇 < 𝑡).
83
A primeira coluna apresenta os graus de liberdade, enquanto a primeira linha apresenta os valores
de probabilidade acumulada, associadas aos valores de 𝑡 indicados nos campos. Por exemplo,
para 5 graus de liberdade (5ª linha), o valor que delimita uma probabilidade de 90%, 𝑃(𝑇 < 𝑡) =
0,9 (6ª coluna), é 𝑡 = 1,48.
Lembre-se que a distribuição é simétrica, com média, mediana e moda iguais a 𝜇 = 0. Assim,
𝑃(𝑇 < 0) = 0,5 e 𝑃(𝑇 < −𝑡) = 𝑃(𝑇 > 𝑡), como para a curva normal.
(Adaptada: 2017 – TRF 2ª Região) Sobre a distribuição t-student, julgue a afirmativa a seguir.
Considere uma variável aleatória Z com distribuição normal padrão e uma outra variável aleatória
V com distribuição qui-quadrado e v graus de liberdade. Se Z e V forem independentes, então a
v
variável aleatória 𝑇 = @
tem distribuição t de student com v graus de liberdade.
x
A
Comentários:
v
Vimos que a distribuição t-Student é definida como 𝑇 = , o que equivale ao que consta na
$
w𝒳;
;
afirmativa.
Resposta: Certo.
84
Note que X e Y são variáveis normais padrão. Nesse caso, temos também uma distribuição t de
Student, porém com 1 grau de liberdade, e não 2, como descrito na alternativa D.
Resposta: A.
Essa distribuição não é muito cobrada, mas como há algumas questões da CESPE sobre ela, então
vamos explicá-la. A distribuição 𝐹 de Snedecor (ou de Fisher, ou de Fisher-Snedecor) é definida
da seguinte forma, em que 𝒳W!% e 𝒳W!$ são variáveis independentes com distribuição qui-quadrado,
com 𝑘9 e 𝑘! graus de liberdade, respectivamente:
𝒳;$%
z
W%
𝐹W% ,W$ = 𝒳;$
$z
W$
Por resultar da divisão entre duas variáveis não negativas, a variável assume apenas valores não
negativos. Além disso, assim como a distribuição qui-quadrado, esta é assimétrica à direita.
W$
𝜇=W , 𝑝𝑎𝑟𝑎 𝑘! > 2
$ ;!
Assim, para a distribuição F de Snedecor, temos média 𝜇 > 1, sendo reduzida conforme 𝑘!
aumenta. (Observe que essa é a mesma fórmula da variância da t-Student!)
Também existe uma tabela para que possamos associar probabilidades aos intervalos de valores.
Porém, como a distribuição depende de 2 parâmetros, sendo um associado às linhas e o outro, às
colunas, a tabela é apresentada para valores fixos de probabilidade. A tabela abaixo, por
exemplo, apresenta os valores de 𝑓 que delimitam uma probabilidade 𝑃(𝐹 > 𝑓) = 0,05.
Com essa tabela, podemos calcular o valor de 𝑓 que delimita uma probabilidade 𝑃(𝐹 > 𝑓) = 0,05
para uma distribuição com 5 graus de liberdade no numerador (indicados nas linhas) e 10 graus
de liberdade no denominador (indicado nas colunas), por exemplo. Pela 5ª coluna e 10ª linha da
tabela, podemos observar que 𝑓 = 3,33.
85
Por outro lado, se precisássemos calcular o valor associado a uma outra probabilidade, 𝑃(𝐹 > 𝑓) =
0,1, por exemplo, precisaríamos de outra tabela.
86
RESUMO DA AULA
Variáveis Contínuas
p
𝑃(𝑎 < 𝑋 < 𝑏) = W 𝑓(𝑥). 𝑑𝑥 = 𝐹(𝑏) − 𝐹(𝑎)
#
8
Þ Esperança: 𝐸(𝑋) = ∫8 / 𝑥. 𝑓(𝑥) . 𝑑𝑥
0
8
Þ Variância, 𝑉(𝑋) = 𝐸(𝑋 ! ) − [𝐸(𝑋)]! , com 𝐸(𝑋 ! ) = ∫8 / 𝑥 ! . 𝑓(𝑥). 𝑑𝑥
0
[$
Þ Desigualdade de Chebyshev: 𝑃(|𝑋 − 𝜇| ≥ 𝛿) ≤ \ $
[$
Þ Desigualdade Unilateral: 𝑃(𝑋 − 𝜇 ≥ 𝛿) ≤ [$ 2\ $
E
o Variável contínua: 𝜇W = 𝐸(𝑋 W ) = ∫D (𝑥0 )W . 𝑓(𝑥0 ). 𝑑𝑥
Transformação de Variáveis
Þ 𝒚 = 𝒉(𝒙)
N` '% (^)
o Variáveis Contínuas: 𝑓] [𝑦] = 𝑓V [ℎ;9 (𝑦)]. ž N^
ž
Distribuições Conjuntas
e1f(V,])
Þ Correlação: 𝜌(𝑋, 𝑌) = [9 .[:
!
𝐸(𝑌 ! |𝑋 = 𝑥) = †—𝑦g ˜ . 𝑃—𝑌 = 𝑦g |𝑋 = 𝑥˜
g
Distribuições Contínuas
9
Þ Distribuição Uniforme, 𝑓(𝑥) = (p;#) , 𝑠𝑒 𝑎 ≤ 𝑥 ≤ 𝑏:
(3;t)
o Probabilidade de um intervalo: 𝑃(𝑚 < 𝑋 < 𝑛) = (p;#)
p2# (p;#)$
o Esperança: 𝐸(𝑋) = !
e Variância: 𝑉(𝑋) = 9!
9 9
o Esperança: 𝐸(𝑋) = s e Variância: 𝑉(𝑋) = s$
𝒳W! = †(𝑍0 )!
0j9
88
Þ Distribuição t-Student – Simétrica, definida para (−∞, ∞), com média 𝜇 = 0 e formato de
sino mais “achatado” do que normal:
𝑍
𝑇=
!
•𝒳W
𝑘
W
o Variância: 𝑉(𝑋) = W;! , 𝑝𝑎𝑟𝑎 𝑘 > 2
𝒳W!%
Á
𝑘
𝐹W% ,W$ = ! 9
𝒳W$
Á
𝑘!
W$
o Esperança: 𝐸(𝑋) = W , 𝑝𝑎𝑟𝑎 𝑘! > 2
$ ;!
89
Variáveis Contínuas
A função de distribuição cumulativa de uma variável aleatória é sempre uma função decrescente
e assume valores no intervalo [0,1].
Comentários:
A função de distribuição acumulada, ou cumulativa, é uma função crescente, com valores entre 0
e 1.
Gabarito: Errado.
(CESPE/2014 – Analista Judiciário do TJ/SE) Considerando que X seja uma variável aleatória
contínua, tal que E(X) = 1 e E(X 2 ) = 4, julgue os itens seguintes.
Comentários:
Gabarito: Errado.
Comentários:
90
𝑑𝑒𝑠𝑣𝑖𝑜 𝑝𝑎𝑑𝑟ã𝑜 𝜎
𝐶X = =
𝑚é𝑑𝑖𝑎 𝐸(𝑋)
Sabemos que a média é 𝐸(𝑋) = 1 e, pelo que calculamos no item anterior, a variância é 𝑉(𝑋) = 3.
O desvio padrão, raiz quadrada da variância, é:
𝜎 = ¡V(X) = √3
√3
𝐶X = = √3 ≅ 1,7
1
Gabarito: Errado.
Comentários:
𝜎!
𝑃(𝑋 − 𝜇 ≥ 𝛿) ≤
𝜎! + 𝛿!
3 3
𝑃(𝑋 ≥ 4) = 𝑃(𝑋 − 1 ≥ 3) ≤ !
=
3+3 12
1
𝑃(𝑋 ≥ 4) ≤
4
Lembre-se que, por ser uma variável contínua, temos 𝑃(𝑋 > 4) = (𝑋 ≥ 4).
Gabarito: Certo.
91
a) 0,2
b) 0,3
c) 0,4
d) 0,5
e) 0,6
Comentários:
¡𝑌 ! < √4
|𝑌| < 2
𝑃(|𝑌| > 2) = 𝑃(𝑌 < −2 ∪ 𝑌 > 2) = 𝑃(𝑌 < −2) + 𝑃(𝑌 > 2) = 0,6
Como a distribuição é simétrica em torno de zero, então:
Gabarito: B.
92
Considere que uma variável aleatória contínua e simétrica em zero tenha função densidade de
probabilidade f(x) tal que
Comentários:
Sabemos que a probabilidade associada a certo intervalo para uma variável contínua é:
p
𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = W 𝑓(𝑥). 𝑑𝑥
#
>
W 𝑓(𝑥). 𝑑𝑥 = 𝑃(−𝑘 ≤ 𝑋 ≤ 0)
;W
W
W 𝑓(𝑥). 𝑑𝑥 = 𝑃(0 ≤ 𝑋 ≤ 𝑘)
>
𝑃(−𝑘 ≤ 𝑋 ≤ 0) = 𝑃(0 ≤ 𝑋 ≤ 𝑘)
𝑃(−𝑘 ≤ 𝑋 ≤ 0) ≤ 0 ≤ 𝑃(0 ≤ 𝑋 ≤ 𝑘)
Logo:
𝑃(0 ≤ 𝑋 ≤ 𝑘) ≤ 0 ≤ 𝑃(0 ≤ 𝑋 ≤ 𝑘)
Ou seja, essa probabilidade é, ao mesmo tempo, menor ou igual a zero e maior ou igual a zero. A
única possibilidade é ela ser igual a zero. Logo:
𝑃(−𝑘 ≤ 𝑋 ≤ 0) = 𝑃(0 ≤ 𝑋 ≤ 𝑘) = 0
Gabarito: Certo.
93
Comentários:
Sabemos que a probabilidade de todo o Espaço Amostral é 1. Como x varia entre 0 e 1, temos:
9
𝐹(1) = W 𝑓(𝑥). 𝑑𝑥 = 1
>
9
𝐹(1) = W 𝛽. 𝑥 ? . (1 − 𝑥)! . 𝑑𝑥 = 1
>
9
𝐹(1) = W 𝛽. 𝑥 ? . (1 − 2𝑥 + 𝑥 ! ). 𝑑𝑥 = 1
>
9
𝐹(1) = W 𝛽. (𝑥 ? − 2. 𝑥 h + 𝑥 9> ) . 𝑑𝑥 = 1
>
9 9 9
𝐹(1) = W 𝛽. 𝑥 𝑑𝑥 − W 2. 𝛽. 𝑥 𝑑𝑥 + W 𝛽𝑥 9> 𝑑𝑥 = 1
? h
> > >
?
𝑥h
W 𝛽. 𝑥 𝑑𝑥 = 𝛽
9
94
h
𝑥 9>
W 2. 𝛽. 𝑥 𝑑𝑥 = 2. 𝛽
10
9>
𝑥 99
W 𝛽. 𝑥 𝑑𝑥 = 𝛽
11
9
(1h − 0h ) 1 𝛽
W 𝛽. 𝑥 ? 𝑑𝑥 = 𝛽 =𝛽 =
> 9 9 9
9
h
(19> − 09> ) 1 𝛽
W 2. 𝛽. 𝑥 𝑑𝑥 = 2. 𝛽 = 2𝛽 =
> 10 10 5
9
(199 − 099 ) 1 𝛽
W 𝛽. 𝑥 9> 𝑑𝑥 = 𝛽 =𝛽 =
> 11 11 11
𝛽 𝛽 𝛽 𝛽
𝐹(1) = − + = =1
9 5 11 495
𝛽 = 495
Gabarito: Certo.
a) A mediana de Y é superior a 1.
95
b) P(Y = 1) = 0,75
Comentários:
𝐹(𝑦/N ) = 0,5
1 !
1−g h = 0,5
2𝑦/N
1 !
g h = 0,5
2𝑦/N
1
! = 0,5
4𝑦/N
!
2. 𝑦/N =1
!
𝑦/N = 0,5
|𝑦/N | = ¡0,5
𝑦/N = ¡0,5
96
Em relação à alternativa C, a moda é o valor de y que maximiza a f.d.p. Vamos, então, calculá-la,
pela derivada da função de distribuição acumulada fornecida pelo enunciado:
𝑑 1
𝑓(𝑦) = Æ1 − 𝑦 ;! Ç
𝑑𝑦 4
1 1
𝑓(𝑦) = 0 − × (−2. 𝑦 ;: ) =
4 2. 𝑦 :
Por se tratar de uma divisão, quanto maior y, menor o valor de f(y). Assim, a moda é o menor valor
possível para a variável: 𝑦/1 = 0,5. Logo, a alternativa C está incorreta.
8/
𝐸(𝑌) = W 𝑦. 𝑓(𝑦) . 𝑑𝑦
80
9
Sabendo que 𝑦 ≥ 0,5 e 𝑓(𝑦) = !.^ & , temos:
M M M
1 1 1 ;!
𝐸(𝑌) = W 𝑦. . 𝑑𝑦 = W . 𝑑𝑦 = W . 𝑦 . 𝑑𝑦
>,= 2. 𝑦 : >,= 2. 𝑦
!
>,= 2
1 1 𝑦 ;9 1
W . 𝑦 ;! 𝑑𝑦 = × =−
2 2 −1 2𝑦
1 1
𝐸(𝑌) = − g − h
2 × ∞ 2 × 0,5
1
𝐸(𝑌) = − g0 − h=1
2 × 0,5
B B
3
Formalmente, não representamos a divisão por infinito como . O correto seria lim . Porém, essa
C D→C D
expressão pode confundir alguns alunos e por isso preferimos a primeira forma para simplificar.
97
Sendo:
8/ M M
!) !
1 !
1 1
𝐸(𝑌 = W 𝑦 . 𝑓(𝑦) . 𝑑𝑦 = W 𝑦 . . 𝑑𝑦 = W × . 𝑑𝑦
80 >,= 2. 𝑦 : >,= 2 𝑦
1 1 1
W × 𝑑𝑦 = ln 𝑦
2 𝑦 2
Gabarito: D.
Distribuições Conjuntas
(CESPE/2013 – CNJ) Uma máquina de café expresso precisa ser reiniciada algumas vezes
durante o dia, devido ao uso excessivo. A tabela abaixo mostra a distribuição de probabilidade
conjunta do número de vezes que ela é reiniciada na parte da manhã (M) e na parte da tarde
(T).
Comentários:
0,88 + 𝑥 = 1
𝑥 = 0,12
A média de uma variável, E(X), pode ser calculada somando-se os produtos dos valores de x
multiplicados pelas respectivas probabilidades conjuntas:
𝐸(𝑋) = † † 𝑥. 𝑝(𝑥, 𝑦)
8 ^
𝐸(𝑋) = 0 × 0,1 + 0 × 0,1 + 0 × 0,3 + 1 × 0,04 + 1 × 0,06 + 1 × 0,12 + 2 × 0,06 + 2 × 0,1 + 2 × 0,12
Logo, o número médio de vezes que a máquina é reiniciada na parte da manhã é inferior a 1.
Gabarito: Certo.
10. (CESPE/2013 – CNJ) O número de vezes que a máquina é reiniciada na parte da tarde
depende do número de vezes que ela é reiniciada pela manhã.
Comentários:
Essa questão indaga quanto à dependência entre as variáveis aleatórias. Para verificar isso, é
importante calcular as probabilidades marginais, em que X corresponde à manhã e Y, à tarde.
99
Gabarito: Certo.
a) P(X=2,Y=3)=0,10.
b) d = 1/75.
d) P(X≥1,Y≥3)=7/15.
Comentários:
Vamos representar a distribuição conjunta fornecida, pela seguinte tabela, em que X corresponde
às linhas e Y, às colunas:
X\Y 0 1 2 3 4
0 d.(0+2.0)=0 d.(0+2.1)=2d d.(0+2.2)=4d d.(0+2.3)=6d d.(0+2.4)=8d
1 d.(1+2.0)=d d.(1+2.1)=3d d.(1+2.2)=5d d.(1+2.3)=7d d.(1+2.4)=9d
2 d.(2+2.0)=2d d.(2+2.1)=4d d.(2+2.2)=6d d.(2+2.3)=8d d.(2+2.4)=10d
0 + d + 2d + 2d + 3d + 4d + 4d + 5d + 6d + 6d + 7d + 8d + 8d + 9d + 10d = 75d = 1
100
1
𝑑=
75
8
𝑃(𝑋 = 2, 𝑌 = 3) = 8𝑑 =
75
4
𝑃(𝑋 = 0) = 0 + 2𝑑 + 4𝑑 + 6𝑑 + 8𝑑 = 20𝑑 =
15
3 1
𝑃(𝑌 = 0) = 0 + 𝑑 + 2𝑑 = 3𝑑 = =
75 25
Logo:
4 1 4
𝑃(𝑋 = 0) × 𝑃(𝑌 = 0) = × =
15 25 375
Como 𝑃(𝑋 = 0, 𝑌 = 0) = 0, então temos 𝑃(𝑋 = 0, 𝑌 = 0) ≠ 𝑃(𝑋 = 0) × 𝑃(𝑌 = 0). Logo, as variáveis
não são independentes. Assim, a alternativa C está errada.
<
Sabendo que 𝑃(𝑋 = 0) = 9=, podemos concluir que a alternativa E está errada.
34
𝑃(𝑋 ≥ 1, 𝑌 ≥ 3) = 7𝑑 + 9𝑑 + 8𝑑 + 10𝑑 = 34𝑑 =
75
Gabarito: B.
101
Comentários:
Sabendo que X representa as quantidades diárias de pacientes que chegam ao posto e segue uma
distribuição de Poisson com média 20 (l = 20), então a variância é:
VAR(X) = l = 20
Gabarito: Certo.
Comentários:
Sabendo que W representa o total de pacientes emergentes, então pela fórmula binomial
fornecida no enunciado, podemos deduzir que a probabilidade de um paciente ser emergente é
0,1 e de ele ser não emergente é 0,9.
Gabarito: Certo.
Comentários:
102
Sabendo que X representa as quantidades diárias de pacientes que chegam ao posto, então, pelo
enunciado, temos X = 10. Considerando que W representa o total de pacientes emergentes,
então a probabilidade de termos W = 1 é, de acordo com a função de probabilidade fornecida:
𝑥
𝑃(𝑊 = 𝑤|𝑋 = 𝑥) = d e 0, 1| 0, 98;|
𝑤
10
𝑃(𝑊 = 1|𝑋 = 10) = d e 0, 19> 0, 99>;9
1
10!
𝑃(𝑊 = 1|𝑋 = 10) = 0, 19> 0, 9h = 10 × 0, 19> 0, 9h ≅ 3,8 × 10;9>
1! 9!
Gabarito: Errado.
15. (CESPE/2013 – TRT 17ª Região) No que se refere a distribuições discretas, julgue o
seguinte item.
9 𝑛
Para a distribuição conjunta 𝑃(𝑁 = 𝑛, 𝑋 = 𝑥) = H × d e 𝑝 8 (1 − 𝑝)3;8 , em que n = 1, ..., 6 e x é uma
𝑥
contagem, as variáveis N e X são dependentes.
Comentários:
Pela função descrita no enunciado, podemos observar que a variável X segue uma distribuição
binomial, com parâmetros p e N. Sabemos que N pode assumir os valores n = 1, 2, ... 6. Assim,
dependendo do valor de n, as probabilidades de X variam. Dessa forma, as variáveis são
dependentes.
Gabarito: Certo.
Comentários:
103
Eventos disjuntos apresentam interseção nula, ou seja, 𝑃(𝑋 = 𝑥 ∩ 𝑌 = 𝑦) = 0. Por outro lado,
eventos independentes são definidos como:
Gabarito: Errado.
(CESPE/2011 – SEDUC/AM)
Comentários:
Pela função de probabilidade conjunta fornecida no enunciado, podemos observar que Y segue
uma distribuição de Poisson com parâmetro 𝜆:
𝑒 ;s 𝜆^
𝑃(𝑌 = 𝑦) =
𝑦!
E que X|Y segue uma distribuição Binomial, com parâmetros 𝑝 e 𝑌 = 𝑦:
𝑦 𝑦!
𝑃(𝑋 = 𝑥|𝑌 = 𝑦) = d e 𝑝 8 (1 − 𝑝)^;8 = 𝑝 8 (1 − 𝑝)^;8
𝑥 𝑥! (𝑦 − 𝑥)!
O produto dessas duas fórmulas de probabilidade resulta na função apresentada no enunciado.
A variância da distribuição binomial (marginal) pode ser calculada a partir da variância e esperança
condicionais:
Como X|Y é uma distribuição binomial, com parâmetros 𝑝 e 𝑌 = 𝑦, então a variância condicional é
104
𝑉(𝑋|𝑌) = 𝑛. 𝑝. 𝑞 = 𝑌. 𝑝. 𝑞 = 𝑌. 𝑝. (1 − 𝑝)
E a esperança condicional é:
𝐸(𝑋|𝑌) = 𝑛. 𝑝 = 𝑌. 𝑝
Então, substituindo esses valores na fórmula da variância marginal acima, temos:
Como Y segue uma distribuição de Poisson, com parâmetro 𝜆, então 𝐸(𝑌) = 𝑉(𝑌) = 𝜆, logo:
𝑉(𝑋) = 𝑝. (1 − 𝑝). 𝜆 + 𝑝! 𝜆 = 𝑝. 𝜆 − 𝑝! . 𝜆 + 𝑝! . 𝜆 = 𝑝. 𝜆
𝑉(𝑋) = 𝑝. 𝜆 ≥ 𝜆. 𝑝<
Gabarito: Errado.
Comentários:
𝐸(𝑋) = 𝐸 [𝐸(𝑋|𝑌)]
Sabemos que X|Y é uma distribuição binomial, com parâmetros 𝑝 e 𝑌 = 𝑦, logo:
𝐸(𝑋|𝑌) = 𝑛. 𝑝 = 𝑌. 𝑝
Substituindo esse resultado na fórmula acima e aplicando a propriedade da esperança, temos:
Como Y segue uma distribuição de Poisson, com parâmetro 𝜆, então 𝐸(𝑌) = 𝜆, logo:
𝐸(𝑋) = 𝜆. 𝑝
Como 𝜆 e 𝑝 são positivos, então 𝐸(𝑋) é positivo.
Gabarito: Errado.
105
(CESPE/2011 – SEDUC/AM)
Julgue os próximos itens, considerando que o vetor aleatório (X, Y) possui distribuição
conjunta de probabilidade conforme o quadro acima.
Comentários:
𝑍 =𝑋+𝑌 =𝑧
𝑊 =𝑋−𝑌 =𝑤
Somando ambas as equações, temos:
𝑃(𝑍 = 𝑧, 𝑊 = 𝑤) = 𝑃(𝑋 = 𝑥, 𝑌 = 𝑦)
106
Logo, se 𝑋 e 𝑌 forem independentes, então 𝑍 e 𝑊 também serão. Pela tabela, observamos que as
proporções das probabilidades marginais (na última linha e na última coluna) não se mantêm para
todos os campos da tabela.
Por exemplo, para X = -1 e Y = -1, temos, pela tabela, 𝑃(𝑋 = −1, 𝑌 = −1) = 0 e o produto das
probabilidades marginais resulta em:
1 1 1
𝑃(𝑋 = −1) × 𝑃(𝑌 = −1) = × =
5 5 25
Ou seja, temos:
Gabarito: Certo.
20. (CESPE/2011 – SEDUC/AM) A correlação linear entre X e Y é nula; disso se conclui que
ambas são independentes.
Comentários:
Sabemos que o fato de a correlação linear ser nula, 𝝆 = 𝟎, não implica na independência de X e
Y, por isso o item está errado.
Gabarito: Errado.
Distribuições Contínuas
Comentários:
(𝑏 − 𝑎)!
𝑉(𝑋) =
12
107
(1 − 0)! 1
𝑉(𝑋) = =
12 12
Gabarito: Certo.
Comentários:
Sendo I uma variável não negativa, pois assume valores no intervalo (0,1), então, não precisamos
do módulo:
√𝑤 − 𝑎 √𝑤 − 0
𝑃—𝐼 ≤ √𝑤˜ = = = √𝑤
𝑏−𝑎 1−0
Gabarito: Errado
23. (CESPE/2013 – Estatístico da FUB) Nesse circuito, a potência esperada é igual a 1/3.
Comentários:
108
O valor esperado de W = I2, sendo I uma distribuição uniforme, no intervalo (a,b), é dado por:
p p
1
𝐸(𝑊) = 𝐸(𝐼 ! ) = W 𝑥 ! . 𝑓(𝑥). 𝑑𝑥 = W 𝑥 ! . . 𝑑𝑥
# # 𝑏−𝑎
Sendo a = 0 e b = 1, temos:
p 9
1
𝐸(𝑊) = W 𝑥 ! . . 𝑑𝑥 = W 𝑥 ! . 𝑑𝑥
# 1−0 >
8&
Sabendo que ∫ 𝑥 ! 𝑑𝑥 = :
, então aplicando os limites, temos:
9
1: − 0: 1
𝐸(𝑊) = W 𝑥 ! . 𝑑𝑥 = =
> 3 3
Gabarito: Certo.
Comentários:
p p
1
𝐸(𝑊 ! ) = 𝐸(𝐼 < ) = W 𝑥 < . 𝑓(𝑥). 𝑑𝑥 = W 𝑥 < . . 𝑑𝑥
# # 𝑏−𝑎
Sendo a = 0 e b = 1, temos:
p 9
1
𝐸(𝑊 ! ) = W 𝑥 < . . 𝑑𝑥 = W 𝑥 < . 𝑑𝑥
# 1−0 >
8)
Sabendo que ∫ 𝑥 < 𝑑𝑥 = =
, então aplicando os limites, temos:
109
!)
1= − 0= 1
𝐸(𝑊 = =
5 5
1 1 ! 1 1 9−5 4
𝑉(𝑊) = −g h = − = = ≅ 0,089
5 3 5 9 45 45
Gabarito: Errado.
Comentários:
Sabemos que, para variáveis contínuas, associamos probabilidades aos intervalos, ao invés de
probabilidades da forma P(X = x), justamente porque essa probabilidade é zero.
Gabarito: Certo.
26. (CESPE/2016 – Analista de Controle Externo do TCE/PA) P(T > 35 | T > 30) = P(T > 35).
Comentários:
Sendo X = T, s = 30 e t = 5, temos:
Gabarito: Errado.
110
27. (CESPE/2013 – Analista Judiciário da STM) P(X > 5.000 | X > 1.000) < P(X > 5.000).
Comentários:
A probabilidade 𝑃(𝑋 > 4000) é maior do que 𝑃(𝑋 > 5000), pois 4000 < 5000. Logo:
Gabarito: Errado.
Comentários:
𝑓(𝑥) = 𝜆𝑒 ;s8 , 𝑠𝑒 𝑥 ≥ 0
M
+)
𝜇+ = 𝐸(𝑋 = W (𝑥)+ . 𝜆. 𝑒 ;s8 . 𝑑𝑥
>
111
1
𝐸(𝑋) = = 5000
𝜆
1
𝜆=
5000
8
+)
(𝑥)+ . 𝑒 ;=>>>
M
𝜇+ = 𝐸(𝑋 =W . 𝑑𝑥
> 5000
Essa integral não é trivial de ser calculada, porém é possível deduzir que o resultado dessa integral
é diferente de 5000r. Inclusive, a derivada de 5000r em relação a x (cálculo inverso) é zero, ou seja,
G
'
(8)F .% )HHH
diferente de =>>>
.
Gabarito: Errado.
Comentários:
𝐸(5𝑍 + 3) = 5. 𝐸(𝑍) + 3
Sabemos que, para uma distribuição normal padrão, temos 𝐸(𝑍) = 0, logo:
𝐸(5𝑍 + 3) = 5 × 0 + 3 = 3
Sabemos que, para uma distribuição normal padrão, temos 𝑉(𝑍) = 1, logo:
𝑉(5𝑍 + 3) = 25 × 1 = 25
112
Gabarito: Errado.
Comentários:
A simetria da curva normal com média igual a zero implica na seguinte relação entre P(Z ≥ 2) e P(Z
≤ -2):
-2 0 2
Gabarito: Errado.
Comentários:
A soma de variáveis independentes com distribuição normal e médias 𝜇9 e 𝜇! e variâncias 𝜎9! e 𝜎!! ,
tem distribuição normal, com média 𝜇9 + 𝜇! e variância 𝜎9! + 𝜎!! .
Gabarito: Certo.
113
Comentários:
A soma de variáveis independentes com distribuição normal, médias 𝜇9 e 𝜇! e variâncias 𝜎9! e 𝜎!! ,
tem distribuição normal, com média 𝜇9 + 𝜇! e variância 𝜎9! + 𝜎!! .
𝜇 = 𝜇9 + 𝜇! = 10 + 10 = 20
𝜎 ! = 𝜎9! + 𝜎!! = 16 + 16 = 32
𝜎 = ¡𝜎 ! = √32 ≅ 5,7
Gabarito: Errado.
Comentários:
Gabarito: Certo.
114
𝑾;𝟐𝟎
34. (CESPE/2018 – Agente de Polícia Federal) A razão segue distribuição normal
√𝟒
padrão.
Comentários:
A subtração e divisão de uma variável normal por uma constante resulta em uma distribuição
normal. Para saber se essa distribuição será padrão ou não, vamos calcular os seus valores de
esperança e variância, considerando as respectivas propriedades:
𝑊 − 20 𝐸(𝑊) − 20
𝐸g h=
√4 √4
𝑊 − 20 10 − 20 −10
𝐸g h= = = −5
√4 √4 2
Como a média dessa distribuição é diferente de zero, ela não é a normal padrão.
Gabarito: Errado.
35. (CESPE/2013 – TRT 17ª Região) No que se refere a distribuições discretas, julgue o
seguinte item.
A aproximação da distribuição binomial pela normal não se aplica com base no teorema limite
central, visto que a binomial não se relaciona com uma soma de variáveis aleatórias.
Comentários:
O Teorema Central do Limite garante que, para n suficientemente grande, a distribuição binomial
pode sim ser aproximada pela distribuição Normal.
Gabarito: Errado.
36. (CESPE/2018 – Agente de Polícia Federal) Uma amostra aleatória simples Y1, Y2,
..., Y25 foi retirada de uma distribuição normal com média nula e variância σ2, desconhecida.
Considerando que P(x2 ≤ 13) = P(x2 > 41) = 0,025, em que x2 representa a distribuição qui-
quadrado com 25 graus de liberdade, e que 𝑺𝟐 = ∑𝟐𝟓 𝟐
𝒊j𝟏 𝒀𝒊 , julgue o item a seguir.
115
Comentários:
𝑉(𝑋) = 2𝑘 = 2 × 25 = 50
Gabarito: Certo.
(CESPE/2018 – Analista Judiciário STM) Supondo que Z seja uma distribuição normal padrão,
considere as seguintes transformações de variáveis aleatórias: W = 1 – Z e V = Z2 – W2+ 1. A
respeito dessas variáveis aleatórias, julgue os itens a seguir.
37. (CESPE/2018 – Analista Judiciário STM) A variável aleatória W segue distribuição normal
com variância unitária.
Comentários:
Sendo Z uma variável com distribuição normal, então a variável W = 1 – Z segue distribuição
normal. Pelas propriedades da variância, temos:
Sendo Z uma variável com distribuição normal padrão, então V(Z) = 1, logo:
V(W) = 1
Gabarito: Certo.
38. (CESPE/2018 – Analista Judiciário STM) A variável aleatória V segue distribuição normal.
Comentários:
116
𝑉 = 𝑍 ! − (1 − 𝑍)! + 1 = 𝑍 ! − (1 − 2𝑍 + 𝑍 ! ) + 1 = 𝑍 ! − 1 + 2𝑍 − 𝑍 ! + 1 = 2𝑍
Gabarito: Certo.
Comentários:
Na questão anterior, calculamos que, sendo V = Z2 – W2+ 1, com W = 1 – Z, então V = 2Z. Pelas
propriedades da variância de V, temos:
Gabarito: Errado.
Comentários:
Tanto a soma de variáveis, quanto a diferença entre variáveis, com distribuição normal, apresenta
distribuição normal. Vejamos os seus valores de média e variância.
A média de S = X + Y é:
E(S) = 0 + 0 = 0
117
V(S) = 1 + 1 = 2
A média de D = X – Y é:
Assim, S e D são variáveis normais, com média igual a zero e variância igual a 2. Portanto, seguem
distribuições iguais.
Gabarito: Errado.
Comentários:
A soma de k variáveis independentes com distribuição normal padrão elevadas ao quadrado segue
distribuição qui-quadrado, com k graus de liberdade.
Gabarito: Certo.
Comentários:
118
A soma e multiplicação de uma variável normal por constantes resultam em uma distribuição
normal, em que a variância é dada por:
𝑉(6𝑍 + 3) = 36
Gabarito: Errado.
𝑾
43. (CESPE/2016 – Auditor de Controle Externo do TCE/PA) A razão 𝒁
segue uma
distribuição com variância igual a 1.
Comentários:
A razão entre duas variáveis com distribuição normal seguem uma distribuição de Cauchy.
Especificamente, se as variáveis forem normais padrão, essa distribuição também será de t-
Student, com grau de liberdade k = 1. De qualquer forma, a variância não está definida.
Gabarito: Errado.
Comentários:
A soma dos quadrados de variáveis com distribuição normal padrão define uma distribuição qui-
quadrado.
Gabarito: Errado.
Comentários:
119
A distribuição F de Snedecor é definida como indicado abaixo, em que as variáveis 𝒳W!> seguem
distribuição qui-quadrado independentes:
𝒳W!%
Á
𝑘
𝐹W% ,W$ = ! 9
𝒳W$
Á
𝑘!
Logo, essa distribuição é definida pela razão entre distribuições qui-quadrado independentes
divididas pelo respectivo grau de liberdade.
Gabarito: Errado.
Comentários:
𝑘!
𝜇= , 𝑝𝑎𝑟𝑎 𝑘! > 2
𝑘! − 2
Gabarito: Errado.
(CESPE/2013 – MPU)
120
probabilidades associadas a esses quantis. Com base no gráfico e nas informações, julgue os
seguintes itens.
Comentários:
Temos que:
= 𝑃(−2,921 < 𝑇9H < −2,12) + 𝑃(−2,12 < 𝑇9H < 2,12) + 𝑃(2,12 < 𝑇9H < 2,921)
Pelo gráfico, observamos que P(-2,921 < T16 < 2,921) = 0,99 e P(-2,12 < T16 < 2,12) = 0,95, logo,
substituindo esses valores na equação acima, temos:
0,99 = 0,95 + 𝑃(2,12 < 𝑇9H < 2,921) + 𝑃(−2,921 < 𝑇9H < −2,12)
𝑃(2,12 < 𝑇9H < 2,921) + 𝑃(−2,921 < 𝑇9H < −2,12) = 0,04
𝑃(2,12 < 𝑇9H < 2,921) = 𝑃(−2,921 < 𝑇9H < −2,12)
Assim:
𝑃(2,12 < 𝑇9H < 2,921) + 𝑃(2,12 < 𝑇9H < 2,921) = 0,04
0,04
𝑃(2,12 < 𝑇9H < 2,921) = = 0,02
2
Gabarito: Errado.
Comentários:
A distribuição t-Student se aproxima da curva normal à medida que o grau de liberdade cresce
(consequência do Teorema Central do Limite).
Gabarito: Certo.
121
49. (CESPE/2013 – MPU) Se T20 representa uma distribuição t de Student com 20 graus de
liberdade, então P(T20 < 2,921) > 0,99.
Comentários:
Pelo gráfico, podemos observar que P(-2,921 < T16 < 2,921) = 0,99, logo, P(T16 < 2,921) > 0,99.
Com o aumento do grau de liberdade, a distribuição t-Student se aproxima da normal,
aumentando a probabilidade dos valores centrais e diminuindo a probabilidade dos valores
extremos. Assim, a probabilidade associada a esse mesmo intervalo será ainda maior.
Gabarito: Certo.
Comentários:
𝒳W!%
Á
𝑘
𝑌 = 𝐹W% ,W$ = ! 9
𝒳W$
Á
𝑘!
Sendo 𝑘9 = 1 e 𝑘! = 16, como informado, então:
𝒳9!Š
𝑌 = 𝐹9,9H = ! 1
𝒳9HŠ
16
Sabendo que a distribuição qui-quadrado com um grau de liberdade corresponde ao quadrado
de uma variável normal padrão, então:
𝑍!
𝑌= !
𝒳9HŠ
16
v
Considerando que a variável t-Student é definida como 𝑇 = , então, para 𝑘 = 16, temos:
$
w𝒳;
;
122
𝑍
𝑇9H =
!
•𝒳9H
16
Ou seja:
𝑌 = 𝑇9H !
Portanto:
𝑃—0 < 𝑇9H ! < 2,12! ˜ = 𝑃(0 < |𝑇9H | < 2,12)
A probabilidade de o módulo de 𝑇9H ser menor que 2,12 (necessariamente, o módulo é maior que
zero) é dada por:
Gabarito: Certo.
123
Variáveis Contínuas
A função de distribuição cumulativa de uma variável aleatória é sempre uma função decrescente
e assume valores no intervalo [0,1].
(CESPE/2014 – Analista Judiciário do TJ/SE) Considerando que X seja uma variável aleatória
contínua, tal que E(X) = 1 e E(X 2 ) = 4, julgue os itens seguintes.
a) 0,2
b) 0,3
c) 0,4
d) 0,5
e) 0,6
124
Considere que uma variável aleatória contínua e simétrica em zero tenha função densidade de
probabilidade f(x) tal que:
a) A mediana de Y é superior a 1.
b) P(Y = 1) = 0,75
125
Distribuições Conjuntas
(CESPE/2013 – CNJ) Uma máquina de café expresso precisa ser reiniciada algumas vezes
durante o dia, devido ao uso excessivo. A tabela abaixo mostra a distribuição de probabilidade
conjunta do número de vezes que ela é reiniciada na parte da manhã (M) e na parte da tarde
(T).
10. (CESPE/2013 – CNJ) O número de vezes que a máquina é reiniciada na parte da tarde
depende do número de vezes que ela é reiniciada pela manhã.
a) P(X=2,Y=3)=0,10.
b) d = 1/75.
d) P(X≥1,Y≥3)=7/15.
126
15. (CESPE/2013 – TRT 17ª Região) No que se refere a distribuições discretas, julgue o
seguinte item.
9 𝑛
Para a distribuição conjunta 𝑃(𝑁 = 𝑛, 𝑋 = 𝑥) = H × d e 𝑝 8 (1 − 𝑝)3;8 , em que n = 1, ..., 6 e x é uma
𝑥
contagem, as variáveis N e X são dependentes.
(CESPE/2011 – SEDUC/AM)
127
(CESPE/2011 – SEDUC/AM)
Julgue os próximos itens, considerando que o vetor aleatório (X, Y) possui distribuição
conjunta de probabilidade conforme o quadro acima.
20. (CESPE/2011 – SEDUC/AM) A correlação linear entre X e Y é nula; disso se conclui que
ambas são independentes.
Distribuições Contínuas
128
23. (CESPE/2013 – Estatístico da FUB) Nesse circuito, a potência esperada é igual a 1/3.
26. (CESPE/2016 – Analista de Controle Externo do TCE/PA) P(T > 35 | T > 30) = P(T > 35).
27. (CESPE/2013 – Analista Judiciário da STM) P(X > 5.000 | X > 1.000) < P(X > 5.000).
129
𝑾;𝟐𝟎
34. (CESPE/2018 – Agente de Polícia Federal) A razão segue distribuição normal
√𝟒
padrão.
35. (CESPE/2013 – TRT 17ª Região) No que se refere a distribuições discretas, julgue o
seguinte item.
130
A aproximação da distribuição binomial pela normal não se aplica com base no teorema limite
central, visto que a binomial não se relaciona com uma soma de variáveis aleatórias.
36. (CESPE/2018 – Agente de Polícia Federal) Uma amostra aleatória simples Y1, Y2,
..., Y25 foi retirada de uma distribuição normal com média nula e variância σ2, desconhecida.
Considerando que P(x2 ≤ 13) = P(x2 > 41) = 0,025, em que x2 representa a distribuição qui-
quadrado com 25 graus de liberdade, e que 𝑺𝟐 = ∑𝟐𝟓 𝟐
𝒊j𝟏 𝒀𝒊 , julgue o item a seguir.
(CESPE/2018 – Analista Judiciário STM) Supondo que Z seja uma distribuição normal padrão,
considere as seguintes transformações de variáveis aleatórias: W = 1 – Z e V = Z2 – W2+ 1. A
respeito dessas variáveis aleatórias, julgue os itens a seguir.
37. (CESPE/2018 – Analista Judiciário STM) A variável aleatória W segue distribuição normal
com variância unitária.
38. (CESPE/2018 – Analista Judiciário STM) A variável aleatória V segue distribuição normal.
131
𝑾
43. (CESPE/2016 – Auditor de Controle Externo do TCE/PA) A razão 𝒁
segue uma
distribuição com variância igual a 1.
(CESPE/2013 – MPU)
49. (CESPE/2013 – MPU) Se T20 representa uma distribuição t de Student com 20 graus de
liberdade, então P(T20 < 2,921) > 0,99.
133
GABARITO
1. ERRADO 18. ERRADO 35. ERRADO
2. ERRADO 19. CERTO 36. CERTO
3. ERRADO 20. ERRADO 37. CERTO
4. CERTO 21. CERTO 38. CERTO
5. LETRA B 22. ERRADO 39.ERRADO
6. CERTO 23. CERTO 40.ERRADO
7. CERTO 24. ERRADO 41. CERTO
8. LETRA D 25. CERTO 42.ERRADO
9. CERTO 26. ERRADO 43. ERRADO
10. CERTO 27. ERRADO 44. ERRADO
11. LETRA B 28. ERRADO 45. ERRADO
12. CERTO 29. ERRADO 46. ERRADO
13. CERTO 30. ERRADO 47. ERRADO
14. ERRADO 31. CERTO 48. CERTO
15. CERTO 32. ERRADO 49. CERTO
16. ERRADO 33. CERTO 50. CERTO
17. ERRADO 34. ERRADO
134