20150621 統計検定2級 問11
二者択一で答えさせられる36問の問題があり、24問以上の正解で合格である。この時、全くでたらめの回答をしたときの合格率は幾らか?次の①~⑤で答えよ。
①50% ②30% ③10% ④5% ⑤3%
〇答え:⑤
〇内容
\begin{eqnarray} 36 \times \frac {1}{2} = 18 \end{eqnarray}
\begin{eqnarray} 36 \times \frac {1}{2} \times (1 - \frac {1}{2} ) = 9 \end{eqnarray}
\begin{eqnarray} \sqrt{ 36 \times \frac {1}{2} \times (1 - \frac {1}{2} ) } = 3\end{eqnarray}
\begin{eqnarray} 24-0.5=23.5 \end{eqnarray}
\begin{eqnarray} P(x \geqq 23.5) \end{eqnarray}
\begin{eqnarray} P(z \geqq \frac {23.5-18}{3}) \end{eqnarray}
\begin{eqnarray} P(z \geqq 1.8333) \end{eqnarray}
\begin{eqnarray} =0.0336 \end{eqnarray}
\begin{eqnarray} P(x \geqq 23.5)=0.0336 \end{eqnarray}
\begin{eqnarray} \therefore 3パーセント \end{eqnarray}
〇詳細
二者択一だから○×で二項分布。
二項分布は離散型。正規分布は連続型。なので半整数補正をすることで近似させる。
まずは二項分布なので。
・平均
\begin{eqnarray} \mu = np \end{eqnarray}
n=36問
p=○ or ×だから 0.5
\begin{eqnarray} 36 \times \frac {1}{2} = 18 \end{eqnarray}
\begin{eqnarray} \mu = 18 \end{eqnarray}
・分散
\begin{eqnarray} σ^2 = np(1-p) \end{eqnarray}
つまり、こんな感じ。
\begin{eqnarray} 36 \times \frac {1}{2} \times (1 - \frac {1}{2} ) = 9 \end{eqnarray}
・標準偏差
\begin{eqnarray} σ= \sqrt{ np(1-p) } \end{eqnarray}
\begin{eqnarray} \sqrt{ 36 \times \frac {1}{2} \times (1 - \frac {1}{2} ) } = 3\end{eqnarray}
・半整数補正
まぁ単純に確率を-0.5 or +0.5をすればいいだけ。こんな感じ。
\begin{eqnarray} P \geqq 24 \end{eqnarray}
\begin{eqnarray} 24-0.5=23.5 \end{eqnarray}
\begin{eqnarray}※( P \leqq 24 なら+0.5となる)\end{eqnarray}
後は、標準化を行い。
\begin{eqnarray} =P ( Z \geqq \frac{ 23.5 - 18 }{ 3 } ) \end{eqnarray}
\begin{eqnarray} =P ( Z \geqq 1.8333 ) \end{eqnarray}
1.8333を正規分布表で見比べ。
\begin{eqnarray} =0.0336 \end{eqnarray}
\begin{eqnarray} P(x \geqq 23.5)=0.0336 \end{eqnarray}
凡そ、3%となる。
\begin{eqnarray} \therefore 3パーセント \end{eqnarray}
○SAS
因みに
D37が問26以上を計算したもの。0.032623なので約3.3%。
zが半整数補正を行ったもの。0.033377なので約3.3%。
z1は半整数補正を行わなかった場合。0.009815329なので約1%。
OBS | p | m | v | σ | x | p1 | p2 | z | z1 | n |
---|---|---|---|---|---|---|---|---|---|---|
1 | 0.5 | 18 | 9 | 3 | 23.5 | 0.96662 | 0.99018 | 0.033377 | .009815329 | 36 |
d0 | d1 | d2 | d3 | d4 | d5 | d6 | d7 | d8 | d9 | d10 |
1.4552E-11 | 5.2387E-10 | 9.1677E-9 | .000000104 | .000000857 | .000005486 | .000028344 | .000121475 | .000440346 | .001369965 | .003698906 |
d11 | d12 | d13 | d14 | d15 | d16 | d17 | d18 | d19 | d20 | d21 |
.008742868 | 0.018214 | 0.033626 | 0.055243 | 0.081024 | 0.10634 | 0.12511 | 0.13206 | 0.12511 | 0.10634 | 0.081024 |
d22 | d23 | d24 | d25 | d26 | d27 | d28 | d29 | d30 | d31 | d32 |
0.055243 | 0.033626 | 0.018214 | .008742868 | .003698906 | .001369965 | .000440346 | .000121475 | .000028344 | .000005486 | .000000857 |
d33 | d34 | d35 | d36 | d37 | ||||||
.000000104 | 9.1677E-9 | 5.2387E-10 | 1.4552E-11 | 0.032623 |
20150621 統計検定2級 問10[3]
ある都市におけるPM2.5(微小粒子状物質)の1日平均量Xは独立に正規分布に従い、その平均は20μg/㎥、標準偏差は5μg/㎥であると仮定する。世界保健機関(WHO)のガイドラインでは、PM2.5の1日平均量に対する指針値を25μg/㎥と定めている。
[3]1週間のうち、1日平均量Xが指針値25μg/㎥を超える日が2日以上となる確率は幾らか?次の①~⑤からどーぞ。
①1.0% ②29% ③31% ④69% ⑤71%
〇回答:③
〇内容
\begin{eqnarray} P \geqq 25 \end{eqnarray}
\begin{eqnarray} =P ( Z \geqq \frac{ 25 - 20 }{ 5 } ) \end{eqnarray}
\begin{eqnarray} =P ( Z \geqq 1 ) \end{eqnarray}
標準正規分布表を参照して1.00を見つける。
値1.00の面積は0.1587。
\begin{eqnarray} =P ( Z \geqq 1 ) = 0.1587 \end{eqnarray}
\begin{eqnarray} f(0) = {}_7 \mathrm{ C }_0 0.1587^0(1-0.1587)^7 \fallingdotseq 0.29841 \end{eqnarray}
\begin{eqnarray} f(1) = {}_7 \mathrm{ C }_1 0.1587^1(1-0.1587)^6 \fallingdotseq 0.39391 \end{eqnarray}
\begin{eqnarray} 1-f(0)-f(1) = 0.30768 \fallingdotseq 0.31 \end{eqnarray}
∴31%
〇詳細
A「[1]PM2.5の1日平均量Xが指針値25μg/㎥を超える確率」って事で、問10[1]で1日平均量が出ている。んーっと0.1587。
B「[3]…1日平均量Xが指針値25μg/㎥を超える日」なので、超えるの?超えないの?どっち?
って事で、ベルヌーイトライアルじゃん。と。詳しくは…検索してね。ベルヌーイトライアルって事は二項分布かーと。
C「[3]1週間のうち…2日以上となる確率は幾らか?」
A:式はおさらいっというか問10[1]で出ているけれど。
\begin{eqnarray} P \geqq 25 \end{eqnarray}
\begin{eqnarray} =P ( Z \geqq \frac{ 25 - 20 }{ 5 } ) \end{eqnarray}
\begin{eqnarray} =P ( Z \geqq 1 ) \end{eqnarray}
標準正規分布表を参照して1.00を見つける。
値1.00の面積は0.1587。
B:二項分布の式はこんな感じ。
\begin{eqnarray} f(x) = {}_n \mathrm{ C }_x P^x(1-P)^{n-x} \end{eqnarray}
nは総数。今回は7日がそう。
Pは確率。Aの答えがそう。0.1587。
xは変数。今回の場合はnが7なので0~7の間。
C:2日以上の確率だから
\begin{eqnarray} f(2) = {}_7 \mathrm{ C }_2 0.1587^x(1-0.1587)^{7-2} \end{eqnarray}
\begin{eqnarray} f(3) = {}_7 \mathrm{ C }_3 0.1587^x(1-0.1587)^{7-3} \end{eqnarray}
…
\begin{eqnarray} f(7) = {}_7 \mathrm{ C }_7 0.1587^x(1-0.1587)^{7-7} \end{eqnarray}
なんてやるよりかは、確率分布の性質として1-0の間って性質があるので、
\begin{eqnarray} f(0) = {}_7 \mathrm{ C }_2 0.1587^x(1-0.1587)^{7-2} \end{eqnarray}
\begin{eqnarray} f(1) = {}_7 \mathrm{ C }_3 0.1587^x(1-0.1587)^{7-3} \end{eqnarray}
\begin{eqnarray} 1-f(0)-f(1) = 0.30768 \fallingdotseq 0.31 \end{eqnarray}
でも、結果は一緒。
因みにSASだと。
OBS | p | z | n | d0 | d1 | d2 | d3 | d4 | d5 | d6 | d7 | d8 | d9 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | 0.84134 | 0.15866 | 7 | 0.29841 | 0.39391 | 0.22284 | 0.070037 | 0.013207 | .001494306 | .000093929 | .000002530 | 0.30768 | 0.30768 |
20150621 統計検定2級 問10[2]
ある都市におけるPM2.5(微小粒子状物質)の1日平均量Xは独立に正規分布に従い、その平均は20μg/㎥、標準偏差は5μg/㎥であると仮定する。世界保健機関(WHO)のガイドラインでは、PM2.5の1日平均量に対する指針値を25μg/㎥と定めている。
[2]1日平均量Xの1週間(7日)での平均が指針値25μg/㎥を超える確率は幾らか?次の①~⑤からどーぞ。
①0.1% ②0.4% ③0.7% ④1.5% ⑤2.3%
〇回答:②
※回答の右を反転してください。
〇内容
\begin{eqnarray} P \geqq 25 \end{eqnarray}
\begin{eqnarray} =P ( Z \geqq \frac{ 25 - 20 }{\frac{ 5 }{ \sqrt{ 7} }} ) \end{eqnarray}
\begin{eqnarray} =P ( Z \geqq \sqrt{ 7} \fallingdotseq 2.6457 ) \end{eqnarray}
標準正規分布表を参照して2.65を見つける。
値2.65の面積は0.0040。
\begin{eqnarray} =P ( Z \geqq 2.65 ) = 0.0040 \end{eqnarray}
\begin{eqnarray} \therefore 0.4 パーセント\end{eqnarray}
〇詳細
問いには母平均の日数が書いてないからわからないけれど、
[2]1日平均量Xの1週間(7日)での平均が指針値25μg/㎥と書いていることから、
7日は標本平均なんだなーってね。
標本平均。全体の中の一部を取り出した平均。
じゃあ[1]と何が変わるのかっていうと。
\begin{eqnarray} =P ( Z \geqq \frac{ 25 - 20 }{\frac{ 5 }{ \sqrt{ 7} }} ) \end{eqnarray}
公式にすると
\begin{eqnarray} \frac{ \bar{ X } - \mu }{\frac{ σ }{ \sqrt{ n} }} \end{eqnarray}
[1]は
\begin{eqnarray} \frac{ X - \mu }{ σ } = Z \end{eqnarray}
分母が変化している。
何故分母が変化したかというと、全体の中の一部だから。
この一部が全体に近づくことで元の正規分布に近づいていく。
このことを中心極限定理って言う。
中心極限定理でーググろう。
まぁつまり。
標本平均の分布だし、正規分布しているんだから、この公式。
\begin{eqnarray} \frac{ \bar{ X } - \mu }{\frac{ σ }{ \sqrt{ n} }} \end{eqnarray}
で、後は当てはめて計算。
sasだとこんな感じ。
data work1001;
a=sqrt(7); /*平方根の計算。エクセルもこの関数。*/
b=5/a;
p=cdf('normal',25,20,b);
z=(1-p);
run;
proc print data=work1001;
run;
OBS | a | b | p | z |
---|---|---|---|---|
1 | 2.64575 | 1.88982 | 0.99592 | .004075486 |
z=0.00407
なので。0.4%が正解。
mathjax2 左寄せ。
mathjaxはデフォルトでセンタリングしているみたいなので中央にくる。
先日左寄せにできないかなーって書いたんだけれど出来たっポイ。
<script type="text/x-mathjax-config">
MathJax.Hub.Config({
displayAlign: "left"
});
</script>
はてぶ上の話ってことを踏まえて。
記事の管理⇒デザイン⇒カスタマイズ⇒サイドバー⇒モジュールを追加⇒上記を追記⇒</>htmlを選択⇒上記コード貼り付け(名前は適当。ボクはmathjaxleftって名前にしたけれど)
にて完了。
ただ、パーセンテージの記号がなくて%をパーセントと書くのが恥ずかしい。
これはmthjaxさんが作ってくれない限りはないからなー…くぅ…。
20150621 統計検定2級 問10[1]
ある都市におけるPM2.5(微小粒子状物質)の1日平均量Xは独立に正規分布に従い、その平均は20μg/㎥、標準偏差は5μg/㎥であると仮定する。世界保健機関(WHO)のガイドラインでは、PM2.5の1日平均量に対する指針値を25μg/㎥と定めている。
[1]PM2.5の1日平均量Xが指針値25μg/㎥を超える確率は幾らか。次の①~⑤を選べ。
①2.3% ②16% ③32% ④46% ⑤54%
〇回答:②
※回答の右を反転してください。
〇内容
\begin{eqnarray} P \geqq 25 \end{eqnarray}
\begin{eqnarray} =P ( Z \geqq \frac{ 25 - 20 }{ 5 } ) \end{eqnarray}
\begin{eqnarray} =P ( Z \geqq 1 ) \end{eqnarray}
標準正規分布表を参照して1.00を見つける。
値1.00の面積は0.1587。
\begin{eqnarray} =P ( Z \geqq 1 ) = 0.1587 \fallingdotseq 0.16 \end{eqnarray}
\begin{eqnarray} \therefore 16 パーセント\end{eqnarray}
〇詳細
「 1日平均量Xは独立に正規分布に従い」と書いてあるから、正規分布に従うのかーと。正規分布とググっちゃえば、大体釣鐘型の図が出てくるはず。
「その平均は20μg/㎥、標準偏差は5μg/㎥であると仮定する。」と書いている。
これを表す記号は
\begin{eqnarray} x:N(\mu、σ^2) \end{eqnarray}
と記す。んーまぁこんなのが出てきたら正規分布じゃね?って思えばいいかな。
今回のばーいは、上記をあてはめると
\begin{eqnarray} x:N(20、5) \end{eqnarray}
\begin{eqnarray} 5^2 \end{eqnarray}
じゃないのって思うかもだけれど、標準偏差って書かれているか、分散って書かれているかが分岐点。今回は標準偏差って書かれているので
\begin{eqnarray} x:N(20、5) \end{eqnarray}
で、 この平均μと標準偏差σを標準化すると、平均0、標準偏差1の正規分布に変わる。その公式が
\begin{eqnarray} \frac{ X - \mu }{ σ } = Z \end{eqnarray}
で、それを当てはめると、
\begin{eqnarray} =P ( Z \geqq \frac{ 25 - 20 }{ 5 } ) \end{eqnarray}
あ。越える確率だから≧。
で、計算すると
\begin{eqnarray} =P ( Z \geqq \frac{ 25 - 20 }{ 5 } ) \end{eqnarray}
\begin{eqnarray} =P ( Z \geqq 1 ) \end{eqnarray}
後は標準正規分布表とにらめっこして1.00なんだけれど、
釣鐘型の右側の1以上って事を念頭に入れて正規分布表を見ること。
今回の場合は0.1587と表示されている。
sasで計算してみるとこう。
data work1001;
p=cdf('normal',25,20,5); /*正規分布の累積分布関数->CDF*/
z=1-p; /*問では超える確率としているので、正規分布の右側の面積の数値を求める*/
run;
proc print data=work1001;
run;
OBS | p | z |
---|---|---|
1 | 0.84134 | 0.15866 |
z=0.15866≒0.16=16%
mathjax
統計の式を書くのに良いのないかなーって思って、
mathjaxってのがあった。
はてぶではtexのがあるから、まぁ入れなくても良かったんだけれど。
ただ
\frac{ 1 }{ 2 }
ってやっても思い通りにならなくて、あ?って感じだったんだけれど、
\begin{eqnarray} ¥frac{ 1 }{ 2 } ¥end{eqnarray}
※¥→半角¥で。
っとすると
\begin{eqnarray} \frac{ 1 }{ 2 } \end{eqnarray}
イメージ通り。ただ、HTMLで左寄せしても、これが出来なかったけれど恐らくこれは多分出来る。でも読めれば良い感じで作ってるので。
これで少しは読みやすくなったかな♪
20150621 統計検定2級8問目[3]
100円玉5枚、10円玉7枚、1円玉3枚の入った小銭入れから、同時にに3枚の硬貨を取り出す。いずれかの硬貨を取り出すのも同様に確からしいとする。
[3]取り出した3枚の金額の合計が150円以上であるという条件のもとで、その3枚の中に1円玉が含まれる条件付き確率は幾らか?次の①~⑤から選べ。
①1/3 ②3/11 ③8/11 ④6/91 ⑤8/91
〇回答: ②
※回答の右を反転してください。
〇内容
\begin{eqnarray} \frac{\frac{ {}_5 \mathrm{ C }_2 \times {}_3 \mathrm{ C }_1 }{ {}_1{}_5 \mathrm{ C }_3 } }{ \frac{ {}_5 \mathrm{ C }_3 + {}_5 \mathrm{ C }_2\times {}_7 \mathrm{ C }_1 + {}_5 \mathrm{ C }_2\times {}_3 \mathrm{ C }_1 }{ {}_1{}_5 \mathrm{ C }_3 } } = \frac{ 3 }{ 11 }\end{eqnarray}
〇詳細
8問目[3]は部分の中から部分。
A:取り出した3枚の金額の合計が150円以上であるという条件のもと
っていう問題文があるから、2番目の答えが関係してくるんだなーと。
B:その3枚の中に1円玉が含まれる条件付き確率は幾らか?
\begin{eqnarray} { 100円5枚中2枚取り出す組み合わせ ⇒ {}_5 \mathrm{ C }_2 } \end{eqnarray}
\begin{eqnarray} { 1円3枚中1枚取り出す組み合わせ ⇒ {}_3 \mathrm{ C }_1 } \end{eqnarray}
\begin{eqnarray} { 15枚中3枚取り出す組み合わせ ⇒ {}_1{}_5 \mathrm{ C }_3 } \end{eqnarray}
Aっていう条件があってその中からBを取り出せる確率を出してよ!って感じ。
なので
\begin{eqnarray} \frac{B}{A} = \frac{\frac{ {}_5 \mathrm{ C }_2 \times {}_3 \mathrm{ C }_1 }{ {}_1{}_5 \mathrm{ C }_3 } }{ \frac{ {}_5 \mathrm{ C }_3 + {}_5 \mathrm{ C }_2\times {}_7 \mathrm{ C }_1 + {}_5 \mathrm{ C }_2\times {}_3 \mathrm{ C }_1 }{ {}_1{}_5 \mathrm{ C }_3 } } = \frac{ 3 }{ 11 }\end{eqnarray}
これを小難しく言うと条件付き確率公式。
\begin{eqnarray} P {}_A(B) = \frac{ {}_n(A \cap B) }{ {}_n(A) } = \frac{ P(A \cap B) }{ P(A) } \end{eqnarray}
\begin{eqnarray} 150円以上の中で1円玉が含まれている確率→ P(A \cap B) \end{eqnarray}
\begin{eqnarray} コイン15枚の中から3枚取り出して150円以上[2の回答より]→ P(A)\end{eqnarray}
つまり、こういう計算になる。
\begin{eqnarray} \frac{\frac{ {}_5 \mathrm{ C }_2 \times {}_3 \mathrm{ C }_1 }{ {}_1{}_5 \mathrm{ C }_3 } }{ \frac{ {}_5 \mathrm{ C }_3 + {}_5 \mathrm{ C }_2\times {}_7 \mathrm{ C }_1 + {}_5 \mathrm{ C }_2\times {}_3 \mathrm{ C }_1 }{ {}_1{}_5 \mathrm{ C }_3 } } = \frac{ 3 }{ 11 }\end{eqnarray}