kino's blog

ホームページ公開後の悪戦苦闘等々他2本

20150621 統計検定2級 問11

二者択一で答えさせられる36問の問題があり、24問以上の正解で合格である。この時、全くでたらめの回答をしたときの合格率は幾らか?次の①~⑤で答えよ。

 

①50% ②30% ③10% ④5% ⑤3%

 

〇答え

〇内容

\begin{eqnarray} 36 \times \frac {1}{2} = 18 \end{eqnarray}

\begin{eqnarray} 36 \times \frac {1}{2} \times (1 - \frac {1}{2} ) = 9 \end{eqnarray}

\begin{eqnarray} \sqrt{ 36 \times \frac {1}{2} \times (1 - \frac {1}{2} ) } = 3\end{eqnarray}

\begin{eqnarray} 24-0.5=23.5 \end{eqnarray}

\begin{eqnarray} P(x \geqq 23.5) \end{eqnarray}

\begin{eqnarray} P(z \geqq \frac {23.5-18}{3}) \end{eqnarray}

\begin{eqnarray} P(z \geqq 1.8333) \end{eqnarray}

\begin{eqnarray} =0.0336 \end{eqnarray}

\begin{eqnarray} P(x \geqq 23.5)=0.0336 \end{eqnarray}

\begin{eqnarray} \therefore 3パーセント \end{eqnarray}

 

〇詳細

二者択一だから○×で二項分布。

二項分布は離散型。正規分布は連続型。なので半整数補正をすることで近似させる。

まずは二項分布なので。

・平均

\begin{eqnarray} \mu = np \end{eqnarray}

n=36問

p=○ or ×だから 0.5

\begin{eqnarray} 36 \times \frac {1}{2} = 18 \end{eqnarray}

\begin{eqnarray} \mu = 18 \end{eqnarray}

・分散

\begin{eqnarray} σ^2 = np(1-p) \end{eqnarray}

つまり、こんな感じ。

\begin{eqnarray} 36 \times \frac {1}{2} \times (1 - \frac {1}{2} ) = 9 \end{eqnarray}

標準偏差

\begin{eqnarray} σ= \sqrt{ np(1-p) } \end{eqnarray}

\begin{eqnarray} \sqrt{ 36 \times \frac {1}{2} \times (1 - \frac {1}{2} ) } = 3\end{eqnarray}

 

半整数補正

まぁ単純に確率を-0.5 or +0.5をすればいいだけ。こんな感じ。

\begin{eqnarray} P \geqq 24 \end{eqnarray}

\begin{eqnarray} 24-0.5=23.5 \end{eqnarray}

\begin{eqnarray}※( P \leqq 24 なら+0.5となる)\end{eqnarray}

後は、標準化を行い。

\begin{eqnarray} =P  (  Z \geqq \frac{ 23.5 - 18 }{ 3 } ) \end{eqnarray}

\begin{eqnarray} =P  (  Z \geqq 1.8333 ) \end{eqnarray}

1.8333を正規分布表で見比べ。

\begin{eqnarray} =0.0336 \end{eqnarray}

\begin{eqnarray} P(x \geqq 23.5)=0.0336 \end{eqnarray}

凡そ、3%となる。

\begin{eqnarray} \therefore 3パーセント \end{eqnarray}

 

SAS

因みに

D37が問26以上を計算したもの。0.032623なので約3.3%。

zが半整数補正を行ったもの。0.033377なので約3.3%。

 z1は半整数補正を行わなかった場合。0.009815329なので約1%。

 

OBSpmvσxp1p2zz1n
1 0.5 18 9 3 23.5 0.96662 0.99018 0.033377 .009815329 36
d0d1d2d3d4d5d6d7d8d9d10
1.4552E-11 5.2387E-10 9.1677E-9 .000000104 .000000857 .000005486 .000028344 .000121475 .000440346 .001369965 .003698906
d11d12d13d14d15d16d17d18d19d20d21
.008742868 0.018214 0.033626 0.055243 0.081024 0.10634 0.12511 0.13206 0.12511 0.10634 0.081024
d22d23d24d25d26d27d28d29d30d31d32
0.055243 0.033626 0.018214 .008742868 .003698906 .001369965 .000440346 .000121475 .000028344 .000005486 .000000857
d33d34d35d36d37
.000000104 9.1677E-9 5.2387E-10 1.4552E-11 0.032623

 

Q2015J11

 

20150621 統計検定2級 問10[3]

ある都市におけるPM2.5(微小粒子状物質)の1日平均量Xは独立に正規分布に従い、その平均は20μg/㎥、標準偏差は5μg/㎥であると仮定する。世界保健機関(WHO)のガイドラインでは、PM2.5の1日平均量に対する指針値を25μg/㎥と定めている。

 

[3]1週間のうち、1日平均量Xが指針値25μg/㎥を超える日が2日以上となる確率は幾らか?次の①~⑤からどーぞ。

①1.0% ②29% ③31% ④69% ⑤71%

 

〇回答

〇内容

\begin{eqnarray} P \geqq 25 \end{eqnarray}

\begin{eqnarray} =P  (  Z \geqq \frac{ 25 - 20 }{ 5 } ) \end{eqnarray}

\begin{eqnarray} =P  (  Z \geqq 1 ) \end{eqnarray}

標準正規分布表を参照して1.00を見つける。

値1.00の面積は0.1587。

\begin{eqnarray} =P  (  Z \geqq 1 ) = 0.1587 \end{eqnarray}

\begin{eqnarray} f(0) = {}_7 \mathrm{ C }_0 0.1587^0(1-0.1587)^7 \fallingdotseq 0.29841 \end{eqnarray}

\begin{eqnarray} f(1) = {}_7 \mathrm{ C }_1 0.1587^1(1-0.1587)^6 \fallingdotseq 0.39391 \end{eqnarray}

\begin{eqnarray} 1-f(0)-f(1) = 0.30768  \fallingdotseq 0.31 \end{eqnarray}

∴31%

 〇詳細

A「[1]PM2.5の1日平均量Xが指針値25μg/㎥を超える確率」って事で、問10[1]で1日平均量が出ている。んーっと0.1587。

B「[3]…1日平均量Xが指針値25μg/㎥を超える日」なので、超えるの?超えないの?どっち?

って事で、ベルヌーイトライアルじゃん。と。詳しくは…検索してね。ベルヌーイトライアルって事は二項分布かーと。

C「[3]1週間のうち…2日以上となる確率は幾らか?」

 

A:式はおさらいっというか問10[1]で出ているけれど。

\begin{eqnarray} P \geqq 25 \end{eqnarray}

\begin{eqnarray} =P  (  Z \geqq \frac{ 25 - 20 }{ 5 } ) \end{eqnarray}

\begin{eqnarray} =P  (  Z \geqq 1 ) \end{eqnarray}

標準正規分布表を参照して1.00を見つける。

値1.00の面積は0.1587。

 

B:二項分布の式はこんな感じ。

\begin{eqnarray} f(x) = {}_n \mathrm{ C }_x P^x(1-P)^{n-x}  \end{eqnarray}

nは総数。今回は7日がそう。

Pは確率。Aの答えがそう。0.1587。

xは変数。今回の場合はnが7なので0~7の間。

 

C:2日以上の確率だから

 \begin{eqnarray} f(2) = {}_7 \mathrm{ C }_2 0.1587^x(1-0.1587)^{7-2}  \end{eqnarray}

 \begin{eqnarray} f(3) = {}_7 \mathrm{ C }_3 0.1587^x(1-0.1587)^{7-3}  \end{eqnarray}

 \begin{eqnarray} f(7) = {}_7 \mathrm{ C }_7 0.1587^x(1-0.1587)^{7-7}  \end{eqnarray}

なんてやるよりかは、確率分布の性質として1-0の間って性質があるので、

 \begin{eqnarray} f(0) = {}_7 \mathrm{ C }_2 0.1587^x(1-0.1587)^{7-2}  \end{eqnarray}

 \begin{eqnarray} f(1) = {}_7 \mathrm{ C }_3 0.1587^x(1-0.1587)^{7-3}  \end{eqnarray}

\begin{eqnarray} 1-f(0)-f(1) = 0.30768  \fallingdotseq 0.31 \end{eqnarray}

でも、結果は一緒。

 

因みにSASだと。

201506Q1003

 

OBSpznd0d1d2d3d4d5d6d7d8d9
1 0.84134 0.15866 7 0.29841 0.39391 0.22284 0.070037 0.013207 .001494306 .000093929 .000002530 0.30768 0.30768

 

20150621 統計検定2級 問10[2]

ある都市におけるPM2.5(微小粒子状物質)の1日平均量Xは独立に正規分布に従い、その平均は20μg/㎥、標準偏差は5μg/㎥であると仮定する。世界保健機関(WHO)のガイドラインでは、PM2.5の1日平均量に対する指針値を25μg/㎥と定めている。

 

[2]1日平均量Xの1週間(7日)での平均が指針値25μg/㎥を超える確率は幾らか?次の①~⑤からどーぞ。

①0.1% ②0.4% ③0.7% ④1.5% ⑤2.3%

 

〇回答

 ※回答の右を反転してください。

〇内容

\begin{eqnarray} P \geqq 25 \end{eqnarray}

\begin{eqnarray} =P  (  Z \geqq \frac{ 25 - 20 }{\frac{ 5 }{ \sqrt{ 7} }} ) \end{eqnarray}

\begin{eqnarray} =P  (  Z \geqq \sqrt{ 7} \fallingdotseq 2.6457 ) \end{eqnarray}

標準正規分布表を参照して2.65を見つける。

値2.65の面積は0.0040。

\begin{eqnarray} =P  (  Z \geqq 2.65 ) = 0.0040 \end{eqnarray}

\begin{eqnarray} \therefore 0.4 パーセント\end{eqnarray}

 

〇詳細

問いには母平均の日数が書いてないからわからないけれど、

[2]1日平均量Xの1週間(7日)での平均が指針値25μg/㎥と書いていることから、

7日は標本平均なんだなーってね。

標本平均。全体の中の一部を取り出した平均。

じゃあ[1]と何が変わるのかっていうと。

\begin{eqnarray} =P  (  Z \geqq \frac{ 25 - 20 }{\frac{ 5 }{ \sqrt{ 7} }} ) \end{eqnarray}

 

公式にすると

\begin{eqnarray}  \frac{ \bar{ X } - \mu }{\frac{ σ }{ \sqrt{ n} }} \end{eqnarray}

[1]は

\begin{eqnarray} \frac{ X - \mu }{ σ } = Z \end{eqnarray}

分母が変化している。

 

何故分母が変化したかというと、全体の中の一部だから。

この一部が全体に近づくことで元の正規分布に近づいていく。

このことを中心極限定理って言う。

中心極限定理でーググろう。

 

まぁつまり。

標本平均の分布だし、正規分布しているんだから、この公式。

\begin{eqnarray}  \frac{ \bar{ X } - \mu }{\frac{ σ }{ \sqrt{ n} }} \end{eqnarray}

で、後は当てはめて計算。 

  

sasだとこんな感じ。

data work1001;
a=sqrt(7); /*平方根の計算。エクセルもこの関数。*/
b=5/a;
p=cdf('normal',25,20,b);
z=(1-p);
run;

proc print data=work1001;
run;

 

OBSabpz
1 2.64575 1.88982 0.99592 .004075486

 

z=0.00407

なので。0.4%が正解。

mathjax2 左寄せ。

mathjaxはデフォルトでセンタリングしているみたいなので中央にくる。

先日左寄せにできないかなーって書いたんだけれど出来たっポイ。

 

<script type="text/x-mathjax-config">
MathJax.Hub.Config({
displayAlign: "left"
});
</script>

 

はてぶ上の話ってことを踏まえて。

記事の管理⇒デザイン⇒カスタマイズ⇒サイドバー⇒モジュールを追加⇒上記を追記⇒</>htmlを選択⇒上記コード貼り付け(名前は適当。ボクはmathjaxleftって名前にしたけれど)

にて完了。

 

ただ、パーセンテージの記号がなくて%をパーセントと書くのが恥ずかしい。

これはmthjaxさんが作ってくれない限りはないからなー…くぅ…。

20150621 統計検定2級 問10[1]

ある都市におけるPM2.5(微小粒子状物質)の1日平均量Xは独立に正規分布に従い、その平均は20μg/㎥、標準偏差は5μg/㎥であると仮定する。世界保健機関(WHO)のガイドラインでは、PM2.5の1日平均量に対する指針値を25μg/㎥と定めている。

 

[1]PM2.5の1日平均量Xが指針値25μg/㎥を超える確率は幾らか。次の①~⑤を選べ。

①2.3% ②16% ③32% ④46% ⑤54%

 

〇回答

※回答の右を反転してください。

〇内容

\begin{eqnarray} P \geqq 25 \end{eqnarray}

\begin{eqnarray} =P  (  Z \geqq \frac{ 25 - 20 }{ 5 } ) \end{eqnarray}

\begin{eqnarray} =P  (  Z \geqq 1 ) \end{eqnarray}

標準正規分布表を参照して1.00を見つける。

値1.00の面積は0.1587。

\begin{eqnarray} =P  (  Z \geqq 1 ) = 0.1587 \fallingdotseq  0.16 \end{eqnarray}

\begin{eqnarray} \therefore 16 パーセント\end{eqnarray}

 

〇詳細

「 1日平均量Xは独立に正規分布に従い」と書いてあるから、正規分布に従うのかーと。正規分布とググっちゃえば、大体釣鐘型の図が出てくるはず。

その平均は20μg/㎥、標準偏差は5μg/㎥であると仮定する。」と書いている。

これを表す記号は

\begin{eqnarray} x:N(\mu、σ^2)  \end{eqnarray}

と記す。んーまぁこんなのが出てきたら正規分布じゃね?って思えばいいかな。

今回のばーいは、上記をあてはめると

\begin{eqnarray} x:N(20、5)  \end{eqnarray}

\begin{eqnarray} 5^2  \end{eqnarray}

じゃないのって思うかもだけれど、標準偏差って書かれているか、分散って書かれているかが分岐点。今回は標準偏差って書かれているので

\begin{eqnarray} x:N(20、5)  \end{eqnarray}

で、 この平均μと標準偏差σを標準化すると、平均0、標準偏差1の正規分布に変わる。その公式が

\begin{eqnarray} \frac{ X - \mu }{ σ } = Z \end{eqnarray}

 で、それを当てはめると、

\begin{eqnarray} =P  (  Z \geqq \frac{ 25 - 20 }{ 5 } ) \end{eqnarray}

あ。越える確率だから≧。

で、計算すると

 

\begin{eqnarray} =P  (  Z \geqq \frac{ 25 - 20 }{ 5 } ) \end{eqnarray}

\begin{eqnarray} =P  (  Z \geqq 1 ) \end{eqnarray}

後は標準正規分布表とにらめっこして1.00なんだけれど、

釣鐘型の右側の1以上って事を念頭に入れて正規分布表を見ること。

今回の場合は0.1587と表示されている。

 

sasで計算してみるとこう。

data work1001;
p=cdf('normal',25,20,5);  /*正規分布の累積分布関数->CDF*/
z=1-p; /*問では超える確率としているので、正規分布の右側の面積の数値を求める*/
run;

proc print data=work1001;
run;

 

OBSpz
1 0.84134 0.15866

 

z=0.15866≒0.16=16%

mathjax

統計の式を書くのに良いのないかなーって思って、

mathjaxってのがあった。

はてぶではtexのがあるから、まぁ入れなくても良かったんだけれど。

ただ

\frac{ 1 }{ 2 }

ってやっても思い通りにならなくて、あ?って感じだったんだけれど、

\begin{eqnarray} ¥frac{ 1 }{ 2 } ¥end{eqnarray}

※¥→半角¥で。

っとすると

\begin{eqnarray} \frac{ 1 }{ 2 } \end{eqnarray}

イメージ通り。ただ、HTMLで左寄せしても、これが出来なかったけれど恐らくこれは多分出来る。でも読めれば良い感じで作ってるので。

これで少しは読みやすくなったかな♪

 

20150621 統計検定2級8問目[3]

100円玉5枚、10円玉7枚、1円玉3枚の入った小銭入れから、同時にに3枚の硬貨を取り出す。いずれかの硬貨を取り出すのも同様に確からしいとする。

[3]取り出した3枚の金額の合計が150円以上であるという条件のもとで、その3枚の中に1円玉が含まれる条件付き確率は幾らか?次の①~⑤から選べ。

①1/3 ②3/11 ③8/11 ④6/91 ⑤8/91

 

〇回答: 

   ※回答の右を反転してください。

〇内容

\begin{eqnarray} \frac{\frac{ {}_5 \mathrm{ C }_2 \times {}_3 \mathrm{ C }_1 }{ {}_1{}_5 \mathrm{ C }_3 } }{ \frac{ {}_5 \mathrm{ C }_3 + {}_5 \mathrm{ C }_2\times {}_7 \mathrm{ C }_1 + {}_5 \mathrm{ C }_2\times {}_3 \mathrm{ C }_1 }{ {}_1{}_5 \mathrm{ C }_3 } } = \frac{ 3 }{ 11 }\end{eqnarray}

〇詳細

8問目[3]は部分の中から部分。

A:取り出した3枚の金額の合計が150円以上であるという条件のもと

っていう問題文があるから、2番目の答えが関係してくるんだなーと。

B:その3枚の中に1円玉が含まれる条件付き確率は幾らか?

\begin{eqnarray} { 100円5枚中2枚取り出す組み合わせ ⇒ {}_5 \mathrm{ C }_2 } \end{eqnarray}

\begin{eqnarray} { 1円3枚中1枚取り出す組み合わせ ⇒ {}_3 \mathrm{ C }_1 } \end{eqnarray}

\begin{eqnarray} { 15枚中3枚取り出す組み合わせ ⇒ {}_1{}_5 \mathrm{ C }_3 } \end{eqnarray}

 

Aっていう条件があってその中からBを取り出せる確率を出してよ!って感じ。

なので 

\begin{eqnarray} \frac{B}{A} = \frac{\frac{ {}_5 \mathrm{ C }_2 \times {}_3 \mathrm{ C }_1 }{ {}_1{}_5 \mathrm{ C }_3 } }{ \frac{ {}_5 \mathrm{ C }_3 + {}_5 \mathrm{ C }_2\times {}_7 \mathrm{ C }_1 + {}_5 \mathrm{ C }_2\times {}_3 \mathrm{ C }_1 }{ {}_1{}_5 \mathrm{ C }_3 } } = \frac{ 3 }{ 11 }\end{eqnarray}

 

 

これを小難しく言うと条件付き確率公式。

\begin{eqnarray} P {}_A(B) = \frac{ {}_n(A \cap B) }{ {}_n(A) } = \frac{ P(A \cap B) }{ P(A) } \end{eqnarray}

事象Aが起こった時、事象Bが起こる条件付き確率。

  

\begin{eqnarray} 150円以上の中で1円玉が含まれている確率→ P(A \cap B) \end{eqnarray}

\begin{eqnarray} コイン15枚の中から3枚取り出して150円以上[2の回答より]→ P(A)\end{eqnarray}  

つまり、こういう計算になる。

\begin{eqnarray} \frac{\frac{ {}_5 \mathrm{ C }_2 \times {}_3 \mathrm{ C }_1 }{ {}_1{}_5 \mathrm{ C }_3 } }{ \frac{ {}_5 \mathrm{ C }_3 + {}_5 \mathrm{ C }_2\times {}_7 \mathrm{ C }_1 + {}_5 \mathrm{ C }_2\times {}_3 \mathrm{ C }_1 }{ {}_1{}_5 \mathrm{ C }_3 } } = \frac{ 3 }{ 11 }\end{eqnarray}