kino's blog

ホームページ公開後の悪戦苦闘等々他2本

「PAN」を見ました!ついでに日本の映画関係者は残念すぎる件。

妖精王PANの爆誕物語

映画に胸を躍らせたのはいつ位だろう?

この物語は一般人ピーターが妖精王「ピーターパン」になるための爆誕物語。
これは映画館で見るべき映画なのだと思います。

 

f:id:kino2014:20151101143500j:plain

 

知識を入れなければもっと面白い

ボクはこの映画に関して全く知識を入れずに見に行ったのだけれど、
この映画に関してはその方が正解。
元々の物語を知っているからこその、

どうなってそうなっていくのかなって想像力をかきたたせる事が出来るから。
なので、パンフレットもホームページも見ないほうが良い。
けれど、今の時代それは難しいのかなっても思うけれど(苦笑。
この作品に関する感想は面白かったの一言に尽きます。
また、ピーター役のリーヴァイミラー、超かっこいいです!!

 

共感性のマーケティング

さて、ピーターパンって作品は皆が知っている作品が故に映像化は出来ても、ありのままのではなく新編を作るのは凄く難しいと思う。そこには共感性を持たせなくてはならない。その共感性のマーケティングが出来てるからいい作品が生まれる。

例えば、「アナと雪の女王」だと愛する人とキスをしないと心が凍ってしまうと訴えるアナに偽王子がキスをしそうになるシーン。
元々のシナリオは王子はキスをするのだが、何も起こらない。王子は愛していなかったって事がわかってしまう。そういうシーンだったそうだが、女性陣に聞くと「違う違う、そうじゃそうじゃない」といったかどうかは知らないが「酷い男はキスをせずに後ずさりするものだと」それを採用。実際の反応は若い女性は「彼はパーフェクトだったのに!」と、年配の女性は「完璧な男なんてそんなものよ」っていう反応。つまり共感を得ることに成功している。

www.youtube.com

 

そう考えると日本の作品、監督さんは自分の。ってのかな。例えばるろうに剣心だと「志々雄真実コスプレ軍団」あれを出された時、「また俺の作品かよ」って思ってしまう。志々雄真実の性格から真っ先にぶった切りそうだけれど。

その作品を作る時、自分の考えを取り入れる場合は皆の共感性がなければ駄作が産まれるばかりだと思うんだよなー。その点でおかしくありませんか?ってマーケティングは必要だと思うんだけれど。俺の作品すげーだろっての、ねぇ…。
元々の作品を作る場合は嬉しい裏切りと、昂揚感が欲しいなって思う限りです
日本の関係者は第三者の意見をもっと聞くべきかなーと思うのです。

 

4DXについて

ボクはこの作品を4DXで見たんだけれど、まず、高い。
映画、1800円。
3D、400円。
4dX、1000円。
計、3200円。
どこのUSJだよって思ってしまう。

それでも、狂ったマッサージ機のように荒ぶる椅子。
水たまりのシーンでかかる水しぶき。
暗いシーンから光のシーンに移動するときに徐々に明るくなる映画館。
クライマックスで吹き出すシャボン玉。
さまざまな仕掛けが体感出来ます。
個人的には椅子が熱くなったりとか、どうせなら映画館ごと動かしてくんないかなって、そしたら海賊船も更に海賊船できるんじゃね?と。1000円も取るならそれ位アイディア出そうよ。
後、字幕変更が出来る眼鏡とかそろそろ出来ないかなって思うんだけれど。

 

しまいに。

最後に、映画の予告「母を訪ねて辿り着いたのは」って。
連れ去られたんだよ、ド阿呆ぅ。

www.youtube.com

 

 

20150621 統計検定2級 問15[4]

次の表は、あるチェーン店の各店舗のデータを示したものである(表は省略します)。

このデータに対して、「売上高」を応答変数、ほかの変数を説明変数として、重回帰分析を行い、既存店における売上高を予測する式を求めることにした。統計ソフトウェアで分析したところ、次のような結果を得た(下記の図はSASで取得しています)。

REG プロシジャ

モデル : MODEL1

従属変数 : sales

読み込んだオブザベーション数 15
使用されたオブザベーション数 15
分散分析
要因自由度平方和平均平方F 値Pr > F
Model 5 60800 12160 73.76 <.0001
Error 9 1483.64790 164.84977    
Corrected Total 14 62284      
Root MSE 12.83938 R2 乗 0.9762
従属変数の平均 110.40000 調整済み R2 乗 0.9629
変動係数 11.62988    
パラメータ推定値
変数自由度パラメータ
推定値
標準誤差t 値Pr > |t|分散拡大
Intercept1 1.97049 32.22866 0.06 0.9526 0
pessers1 0.04927 0.01603 3.07 0.0133 8.89496
time1 -2.23524 0.86492 -2.58 0.0295 6.37019
area1 0.06360 0.40125 0.16 0.8776 8.81825
staff1 3.95895 2.66864 1.48 0.1721 4.61962
item1 0.47966 0.15941 3.01 0.0147 1.28793

 

[4]この重回帰式を用いて、次の3店舗の売上高を予測する。


②「通行者数」「最寄駅からの時間」「品目数」のみ①「通行者数」「店舗面積」「従業員数」「品目数」のみ

  A
 
B
 
C
 
D
 
E
 
F
 
1
店舗
通行者数
最寄駅からの時間
店舗面積
従業員数
品目数
2
A
1500
5
50
10
100
3
B
700
20
50
10
100
4
C
1200
4
50
10
100

このとき、各店舗の予測売上高を高い順に示しているものはどれか?

①A>B>C

A>C>B

③B>C>A

④C>A>B

⑤C>B>A

 

〇回答

〇内容

問15[3]でも少し出てきたけれど」重回帰式を使う。

\begin{eqnarray}Y=a+b_1x_1+b_2x_2…b_nx_n \end{eqnarray}

Y=答え

a=intercept(切片)

b=パラメータ

x=変数

155.085=1.970+0.049+1500-2.235×5+0.064×50+3.959×10+0.48×100

82.36=1.970+0.049+700-2.235×20+0.064×50+3.959×10+0.48×100

142.62=1.970+1.970+0.049+1200-2.235×4×50+3.959×10+0.48×100

∴155.085>142.62>82.36となり、A>C>B。つまり、②が正解となる。

20150621 統計検定2級 問15[3]

次の表は、あるチェーン店の各店舗のデータを示したものである(表は省略します)。

このデータに対して、「売上高」を応答変数、ほかの変数を説明変数として、重回帰分析を行い、既存店における売上高を予測する式を求めることにした。統計ソフトウェアで分析したところ、次のような結果を得た(下記の図はSASで取得しています)。

REG プロシジャ

モデル : MODEL1

従属変数 : sales

読み込んだオブザベーション数 15
使用されたオブザベーション数 15
分散分析
要因自由度平方和平均平方F 値Pr > F
Model 5 60800 12160 73.76 <.0001
Error 9 1483.64790 164.84977    
Corrected Total 14 62284      
Root MSE 12.83938 R2 乗 0.9762
従属変数の平均 110.40000 調整済み R2 乗 0.9629
変動係数 11.62988    
パラメータ推定値
変数自由度パラメータ
推定値
標準誤差t 値Pr > |t|分散拡大
Intercept1 1.97049 32.22866 0.06 0.9526 0
pessers1 0.04927 0.01603 3.07 0.0133 8.89496
time1 -2.23524 0.86492 -2.58 0.0295 6.37019
area1 0.06360 0.40125 0.16 0.8776 8.81825
staff1 3.95895 2.66864 1.48 0.1721 4.61962
item1 0.47966 0.15941 3.01 0.0147 1.28793

 

[3]次の記述Ⅰ~Ⅲは重回帰分析の結果を解釈したものである。

Ⅰ:決定係数や自由度調整済み決定係数の値が1に近いので、これらの説明変数で「売上高」をかなり説明できていることがわかる。

Ⅱ:偏回帰係数の絶対値が一番大きいのは「従業員数」である。このことは、目的変数である「売上高」との相関係数が一番大きい説明変数は「従業員数」であることを意味している。

Ⅲ:有意でない変数がふくまれているので、5つの説明変数のうちいくつかを覗いて重回帰分析を再度行うと、決定係数が上昇する可能性がある。

 

①Ⅰのみ正しい。

②ⅠとⅡのみ正しい。

③ⅠとⅢのみ正しい。

④すべて正しい。

⑤すでて正しくない。

 

〇回答

〇内容

 Ⅰ:〇:正しい

 Ⅱ:X:通行者数が一番多い

 Ⅲ:X:上昇しない

〇詳細

Ⅰ:決定係数(寄与率ともいう)が1に近いという事は、あてはまってると言える(決定係数、あてはまりでググると詳しく出てくるかと)。正解。

Ⅱ:実際に計算してみる。下の相関係数図にて通行者数が多い。

では偏回帰係数って何?と。それは。

\begin{eqnarray}Y=a+b_1x_1+b_2x_2…b_nx_n \end{eqnarray}

\begin{eqnarray}の b_1,b_2,b_n にあたる。\end{eqnarray}

絶対値が大きいのはあっているが、相関係数が高いわけではない。

よってX。

 

Pearson の相関係数, N = 15
H0: Rho=0 に対する Prob > |r|
 pesserstimeareastaffitemsales
pessers
1.00000
 
-0.89512
<.0001
0.90099
<.0001
0.79054
0.0005
0.19636
0.4831
0.95786
<.0001
time
-0.89512
<.0001
1.00000
 
-0.82663
0.0001
-0.81011
0.0003
-0.04997
0.8596
-0.91930
<.0001
area
0.90099
<.0001
-0.82663
0.0001
1.00000
 
0.85888
<.0001
0.28900
0.2962
0.91808
<.0001
staff
0.79054
0.0005
-0.81011
0.0003
0.85888
<.0001
1.00000
 
0.11221
0.6905
0.84914
<.0001
item
0.19636
0.4831
-0.04997
0.8596
0.28900
0.2962
0.11221
0.6905
1.00000
 
0.31044
0.2601
sales
0.95786
<.0001
-0.91930
<.0001
0.91808
<.0001
0.84914
<.0001
0.31044
0.2601
1.00000
 

 

Ⅲ: 実際に、説明変数から通行者数、最寄駅からの時間、品目数をピックアップして、計算してみる。

問題文のR2乗が0.9762。実際に計算したのが、0.9496。

0.9762>0.9496

と上記のようになる。よってX。

と、言いたいところだけれど、実際にテスト中に計算してらんない。

そこで、この問題が出ることが今後恐らくないと思えるが、

決定係数は説明変数が増えると、増加するという性質がある。今回は、説明変数を減らしているから減少している。これを片隅に置いておけばいいと思う。

 

読み込んだオブザベーション数 15
使用されたオブザベーション数 15
分散分析
要因自由度平方和平均平方F 値Pr > F
Model 3 59142 19714 69.03 <.0001
Error 11 3141.35595 285.57781    
Corrected Total 14 62284      
Root MSE 16.89905 R2 乗 0.9496
従属変数の平均 110.40000 調整済み R2 乗 0.9358
変動係数 15.30711    

20150621 統計検定2級 問15[2]

次の表は、あるチェーン店の各店舗のデータを示したものである(表は省略します)。

このデータに対して、「売上高」を応答変数、ほかの変数を説明変数として、重回帰分析を行い、既存店における売上高を予測する式を求めることにした。統計ソフトウェアで分析したところ、次のような結果を得た(下記の図はSASで取得しています)。

REG プロシジャ

モデル : MODEL1

従属変数 : sales

読み込んだオブザベーション数 15
使用されたオブザベーション数 15
分散分析
要因自由度平方和平均平方F 値Pr > F
Model 5 60800 12160 73.76 <.0001
Error 9 1483.64790 164.84977    
Corrected Total 14 62284      
Root MSE 12.83938 R2 乗 0.9762
従属変数の平均 110.40000 調整済み R2 乗 0.9629
変動係数 11.62988    
パラメータ推定値
変数自由度パラメータ
推定値
標準誤差t 値Pr > |t|分散拡大
Intercept1 1.97049 32.22866 0.06 0.9526 0
pessers1 0.04927 0.01603 3.07 0.0133 8.89496
time1 -2.23524 0.86492 -2.58 0.0295 6.37019
area1 0.06360 0.40125 0.16 0.8776 8.81825
staff1 3.95895 2.66864 1.48 0.1721 4.61962
item1 0.47966 0.15941 3.01 0.0147 1.28793

 

[2]有意水準を5%としたとき、統計的に有意な説明変数はどれ?

①[通行者数][店舗面積][従業員数][品目数]のみ

②[通行者数][最寄駅からの時間][品目数]のみ

③[通行者数][店舗面積][従業員数]のみ

④[通行者数][最寄駅からの時間]のみ

⑤[店舗面積][従業員数]のみ

 

〇回答

〇内容

Pr>|t|が5%以下を選択する。

20150621 統計検定2級 問15[1]

次の表は、あるチェーン店の各店舗のデータを示したものである(表は省略します)。

このデータに対して、「売上高」を応答変数、ほかの変数を説明変数として、重回帰分析を行い、既存店における売上高を予測する式を求めることにした。統計ソフトウェアで分析したところ、次のような結果を得た(っと本当はこの表じゃないけれどSASで入力するとこんな感じ)

REG プロシジャ

モデル : MODEL1

従属変数 : sales

読み込んだオブザベーション数 15
使用されたオブザベーション数 15
分散分析
要因自由度平方和平均平方F 値Pr > F
Model 5 60800 12160 73.76 <.0001
Error 9 1483.64790 164.84977    
Corrected Total 14 62284      
Root MSE 12.83938 R2 乗 0.9762
従属変数の平均 110.40000 調整済み R2 乗 0.9629
変動係数 11.62988    
パラメータ推定値
変数自由度パラメータ
推定値
標準誤差t 値Pr > |t|分散拡大
Intercept1 1.97049 32.22866 0.06 0.9526 0
pessers1 0.04927 0.01603 3.07 0.0133 8.89496
time1 -2.23524 0.86492 -2.58 0.0295 6.37019
area1 0.06360 0.40125 0.16 0.8776 8.81825
staff1 3.95895 2.66864 1.48 0.1721 4.61962
item1 0.47966 0.15941 3.01 0.0147 1.28793

 

 [1]最寄駅からの時間が長く、「従業員数」が多い店舗は「売上高」にどのような傾向があるか。次の①~⑤からー。

①「最寄駅からの時間」が長いほど「売上高」は多く、「従業員数」が多いほど「売上高」は多い。

②「最寄駅からの時間」が長いほど「売上高」は少なく、「従業員数」が多いほど「売上高」は多い。

③「最寄駅からの時間」が長いほど「売上高」は多く、「従業員数」が多いほど「売上高」は少ない。

④「最寄駅からの時間」が長いほど「売上高」は少なく、「従業員数」が多いほど「売上高」は少ない。

⑤「最寄駅からの時間」が長い、もしくは「従業員数」が多くても「売上高」は変わらない。

 

〇回答

〇内容

係数を見れば

・「最寄駅からの時間」が長いほど「売上高」は少ない

⇒ー2.235

・「従業員数」が多いほど「売上高」は多い。

⇒3.959

以上。

20150621 統計検定2級 問12

Aさんは日常生活の風景をデジカメで写真におさめ、PCに保存するという趣味を持っている。Aさんが先週1週間に撮影した写真31枚について、それらのファイルサイズ(単位はメガバイト)の標本平均及び不偏分散を計算したところ、次。

 

標本平均=3.24

不偏分散=0.04

 

1枚の写真のファイルサイズは独立に平均μ、未知の分散α2乗の正規分布に従うと改訂して、母平均μの95%信頼区間を求める式はどれか?

 

\begin{eqnarray}①[3.24 ー 1.697\sqrt{  \frac{ 0.04}{ 30 } } 、3.24 + 1.697\sqrt{  \frac{ 0.04}{ 30 } } ] \end{eqnarray}

\begin{eqnarray}②[3.24 ー 1.96\sqrt{  \frac{ 0.04}{ 31 } } 、3.24 + 1.96\sqrt{  \frac{ 0.04}{ 31 } } ] \end{eqnarray}

\begin{eqnarray}③[3.24 ー 1.96\sqrt{  \frac{ 0.04}{ 30 } } 、3.24 + 1.697\sqrt{  \frac{ 0.04}{ 30 } } ] \end{eqnarray}

\begin{eqnarray}④[3.24 ー 2.042\sqrt{  \frac{ 0.04}{ 31 } } 、3.24 + 2.042\sqrt{  \frac{ 0.04}{ 31 } } ] \end{eqnarray}

\begin{eqnarray}⑤[3.24 ー 2.042\sqrt{  \frac{ 0.04^2}{ 30 } } 、3.24 + 1.697\sqrt{  \frac{ 0.04^2}{ 30 } } ] \end{eqnarray}

  

○回答

○内容

\begin{eqnarray}31-1=30 \end{eqnarray}

\begin{eqnarray}t_{0.05}=2.042 \end{eqnarray} 

\begin{eqnarray}④[3.24 ー 2.042\sqrt{  \frac{ 0.04}{ 31 } } 、3.24 + 2.042\sqrt{  \frac{ 0.04}{ 31 } } ] \end{eqnarray}

 

○詳細

Aさんがどれだけ写真を撮ろうが、別に構わないんだけれど、

どっちみち新しくHD買えば?って落ちに落ち着く話。

なんだけれど、まぁ計算したいからさー、とかなんとか。

 

A:今週31枚撮ってさー、あ、統計やってたっけ?丁度いいや。ファイルサイズなんだけれどさー1週間位で3.24mb位なんだよ。で、不偏分散が0.04mbでー…。

B:(不偏分散までやってるなら…どのみちHD買えばいい話だし…)

なーんて会話があったのであろう。なので、恐らくルイ君なら山本さんの為に…あ、あれは本の話だ。さて。

 

って事で。

\begin{eqnarray}・n=31枚 \end{eqnarray}

\begin{eqnarray}・\bar{ X } = 3.24MB \end{eqnarray}

\begin{eqnarray}・s^2=0.04MB \end{eqnarray}

\begin{eqnarray}・σ^2 = 未知 \end{eqnarray}

以上の条件から母平均μの推定を行う場合、T値を求めることになる。

 

条件分岐として。

母平均μの推定

↓⇒⇒⇒母標準偏差σが既知

  ↓⇒母標準偏差σが未知

   ↓⇒小標本(m ≦ 30) 〇

   ↓⇒大標本(m >30)

 

っと、標準偏差って言葉が出てきて、分散じゃなかったっけって話だけれど、

分散を平方根を使って答えを出すと、標準偏差になる。

 

今回は母標準偏差σが未知で小標本にあたる。

T値を求める時、自由度を求めることになる。

自由度は検索検索ー。

で、本問題の自由度は

\begin{eqnarray}n-1=m \end{eqnarray}

\begin{eqnarray}31-1=30 \end{eqnarray}

T値を求めるのでT分布表から30の両側有意水準0.05を見つける。

\begin{eqnarray}t_{0.05}=2.042 \end{eqnarray} 

T値公式は下記。

\begin{eqnarray}\bar{X} + t\sqrt{  \frac{ s^2}{ n } } …上方信頼限界 \end{eqnarray}

\begin{eqnarray}\bar{X} ー t\sqrt{  \frac{ s^2}{ n } } …下方信頼限界  \end{eqnarray} 

∴下記の数値を当てはめて。

\begin{eqnarray}・n=31枚 \end{eqnarray}

\begin{eqnarray}・\bar{ X } = 3.24MB \end{eqnarray}

\begin{eqnarray}・s^2=0.04MB \end{eqnarray}

\begin{eqnarray}・t_{0.05}=2.042 \end{eqnarray} 

\begin{eqnarray}3.24 ー 2.042\sqrt{  \frac{ 0.04}{ 31 } } 、3.24 + 2.042\sqrt{  \frac{ 0.04}{ 31 } } \end{eqnarray}

 

 因みに。

\begin{eqnarray}3.1666 \leqq \mu \leqq 3.3134 \end{eqnarray}

が容量の母平均となる。

 

後書き。

ボクのブログでは不偏分散をs2と記載しているけれど、実はこれさまざまでuとか、vとか、σとか各本及びWebであらぶっています。なので、記号で覚えると扱うソフト等で、a-han?ってなる事があるかな。記号じゃなくてこれをやっているからこうなるんだーってのを覚えたほうが良いです。統計はやっていて思うけれど、正確さじゃなく曖昧だけど、これ位じゃないかなーって感じです。

 

更に蛇足だけれど、恐らく500万画素で撮っているんじゃないかなーとAさん。1枚約2.6MBだし。掛け出しなの?ってね。無粋だけれど。

 

20150621 統計検定2級 問11 例外:SAS繰り返し記法

問11の二項分布計算にて。
d0=comb(n,0)*p**0*(1-p)**(n-0); /*0日の確率*/
d1=comb(n,1)*p**1*(1-p)**(n-1); /*1日の確率*/
d2=comb(n,2)*p**2*(1-p)**(n-2); /*2日の確率*/

d36=comb(n,36)*p**36*(1-p)**(n-36); /*36日の確率*/
と計算していたけれど。

こんな風にも書けます。

Q11e02