Ch.1 Stata
C1
(i)
WAGE1.DTA
summarize educ Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- educ | 526 12.56274 2.769022 0 18
平均的な学歴は,12.56年.最低は0年,最高は18年.
(ii)
sum wage Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- wage | 526 5.896103 3.693086 .53 24.98
時間当たり賃金の平均は,5.90ドル.低く見える.
(iii)
(iv)
(v)
tabulate female =1 if | female | Freq. Percent Cum. ------------+----------------------------------- 0 | 274 52.09 52.09 1 | 252 47.91 100.00 ------------+----------------------------------- Total | 526 100.00
女性は,47.91%で,男性が,52.09%を占めている.
C2
(i)
tab cigs cigs smked | per day | while preg | Freq. Percent Cum. ------------+----------------------------------- 0 | 1,176 84.73 84.73 1 | 3 0.22 84.94 2 | 4 0.29 85.23 3 | 7 0.50 85.73 4 | 9 0.65 86.38 5 | 19 1.37 87.75 6 | 6 0.43 88.18 7 | 4 0.29 88.47 8 | 5 0.36 88.83 9 | 1 0.07 88.90 10 | 55 3.96 92.87 12 | 5 0.36 93.23 15 | 19 1.37 94.60 20 | 62 4.47 99.06 30 | 5 0.36 99.42 40 | 6 0.43 99.86 46 | 1 0.07 99.93 50 | 1 0.07 100.00 ------------+----------------------------------- Total | 1,388 100.00
女性は,1,388人いて,たばこを吸っていた人は212人.
(ii)
summarize cigs, detail cigs smked per day while preg ------------------------------------------------------------- Percentiles Smallest 1% 0 0 5% 0 0 10% 0 0 Obs 1388 25% 0 0 Sum of Wgt. 1388 50% 0 Mean 2.087176 Largest Std. Dev. 5.972688 75% 0 40 90% 10 40 Variance 35.673 95% 20 46 Skewness 3.560448 99% 20 50 Kurtosis 17.93397
平均的には,2.09本,たばこが吸われている.0本の人が非常に多い(これは歪度を見てもわかる)ので,平均は全体を代表するに適切な値ではない.中央値は,0である.
(iii)
summarize cigs if cigs!=0, detail cigs smked per day while preg ------------------------------------------------------------- Percentiles Smallest 1% 1 1 5% 3 1 10% 4 1 Obs 212 25% 8 2 Sum of Wgt. 212 50% 10 Mean 13.66509 Largest Std. Dev. 8.690907 75% 20 40 90% 20 40 Variance 75.53186 95% 30 46 Skewness 1.30199 99% 40 50 Kurtosis 5.55017
妊娠中にたばこを吸っている女性のなかでの,たばこの本数の平均値は13.67であるが,まだ代表する値としても上に引っ張られているので,適切ではない.ヒストグラムを書くと分かるが,山が二つある.
(iv)
summarize fatheduc, detail father's yrs of educ ------------------------------------------------------------- Percentiles Smallest 1% 5 1 5% 9 2 10% 10 2 Obs 1192 25% 12 3 Sum of Wgt. 1192 50% 12 Mean 13.18624 Largest Std. Dev. 2.745985 75% 16 18 90% 17 18 Variance 7.540432 95% 18 18 Skewness -.3903149 99% 18 18 Kurtosis 4.091254
父学歴の平均年数は,13.19年.1192しか観測されていないのは,欠損値があるため.
(v)
summarize faminc, detail 1988 family income, $1000s ------------------------------------------------------------- Percentiles Smallest 1% .5 .5 5% 3.5 .5 10% 6.5 .5 Obs 1388 25% 14.5 .5 Sum of Wgt. 1388 50% 27.5 Mean 29.02666 Largest Std. Dev. 18.73928 75% 37.5 65 90% 65 65 Variance 351.1608 95% 65 65 Skewness .6176205 99% 65 65 Kurtosis 2.473396
平均世帯年収は,2902.67$であり,標準偏差は,1873.93$である.
C3
(i)
summarize math4, detail % students satisfactory, 4th grade math ------------------------------------------------------------- Percentiles Smallest 1% 14.4 0 5% 30.8 3.6 10% 42.2 5.4 Obs 1823 25% 61.5 6.3 Sum of Wgt. 1823 50% 76.4 Mean 71.909 Largest Std. Dev. 19.95409 75% 87 100 90% 93.4 100 Variance 398.1658 95% 96.5 100 Skewness -.9758285 99% 100 100 Kurtosis 3.500104
最大値は,100,最小値は0である.
(ii)
tabu math4
(結果省略)
100%の学校は,38校,2.38%である.
(iii)
tabulate math4 if math4==50 % students | satisfactor | y, 4th | grade math | Freq. Percent Cum. ------------+----------------------------------- 50 | 17 100.00 100.00 ------------+----------------------------------- Total | 17 100.00
(iv)
summarize math4 read4, detail % students satisfactory, 4th grade math ------------------------------------------------------------- Percentiles Smallest 1% 14.4 0 5% 30.8 3.6 10% 42.2 5.4 Obs 1823 25% 61.5 6.3 Sum of Wgt. 1823 50% 76.4 Mean 71.909 Largest Std. Dev. 19.95409 75% 87 100 90% 93.4 100 Variance 398.1658 95% 96.5 100 Skewness -.9758285 99% 100 100 Kurtosis 3.500104 % students satisfactory, 4th grade reading ------------------------------------------------------------- Percentiles Smallest 1% 10 0 5% 21.5 3.4 10% 31.9 4.8 Obs 1823 25% 48.9 5.4 Sum of Wgt. 1823 50% 62.7 Mean 60.06188 Largest Std. Dev. 19.14729 75% 73.9 100 90% 81.8 100 Variance 366.6188 95% 87 100 Skewness -.6369112 99% 93.8 100 Kurtosis 2.985669
数学は79.91であり,読解は60.06であるので,読解の方が難しい.
(v)
cor math4 read4 (obs=1823) | math4 read4 -------------+------------------ math4 | 1.0000 read4 | 0.8427 1.0000
読解と数学には正の強い相関,.848があり,いずれかで高い点数を取っている学校は,もう片方の点数も高い.
(vi)
summarize exppp Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- exppp | 1823 5194.865 1091.89 1206.882 11957.64
平均は5194.87であり,標準偏差は1091.9である.最小値と最大値を比べると,10倍弱の開きがあるので,
分散が大きいといってよいのではないか.
(vii)
C4
(i)
tabulate train =1 if | assigned to | job | training | Freq. Percent Cum. ------------+----------------------------------- 0 | 260 58.43 58.43 1 | 185 41.57 100.00 ------------+----------------------------------- Total | 445 100.00
職業訓練を受けているのは,41.57%である.
(ii)
by train, sort: sum re78 ------------------------------------------------------------------------------------------------------------ -> train = 0 Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- re78 | 260 4.554802 5.483837 0 39.4835 ------------------------------------------------------------------------------------------------------------- -> train = 1 Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- re78 | 185 6.349145 7.867405 0 60.3079
職業訓練を受けた人の収入は6349.15$であり,受けていない人の収入は,4554.8$である.受けた人の年収の方が高い.
(iii)
by unem78, sort: tab train --------------------------------------------------- -> unem78 = 0 =1 if | assigned to | job | training | Freq. Percent Cum. ------------+----------------------------------- 0 | 168 54.55 54.55 1 | 140 45.45 100.00 ------------+----------------------------------- Total | 308 100.00 ---------------------------------------------------- -> unem78 = 1 =1 if | assigned to | job | training | Freq. Percent Cum. ------------+----------------------------------- 0 | 92 67.15 67.15 1 | 45 32.85 100.00 ------------+----------------------------------- Total | 137 100.00
就業している人のなかで,職業訓練を受けたのは,45.45%であり,就業していない人のなかで,職業訓練を受けたのは,32.85%である.つまり,就業していない人よりも,就業している人の方が,職業訓練を受けている.
(iv)
職業訓練はあまり効果的でないと思われる.ただし職業訓練がいつ行われたかがわかるとより推論しやすい.
C5
(i)
sum children Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- children | 4361 2.267828 2.222032 0 13
生存している子どもの数の最小値は,0で,最大値は13,平均値は2.27である.
(ii)
tab electric =1 if has | electricity | Freq. Percent Cum. ------------+----------------------------------- 0 | 3,747 85.98 85.98 1 | 611 14.02 100.00 ------------+----------------------------------- Total | 4,358 100.00
家に電気が通っている女性は,14.02%である.3の欠損値あり.
(iii)
by electric, sort: sum children ------------------- -> electric = 0 Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- children | 3747 2.327729 2.277443 0 13 -------------------- -> electric = 1 Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- children | 611 1.898527 1.803325 0 9 -------------------- -> electric = . Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- children | 3 2.666667 2.886751 1 6
家に電気が通っていない人の方が,平均的に多くの生きている子どもを持つ.
基本的に近代化すると,子どもの数が減る傾向にあるので,その傾向を表しているのではないか.
家に電気が通っている人たちはより西欧型のライフスタイルを選択しがちであり,それは子どもが少ないライフスタイルである.
(iv)
上で説明した.共通原因があり,それらが,家に電気を持つことと,子どもを少なく生むということを生じさせている.