Ch.1 Stata

C1
(i)
WAGE1.DTA

 summarize educ

    Variable |       Obs        Mean    Std. Dev.       Min        Max
-------------+--------------------------------------------------------
        educ |       526    12.56274    2.769022          0         18

平均的な学歴は,12.56年.最低は0年,最高は18年.

(ii)

 sum wage

    Variable |       Obs        Mean    Std. Dev.       Min        Max
-------------+--------------------------------------------------------
        wage |       526    5.896103    3.693086        .53      24.98

時間当たり賃金の平均は,5.90ドル.低く見える.

(iii)


(iv)

(v)

tabulate female

      =1 if |
     female |      Freq.     Percent        Cum.
------------+-----------------------------------
          0 |        274       52.09       52.09
          1 |        252       47.91      100.00
------------+-----------------------------------
      Total |        526      100.00

女性は,47.91%で,男性が,52.09%を占めている.

C2
(i)

  tab cigs

 cigs smked |
    per day |
 while preg |      Freq.     Percent        Cum.
------------+-----------------------------------
          0 |      1,176       84.73       84.73
          1 |          3        0.22       84.94
          2 |          4        0.29       85.23
          3 |          7        0.50       85.73
          4 |          9        0.65       86.38
          5 |         19        1.37       87.75
          6 |          6        0.43       88.18
          7 |          4        0.29       88.47
          8 |          5        0.36       88.83
          9 |          1        0.07       88.90
         10 |         55        3.96       92.87
         12 |          5        0.36       93.23
         15 |         19        1.37       94.60
         20 |         62        4.47       99.06
         30 |          5        0.36       99.42
         40 |          6        0.43       99.86
         46 |          1        0.07       99.93
         50 |          1        0.07      100.00
------------+-----------------------------------
      Total |      1,388      100.00

女性は,1,388人いて,たばこを吸っていた人は212人.

(ii)

 summarize cigs, detail

                cigs smked per day while preg
-------------------------------------------------------------
      Percentiles      Smallest
 1%            0              0
 5%            0              0
10%            0              0       Obs                1388
25%            0              0       Sum of Wgt.        1388

50%            0                      Mean           2.087176
                        Largest       Std. Dev.      5.972688
75%            0             40
90%           10             40       Variance         35.673
95%           20             46       Skewness       3.560448
99%           20             50       Kurtosis       17.93397

平均的には,2.09本,たばこが吸われている.0本の人が非常に多い(これは歪度を見てもわかる)ので,平均は全体を代表するに適切な値ではない.中央値は,0である.

(iii)

  summarize cigs if cigs!=0, detail

                cigs smked per day while preg
-------------------------------------------------------------
      Percentiles      Smallest
 1%            1              1
 5%            3              1
10%            4              1       Obs                 212
25%            8              2       Sum of Wgt.         212

50%           10                      Mean           13.66509
                        Largest       Std. Dev.      8.690907
75%           20             40
90%           20             40       Variance       75.53186
95%           30             46       Skewness        1.30199
99%           40             50       Kurtosis        5.55017

妊娠中にたばこを吸っている女性のなかでの,たばこの本数の平均値は13.67であるが,まだ代表する値としても上に引っ張られているので,適切ではない.ヒストグラムを書くと分かるが,山が二つある.

(iv)

 summarize fatheduc, detail

                    father's yrs of educ
-------------------------------------------------------------
      Percentiles      Smallest
 1%            5              1
 5%            9              2
10%           10              2       Obs                1192
25%           12              3       Sum of Wgt.        1192

50%           12                      Mean           13.18624
                        Largest       Std. Dev.      2.745985
75%           16             18
90%           17             18       Variance       7.540432
95%           18             18       Skewness      -.3903149
99%           18             18       Kurtosis       4.091254

父学歴の平均年数は,13.19年.1192しか観測されていないのは,欠損値があるため.

(v)

summarize faminc, detail

                 1988 family income, $1000s
-------------------------------------------------------------
      Percentiles      Smallest
 1%           .5             .5
 5%          3.5             .5
10%          6.5             .5       Obs                1388
25%         14.5             .5       Sum of Wgt.        1388

50%         27.5                      Mean           29.02666
                        Largest       Std. Dev.      18.73928
75%         37.5             65
90%           65             65       Variance       351.1608
95%           65             65       Skewness       .6176205
99%           65             65       Kurtosis       2.473396

平均世帯年収は,2902.67$であり,標準偏差は,1873.93$である.

C3
(i)

summarize math4, detail

           % students satisfactory, 4th grade math
-------------------------------------------------------------
      Percentiles      Smallest
 1%         14.4              0
 5%         30.8            3.6
10%         42.2            5.4       Obs                1823
25%         61.5            6.3       Sum of Wgt.        1823

50%         76.4                      Mean             71.909
                        Largest       Std. Dev.      19.95409
75%           87            100
90%         93.4            100       Variance       398.1658
95%         96.5            100       Skewness      -.9758285
99%          100            100       Kurtosis       3.500104

最大値は,100,最小値は0である.

(ii)
tabu math4
(結果省略)

100%の学校は,38校,2.38%である.

(iii)

 tabulate math4 if math4==50

 % students |
satisfactor |
     y, 4th |
 grade math |      Freq.     Percent        Cum.
------------+-----------------------------------
         50 |         17      100.00      100.00
------------+-----------------------------------
      Total |         17      100.00

(iv)

 summarize math4 read4, detail

           % students satisfactory, 4th grade math
-------------------------------------------------------------
      Percentiles      Smallest
 1%         14.4              0
 5%         30.8            3.6
10%         42.2            5.4       Obs                1823
25%         61.5            6.3       Sum of Wgt.        1823

50%         76.4                      Mean             71.909
                        Largest       Std. Dev.      19.95409
75%           87            100
90%         93.4            100       Variance       398.1658
95%         96.5            100       Skewness      -.9758285
99%          100            100       Kurtosis       3.500104

         % students satisfactory, 4th grade reading
-------------------------------------------------------------
      Percentiles      Smallest
 1%           10              0
 5%         21.5            3.4
10%         31.9            4.8       Obs                1823
25%         48.9            5.4       Sum of Wgt.        1823

50%         62.7                      Mean           60.06188
                        Largest       Std. Dev.      19.14729
75%         73.9            100
90%         81.8            100       Variance       366.6188
95%           87            100       Skewness      -.6369112
99%         93.8            100       Kurtosis       2.985669

数学は79.91であり,読解は60.06であるので,読解の方が難しい.

(v)

 cor math4 read4
(obs=1823)

             |    math4    read4
-------------+------------------
       math4 |   1.0000
       read4 |   0.8427   1.0000

読解と数学には正の強い相関,.848があり,いずれかで高い点数を取っている学校は,もう片方の点数も高い.

(vi)

summarize exppp

    Variable |       Obs        Mean    Std. Dev.       Min        Max
-------------+--------------------------------------------------------
       exppp |      1823    5194.865     1091.89   1206.882   11957.64

平均は5194.87であり,標準偏差は1091.9である.最小値と最大値を比べると,10倍弱の開きがあるので,
分散が大きいといってよいのではないか.

(vii)

C4
(i)

 tabulate train

      =1 if |
assigned to |
        job |
   training |      Freq.     Percent        Cum.
------------+-----------------------------------
          0 |        260       58.43       58.43
          1 |        185       41.57      100.00
------------+-----------------------------------
      Total |        445      100.00

職業訓練を受けているのは,41.57%である.

(ii)

 by train, sort: sum re78

------------------------------------------------------------------------------------------------------------
-> train = 0

    Variable |       Obs        Mean    Std. Dev.       Min        Max
-------------+--------------------------------------------------------
        re78 |       260    4.554802    5.483837          0    39.4835

-------------------------------------------------------------------------------------------------------------
-> train = 1

    Variable |       Obs        Mean    Std. Dev.       Min        Max
-------------+--------------------------------------------------------
        re78 |       185    6.349145    7.867405          0    60.3079

職業訓練を受けた人の収入は6349.15$であり,受けていない人の収入は,4554.8$である.受けた人の年収の方が高い.

(iii)

by unem78, sort: tab train

---------------------------------------------------
-> unem78 = 0

      =1 if |
assigned to |
        job |
   training |      Freq.     Percent        Cum.
------------+-----------------------------------
          0 |        168       54.55       54.55
          1 |        140       45.45      100.00
------------+-----------------------------------
      Total |        308      100.00

----------------------------------------------------
-> unem78 = 1

      =1 if |
assigned to |
        job |
   training |      Freq.     Percent        Cum.
------------+-----------------------------------
          0 |         92       67.15       67.15
          1 |         45       32.85      100.00
------------+-----------------------------------
      Total |        137      100.00

就業している人のなかで,職業訓練を受けたのは,45.45%であり,就業していない人のなかで,職業訓練を受けたのは,32.85%である.つまり,就業していない人よりも,就業している人の方が,職業訓練を受けている.

(iv)
職業訓練はあまり効果的でないと思われる.ただし職業訓練がいつ行われたかがわかるとより推論しやすい.

C5
(i)

sum children

    Variable |       Obs        Mean    Std. Dev.       Min        Max
-------------+--------------------------------------------------------
    children |      4361    2.267828    2.222032          0         13

生存している子どもの数の最小値は,0で,最大値は13,平均値は2.27である.

(ii)

 tab electric

  =1 if has |
electricity |      Freq.     Percent        Cum.
------------+-----------------------------------
          0 |      3,747       85.98       85.98
          1 |        611       14.02      100.00
------------+-----------------------------------
      Total |      4,358      100.00

家に電気が通っている女性は,14.02%である.3の欠損値あり.

(iii)

 by electric, sort: sum children

-------------------
-> electric = 0

    Variable |       Obs        Mean    Std. Dev.       Min        Max
-------------+--------------------------------------------------------
    children |      3747    2.327729    2.277443          0         13

--------------------
-> electric = 1

    Variable |       Obs        Mean    Std. Dev.       Min        Max
-------------+--------------------------------------------------------
    children |       611    1.898527    1.803325          0          9

--------------------
-> electric = .

    Variable |       Obs        Mean    Std. Dev.       Min        Max
-------------+--------------------------------------------------------
    children |         3    2.666667    2.886751          1          6

家に電気が通っていない人の方が,平均的に多くの生きている子どもを持つ.
基本的に近代化すると,子どもの数が減る傾向にあるので,その傾向を表しているのではないか.
家に電気が通っている人たちはより西欧型のライフスタイルを選択しがちであり,それは子どもが少ないライフスタイルである.

(iv)
上で説明した.共通原因があり,それらが,家に電気を持つことと,子どもを少なく生むということを生じさせている.