SAS University Editionでのデータ取り込み
SAS University EditionはUnixベースで動いている.そのため,ファイルの位置の記述についても,UNIXを踏襲する必要がある.
ここで書かれているように,
仮想ドライブの際に共有フォルダとしたmyfoldersの下に,wombatというフォルダがあり,その中にデータがあるとすると,
INFILE '/folders/myfolders/wombat/sse.ret.dat';
と書く必要がある.foldersの前のスラッシュがないと文句を言われるので注意すること.ここで何回も引っ掛かった.
また,SAS University Editionの文字コードはutf-8なので,データの二次分析の際は,shift-jisからutf-8に文字コードを変換しておかないと,
ラベルが文字化けで読めなくなる.SAS University Edition内部での文字コードの変換はうまくいったことがないので,よい方法があれば教えていただきたい.
savファイルをutf-8で保存.
SET UNICODE ON.
その後データファイルを保存すると,utf-8で保存されるはず.
『第2回日本社会心理学会春の方法論セミナー』@上智
第2回日本社会心理学会春の方法論セミナー
久保先生の説明が非常にクリアで勉強になった.本もわかりやすいが,話もクリアなので聞く機会があれば逃さない方がいい.
- 竹澤報告
"Generalized Linear Mixed Model: A practical guide for ecology and evolution"がおすすめされていた.
"Type 1 Error Inflation in the Traditional by-participant Analysis"もおすすめ.
これはベイズの例としてあげられていた.ただこういう話もあるようで.
Modelについて学ぶのであれば,The Ecological Detective: Confronting Models With Dataがよいとのこと.
- 久保報告
JAGSやStanを使うとよいとのこと.Stanはマニアックな人が使えばいいといわれていた.
階層ベイズモデルの「階層」とは,データの階層性のことをいっているのではなく,パラメータの分布の階層性のことをいっている,とのこと.
- 清水報告
package: glmer
SAS: GLIMMIXプロシジャー
- 久保リプライ
random effectは正規分布だけでなく,すその長いt分布も使われることがある.
HLMのようなことも階層ベイズモデルでできる.
Ch. 4 Stata
C1
(i) はA候補者の支出が1%増えた際に,A候補者が獲得する票数を示す.
(ii) In terms of the parameters, state the null hypothesis that a 1% increase in A’s expenditures
is offset by a 1% increase in B’s expenditures.
はプラス,はマイナスの影響をに及ぼすと考えられるので,
となればよい.それゆえ,となる.
(iii) Do A’s expenditures affect the outcome? What about B’s expenditures?
Can you use these results to test the hypothesis in part (ii)?
reg voteA lexpendA lexpendB prtystrA Source | SS df MS Number of obs = 173 -------------+------------------------------ F( 3, 169) = 215.23 Model | 38405.1096 3 12801.7032 Prob > F = 0.0000 Residual | 10052.1389 169 59.480112 R-squared = 0.7926 -------------+------------------------------ Adj R-squared = 0.7889 Total | 48457.2486 172 281.728189 Root MSE = 7.7123 ------------------------------------------------------------------------------ voteA | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- lexpendA | 6.083316 .38215 15.92 0.000 5.328914 6.837719 lexpendB | -6.615417 .3788203 -17.46 0.000 -7.363246 -5.867588 prtystrA | .1519574 .0620181 2.45 0.015 .0295274 .2743873 _cons | 45.07893 3.926305 11.48 0.000 37.32801 52.82985 ------------------------------------------------------------------------------
テストするのは,
(iv)
Ch. 3 stata
C1
(i)
はプラスの方向を示すだろう.
(ii)
収入が多い人は健康にも気を使う可能性があるので,相関があるにしてもマイナスだろう.
(iii)
reg bwght cigs Source | SS df MS Number of obs = 1388 -------------+------------------------------ F( 1, 1386) = 32.24 Model | 13060.4194 1 13060.4194 Prob > F = 0.0000 Residual | 561551.3 1386 405.159668 R-squared = 0.0227 -------------+------------------------------ Adj R-squared = 0.0220 Total | 574611.72 1387 414.283864 Root MSE = 20.129 ------------------------------------------------------------------------------ bwght | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- cigs | -.5137721 .0904909 -5.68 0.000 -.6912861 -.3362581 _cons | 119.7719 .5723407 209.27 0.000 118.6492 120.8946 ------------------------------------------------------------------------------ reg bwght cigs faminc Source | SS df MS Number of obs = 1388 -------------+------------------------------ F( 2, 1385) = 21.27 Model | 17126.2088 2 8563.10442 Prob > F = 0.0000 Residual | 557485.511 1385 402.516614 R-squared = 0.0298 -------------+------------------------------ Adj R-squared = 0.0284 Total | 574611.72 1387 414.283864 Root MSE = 20.063 ------------------------------------------------------------------------------ bwght | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- cigs | -.4634075 .0915768 -5.06 0.000 -.6430518 -.2837633 faminc | .0927647 .0291879 3.18 0.002 .0355075 .1500219 _cons | 116.9741 1.048984 111.51 0.000 114.9164 119.0319 ------------------------------------------------------------------------------
収入を含めても,たばこを吸うことの新生児の体重への効果はほぼ変化はない.
C2
(i)
reg pric sqrft bdrms Source | SS df MS Number of obs = 88 -------------+------------------------------ F( 2, 85) = 72.96 Model | 580009.152 2 290004.576 Prob > F = 0.0000 Residual | 337845.354 85 3974.65122 R-squared = 0.6319 -------------+------------------------------ Adj R-squared = 0.6233 Total | 917854.506 87 10550.0518 Root MSE = 63.045 ------------------------------------------------------------------------------ price | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- sqrft | .1284362 .0138245 9.29 0.000 .1009495 .1559229 bdrms | 15.19819 9.483517 1.60 0.113 -3.657582 34.05396 _cons | -19.315 31.04662 -0.62 0.536 -81.04399 42.414 ------------------------------------------------------------------------------
(ii)
一部屋ベッドルームが増えると,15200$のアップ.
(iii)
一部屋ベッドルームが増えて,140スクエアフィート増えると,33181$のアップ.
(iv)
63.2%
(v)
予測は,354.6(in thousand dollars).
(vi)
実際は,300(in thousand dollars)なので,残さは,43.05であり,十分には支払われていない.
C3
(i)
を推定する.
reg lsalary lsales lmktval Source | SS df MS Number of obs = 177 -------------+------------------------------ F( 2, 174) = 37.13 Model | 19.3365617 2 9.66828083 Prob > F = 0.0000 Residual | 45.3096514 174 .260400295 R-squared = 0.2991 -------------+------------------------------ Adj R-squared = 0.2911 Total | 64.6462131 176 .367308029 Root MSE = .51029 ------------------------------------------------------------------------------ lsalary | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- lsales | .1621283 .0396703 4.09 0.000 .0838315 .2404252 lmktval | .106708 .050124 2.13 0.035 .0077787 .2056372 _cons | 4.620917 .2544083 18.16 0.000 4.118794 5.123041 ------------------------------------------------------------------------------
となる.
(ii)
sum sales mktval profits Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- sales | 177 3529.463 6088.654 29 51300 mktval | 177 3600.316 6442.276 387 45400 profits | 177 207.8305 404.4543 -463 2700
と書く場合,xは正の実数をとる必要がある.profitsは負をとるため,対数変換には向かない.
reg lsalary lsales lmktval profits Source | SS df MS Number of obs = 177 -------------+------------------------------ F( 3, 173) = 24.64 Model | 19.3509799 3 6.45032663 Prob > F = 0.0000 Residual | 45.2952332 173 .261822157 R-squared = 0.2993 -------------+------------------------------ Adj R-squared = 0.2872 Total | 64.6462131 176 .367308029 Root MSE = .51169 ------------------------------------------------------------------------------ lsalary | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- lsales | .1613683 .0399101 4.04 0.000 .0825949 .2401416 lmktval | .0975286 .0636886 1.53 0.128 -.0281782 .2232354 profits | .0000357 .000152 0.23 0.815 -.0002643 .0003356 _cons | 4.686924 .3797294 12.34 0.000 3.937425 5.436423 ------------------------------------------------------------------------------
決定係数はそれほど高くない.
(iii)
reg lsalary lsales lmktval profits ceoten Source | SS df MS Number of obs = 177 -------------+------------------------------ F( 4, 172) = 20.08 Model | 20.5768102 4 5.14420254 Prob > F = 0.0000 Residual | 44.0694029 172 .256217459 R-squared = 0.3183 -------------+------------------------------ Adj R-squared = 0.3024 Total | 64.6462131 176 .367308029 Root MSE = .50618 ------------------------------------------------------------------------------ lsalary | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- lsales | .1622339 .0394826 4.11 0.000 .0843012 .2401667 lmktval | .1017598 .063033 1.61 0.108 -.022658 .2261775 profits | .0000291 .0001504 0.19 0.847 -.0002677 .0003258 ceoten | .0116847 .005342 2.19 0.030 .0011403 .022229 _cons | 4.55778 .3802548 11.99 0.000 3.807213 5.308347 ------------------------------------------------------------------------------
となる.
1年働くと,1.2%の収入増加となる.
(iv)
cor lmktval profits (obs=177) | lmktval profits -------------+------------------ lmktval | 1.0000 profits | 0.7769 1.0000
相関は高いが,vifは高くないので,それほど問題はない.
C4
(i)
sum atndrte priGPA ACT Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- atndrte | 680 81.70956 17.04699 6.25 100 priGPA | 680 2.586775 .5447141 .857 3.93 ACT | 680 22.51029 3.490768 13 32
81.7%のクラスに平均的に出席しており,前学期のGPAは平均2.59,ACTのスコアは平均22.51である.
それぞれの最小値・最大値は,6.25%と100%,.857と3.93,13と32である.
(ii)
を推定する.
reg atndrte priGPA ACT Source | SS df MS Number of obs = 680 -------------+------------------------------ F( 2, 677) = 138.65 Model | 57336.7612 2 28668.3806 Prob > F = 0.0000 Residual | 139980.564 677 206.765974 R-squared = 0.2906 -------------+------------------------------ Adj R-squared = 0.2885 Total | 197317.325 679 290.59989 Root MSE = 14.379 ------------------------------------------------------------------------------ atndrte | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- priGPA | 17.26059 1.083103 15.94 0.000 15.13395 19.38724 ACT | -1.716553 .169012 -10.16 0.000 -2.048404 -1.384702 _cons | 75.7004 3.884108 19.49 0.000 68.07406 83.32675 ------------------------------------------------------------------------------
である.
GPAが0,かつACTのスコアが0の学生は,平均的に75.7%の出席率となる.あまり意味のある数字ではない.
(iii)
GPAがよい学生は,そうでない学生と比べ,より出席する傾向にある.ACTのスコアが良いと,そうでない学生と比べ,出席しにくくなる.
少し不思議な結果である.よりテストでうまくできていた学生は,出席しなくてもうまくやれると思っているということを反映しているのかもしれない.
(iv)
となり,出席率100%を超えてしまう.実際にサンプルのなかにこの値をとるサンプルがある.
(v)
となり,差は25.86%程度となる.
C5
対数変換
対数変換をした場合の係数をどう読むかという問題がある.
従属変数と独立変数について,四つのパターンがある.
1 従属変数がであり,独立変数がである場合.
2 従属変数がであり,独立変数がである場合.
3 従属変数がであり,独立変数がである場合.
4 従属変数がであり,独立変数がである場合,
の4通りである.
Wooldridgeはそれぞれについて,
1
2
3
4
であると述べている.
1の場合は,xが一単位変化すると,yが増えると読む.
2の場合は,xが1パーセント変化すると,yが変化すると読む.
3の場合は,xが一単位変化すると,yが変化すると読む.
4の場合は,xが1パーセント変化すると,yが変化すると読む.
Ch.2 Stata
C1
(i)
sum prate mrate Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- prate | 1534 87.36291 16.71654 3 100 mrate | 1534 .7315124 .7795393 .01 4.91
平均参加率87.36%,平均リターンは73%である.
(ii)
regress prate mrate
使用したサンプルは1534であり,決定係数は0.075である.
prate=83.08+mrate*5.86
(iii)
企業によるリターンが0の場合,平均的な参加率は83.08%となる.企業によるリターンが1ドルにつき1どるである企業では,平均参加率は5.86%高い.
(iv)
mrate=3.5とすると,prate=83.08+3.5*5.86となり,prate=103.59という結果が得られる.
prateの上限は100%であるので,この予測は上限を超えてしまっている.そのため,上限がある従属変数に対して,線形回帰を当てはめるたときに起こる,問題をこの単回帰の結果は示している.
C2
(i)
sum salary ceoten Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- salary | 177 865.8644 587.5893 100 5299 ceoten | 177 7.954802 7.150826 0 37
平均収入(1000$)は865.86であり,CEOとしての平均年数は,7.95である.
(ii)
tabulate ceoten years as | ceo with | company | Freq. Percent Cum. ------------+----------------------------------- 0 | 5 2.82 2.82 1 | 19 10.73 13.56 2 | 10 5.65 19.21 3 | 21 11.86 31.07 4 | 21 11.86 42.94 5 | 10 5.65 48.59 6 | 11 6.21 54.80 7 | 6 3.39 58.19 8 | 11 6.21 64.41 9 | 8 4.52 68.93 10 | 8 4.52 73.45 11 | 4 2.26 75.71 12 | 7 3.95 79.66 13 | 7 3.95 83.62 14 | 5 2.82 86.44 15 | 2 1.13 87.57 16 | 2 1.13 88.70 17 | 2 1.13 89.83 18 | 1 0.56 90.40 19 | 2 1.13 91.53 20 | 4 2.26 93.79 21 | 1 0.56 94.35 22 | 1 0.56 94.92 24 | 3 1.69 96.61 26 | 2 1.13 97.74 28 | 1 0.56 98.31 34 | 1 0.56 98.87 37 | 2 1.13 100.00 ------------+----------------------------------- Total | 177 100.00
1年目は5人,最大は37年.
(ii)
reg lsalary ceoten Source | SS df MS Number of obs = 177 -------------+------------------------------ F( 1, 175) = 2.33 Model | .850907024 1 .850907024 Prob > F = 0.1284 Residual | 63.795306 175 .364544606 R-squared = 0.0132 -------------+------------------------------ Adj R-squared = 0.0075 Total | 64.6462131 176 .367308029 Root MSE = .60378 ------------------------------------------------------------------------------ lsalary | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- ceoten | .0097236 .0063645 1.53 0.128 -.0028374 .0222846 _cons | 6.505498 .0679911 95.68 0.000 6.37131 6.639686 ------------------------------------------------------------------------------
一年CEOとして多く働いている人は,そうでない人と比べて,9.77%()収入が多い.
C3
(i)
reg sleep totwrk Source | SS df MS Number of obs = 706 -------------+------------------------------ F( 1, 704) = 81.09 Model | 14381717.2 1 14381717.2 Prob > F = 0.0000 Residual | 124858119 704 177355.282 R-squared = 0.1033 -------------+------------------------------ Adj R-squared = 0.1020 Total | 139239836 705 197503.313 Root MSE = 421.14 ------------------------------------------------------------------------------ sleep | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- totwrk | -.1507458 .0167403 -9.00 0.000 -.1836126 -.117879 _cons | 3586.377 38.91243 92.17 0.000 3509.979 3662.775 ------------------------------------------------------------------------------
n=706, 決定係数は0.103である.
であるので,
となる.
切片は全く働いていない人の睡眠時間(分表記)を表している.
(iii)
2時間働いている人は,となる18分程度睡眠時間が少ないことになる.それほど大きい差ではない.
C4
(i)
sum wage IQ Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- wage | 935 957.9455 404.3608 115 3078 IQ | 935 101.2824 15.05264 50 145
平均的な月収は,957.95であり,平均的なIQは101.28であり,その標準偏差は,15.05である.
(ii)
Source | SS df MS Number of obs = 935 -------------+------------------------------ F( 1, 933) = 98.55 Model | 14589782.6 1 14589782.6 Prob > F = 0.0000 Residual | 138126386 933 148045.429 R-squared = 0.0955 -------------+------------------------------ Adj R-squared = 0.0946 Total | 152716168 934 163507.675 Root MSE = 384.77 ------------------------------------------------------------------------------ wage | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- IQ | 8.303064 .8363951 9.93 0.000 6.661631 9.944498 _cons | 116.9916 85.64153 1.37 0.172 -51.08078 285.0639 ------------------------------------------------------------------------------
IQが15高い人は,wageが124.5高い.決定係数は,9.6%なのでそれほど高くない.
(iii)
reg lwage IQ Source | SS df MS Number of obs = 935 -------------+------------------------------ F( 1, 933) = 102.62 Model | 16.4150939 1 16.4150939 Prob > F = 0.0000 Residual | 149.241189 933 .159958402 R-squared = 0.0991 -------------+------------------------------ Adj R-squared = 0.0981 Total | 165.656283 934 .177362188 Root MSE = .39995 ------------------------------------------------------------------------------ lwage | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- IQ | .0088072 .0008694 10.13 0.000 .007101 .0105134 _cons | 5.886994 .0890206 66.13 0.000 5.712291 6.061698 ------------------------------------------------------------------------------
IQが1高い人は,8.8%月収が高い.IQが15高いと13.2%収入が高い.決定係数は,0.099である.
C5
(i)
constant elasticityはが示している.
(ii)
Source | SS df MS Number of obs = 32 -------------+------------------------------ F( 1, 30) = 302.72 Model | 84.8395785 1 84.8395785 Prob > F = 0.0000 Residual | 8.40768588 30 .280256196 R-squared = 0.9098 -------------+------------------------------ Adj R-squared = 0.9068 Total | 93.2472644 31 3.00797627 Root MSE = .52939 ------------------------------------------------------------------------------ lrd | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- lsales | 1.075731 .0618275 17.40 0.000 .9494619 1.201999 _cons | -4.104722 .4527678 -9.07 0.000 -5.029398 -3.180047 ------------------------------------------------------------------------------
推定された式はとなる.salesが1%上がると,rdは1.08%上がることを示している.
C6
(i)
資源を投入していっても際限なく合格率が上がるとは思えない.最初は傾きが大きいが,徐々にその傾きは緩やかになるだろう.
(ii)
で,はexpendの支出が1%増えた際,以前の支出と比べて,math10に及ぼす効果のパーセンテージを示している.は100ではなく,10でを割っているので,10%増えた際の効果を求めていることになる.
(iii)
reg math10 lexpend Source | SS df MS Number of obs = 408 -------------+------------------------------ F( 1, 406) = 12.41 Model | 1329.42517 1 1329.42517 Prob > F = 0.0005 Residual | 43487.7553 406 107.112698 R-squared = 0.0297 -------------+------------------------------ Adj R-squared = 0.0273 Total | 44817.1805 407 110.115923 Root MSE = 10.35 ------------------------------------------------------------------------------ math10 | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- lexpend | 11.16439 3.169011 3.52 0.000 4.934677 17.39411 _cons | -69.3411 26.53013 -2.61 0.009 -121.4947 -17.18753 ------------------------------------------------------------------------------
であり,サンプルサイズは,408,決定係数は,0.03である.
(iv)
10%の支出が多いと,数学の合格率が1.1単位高い.あまり大きくない.
(v)
expendとmath10の相関や,散布図を見ればわかるが,これらの間に強い線形の関係はない.
また,なので,のexpendがあれば,100を超えるが,
そこまでexpendが大きい標本はない.ので,100を超える心配をする必要がない.
C7
(i)
sum gift Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- gift | 4268 7.44447 15.06256 0 250
平均的な贈り物の量は,7.44である.
tab gift amount of | gift, Dutch | guilders | Freq. Percent Cum. ------------+----------------------------------- 0 | 2,561 60.00 60.00 2 | 25 0.59 60.59 3 | 6 0.14 60.73 4 | 1 0.02 60.75 5 | 158 3.70 64.46 7 | 14 0.33 64.78 8 | 1 0.02 64.81 10 | 702 16.45 81.26 12 | 1 0.02 81.28 15 | 152 3.56 84.84 20 | 86 2.01 86.86 22 | 2 0.05 86.90 24 | 1 0.02 86.93 25 | 387 9.07 95.99 30 | 36 0.84 96.84 35 | 7 0.16 97.00 40 | 4 0.09 97.09 50 | 86 2.01 99.11 55 | 1 0.02 99.13 60 | 1 0.02 99.16 75 | 3 0.07 99.23 90 | 1 0.02 99.25 95 | 1 0.02 99.27 100 | 25 0.59 99.86 120 | 1 0.02 99.88 150 | 1 0.02 99.91 200 | 1 0.02 99.93 250 | 3 0.07 100.00 ------------+----------------------------------- Total | 4,268 100.00
贈り物をしていない人は,60%を占めている.
(ii)
sum mailsyear Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- mailsyear | 4268 2.049555 .66758 .25 3.5
平均的な手紙のやりとりは,2.05であり,最小値は.25であり,最大値は3.5である.
(iii)
reg gift mailsyear Source | SS df MS Number of obs = 4268 -------------+------------------------------ F( 1, 4266) = 59.65 Model | 13349.7251 1 13349.7251 Prob > F = 0.0000 Residual | 954750.114 4266 223.804528 R-squared = 0.0138 -------------+------------------------------ Adj R-squared = 0.0136 Total | 968099.84 4267 226.880675 Root MSE = 14.96 ------------------------------------------------------------------------------ gift | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- mailsyear | 2.649546 .3430598 7.72 0.000 1.976971 3.322122 _cons | 2.01408 .7394696 2.72 0.006 .5643347 3.463825 ------------------------------------------------------------------------------
であり,使用されたサンプルは4268であり,決定係数は0
014である.
(iv)
1通の手紙を送るのに,1ギルダーかかったとしても,その結果2.65ギルダーの募金?が得られるので,手紙を送っても純利益は得られる.
(v)
mailsyearは0以上をとるため,予測される最小値は,2.01であり,0は予測されない.
C8
(i)
clear set obs 500 gene x = runiform()*10 sum x Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- x | 500 5.008077 2.858507 .0070969 9.931726
サンプルの平均は,5.01であり,標準偏差は,2.86である.
(ii)
gene e=rnormal(0,6) sum e Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- e | 500 -.0135714 6.121691 -16.42945 18.4913
平均は,-.014であり,標準偏差は,6.12である.乱数なので,平均が正確に0になっているわけではない.
(iii)
gene y=1+2*x+e sum y Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- y | 500 11.00258 8.533333 -11.14159 32.40562 reg y x Source | SS df MS Number of obs = 500 -------------+------------------------------ F( 1, 498) = 471.06 Model | 17662.9654 1 17662.9654 Prob > F = 0.0000 Residual | 18673.1025 498 37.4961898 R-squared = 0.4861 -------------+------------------------------ Adj R-squared = 0.4851 Total | 36336.068 499 72.8177715 Root MSE = 6.1234 ------------------------------------------------------------------------------ y | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- x | 2.081336 .0958968 21.70 0.000 1.892924 2.269748 _cons | .5790901 .5528477 1.05 0.295 -.5071112 1.665291 ------------------------------------------------------------------------------
xの係数についてはほぼ適切に推定できているが,切片については,過小に推定している.
(iv)
predict res, residuals sum res Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- res | 500 1.03e-08 6.117274 -16.33084 18.54772
残さについては,ほぼ平均0になっている.
(v)
reg y x e Source | SS df MS Number of obs = 500 -------------+------------------------------ F( 2, 497) = . Model | 36336.068 2 18168.034 Prob > F = . Residual | 0 497 0 R-squared = 1.0000 -------------+------------------------------ Adj R-squared = 1.0000 Total | 36336.068 499 72.8177715 Root MSE = 0 ------------------------------------------------------------------------------ y | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- x | 2 . . . . . e | 1 . . . . . _cons | 1 . . . . . ------------------------------------------------------------------------------
(方程式通りなので)決定係数が1である.
(vi)
set obs 500 obs was 0, now 500 . gene x = runiform()*10 . gene e=rnormal(0,6) . gene y=1+2*x+e . reg y x Source | SS df MS Number of obs = 500 -------------+------------------------------ F( 1, 498) = 402.23 Model | 15569.4954 1 15569.4954 Prob > F = 0.0000 Residual | 19276.7792 498 38.708392 R-squared = 0.4468 -------------+------------------------------ Adj R-squared = 0.4457 Total | 34846.2746 499 69.8322136 Root MSE = 6.2216 ------------------------------------------------------------------------------ y | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- x | 1.969698 .0982121 20.06 0.000 1.776737 2.162659 _cons | 1.368813 .5788605 2.36 0.018 .2315036 2.506123 ------------------------------------------------------------------------------
もう一回別のデータで繰り返すと,違う結果が得られる.シミュレーションの場合は何度も繰り返すことが肝要である.
今回は,xの係数は前回のものよりよく推定できている,切片の推定もより正確である.