31.ヤマネの姪の社会科学習



  • @マーモセット さん

    一般論ですが、平均の平均は全体の平均にはなりませんですね。

    今回の場合は、みっつの可能性のそれぞれで平均を求めるときの分数で、分母がことなっているあたりがどうにも気になります。

    (私とて確信があるわけではありませんが……)

    ためしに「平均の平均」という検索語でGoogle先生の庭を散策してみませんか?
    (散策のとちゅうで今、この文を投稿しております)



  • @Hannibal さん

    「平均の平均」

    私の頭では、3つの可能性で出てきたものはそれぞれ2人の平均ですが、それはアンケート結果という数値と扱っています。
    実際にはアンケートは1回しか行われないという想定です。
    このアンケート結果の数値の可能性について平均してみても実態と離れてしまうのではないかという検証でやっているのですが、もしかしたら私は他の人と違う解釈でこの問題を見ているのかもしれませんね。


  • Global Moderator

    @Hannibal さん

    確かに一般には「平均の平均」は「全体の平均」に等しくなりませんが、それは母数が揃っているとは限らないからと理解しています。マーモセット さんの例1の場合には、そこは大丈夫ではないでしょうか。私は、いまのところ、マーモセットさんの論に穴を見つけられていません。


  • Global Moderator

    前のコメントに書いたように、全員にアンケートを取れば、「補正」後の値は正しくなります。しかし、マーモセットさんがおっしゃるように、一部の人にアンケートとると、試行を繰り返して(平均の)平均をとったとしても、値がずれてきます。

    それは、各世帯がアンケートを取る・取られないの確率が、世帯人数に依存するからでしょう。つまり、1/nというカウント値の補正は、サンプリング・バイアスの補正にはなっていないということだと思います。

    ヤマネの姪の社会科学習で@オメガ3さんが発言 :

    「補正」はサンプリングバイアスを解消するものではなくて、家族の平均人数を計算するためのものです。

    ヤマネの姪の社会科学習で@マーモセットさんが発言 :

    2人世帯は補正で1/2にしても1/4にしか補正効果がないし、1人世帯は1/4のまま
    ここに問題があるのではと考えられませんか?

    たぶん、↑ここらへんの指摘が正解なのだと思います。私の「リカバー可能」という主張は、「部分的には補正可能」というのが正しかったのだと思います。
    16tons←この画像はフォーラム内でご自由にお使い下さい。
    (http://expo70.xyz/image/fun/16tons.svg)



  • あれ? 母数は同一でしたか?

    人数で数えるならば同意いたしますが、重みをつけた人数でカウントしているのではありませんか?

    (統計は苦手です)


  • Global Moderator

    ヤマネの姪の社会科学習で@Hannibalさんが発言 :

    人数で数えるならば同意いたしますが、重みをつけた人数でカウントしているのではありませんか?

    あっ!そういうことですか。1/n補正後のカウント数の合計が、それぞれの試行によって違っているので、母数が違う、ということですね。

    例1の場合:
    (1人家族A―2人家族B)⇒{1+ 2x(1/2)}/{1+(1/2)}=4/3 →総カウント数は、1.5
    (1人家族A―2人家族C)⇒{1+ 2x(1/2)}/{1+(1/2)}=4/3 →総カウント数は、1.5
    (2人家族B―2人家族C)⇒{2x(1/2)x2}/{(1/2)x2}=2 →総カウント数は、1

    追加:
    そして、確かに、母数を考慮に入れて、「全体の平均」を取ると、当然ながら、
    {1+2x(1/2)+1+2x(1/2)+2x(1/2)x2}/{1+(1/2)+1+(1/2)+(1/2)x2} = 1.5
    となって、全員にアンケートしたときと同じになりますね。

    またこれがふってくるのか?16tonsムズイです。泣きそうです(笑

    サンプリング・バイアスの補正になっていない説も、今書いた@Hannibal さんのご指摘に沿った説も、それぞれが正しく思えます。1/n「補正」をどう捉えるかであって、同じことを別の言い方で言っているように思えます。



  • @マーモセットさん

    >聞く人をサイコロで選ぶときの確率を小さくして、稀に聞くようにすれば、

    上記の条件があるのであれば、個人別にアンケートを取る場合、場合分けをして誰が選ばれるかを考える必要はないのではないかと思います。
    4人それぞれが1/4の確率で選ばれると考えればいいのではないでしょうか???
    上記の条件があるなら、全員にアンケートを取ったのと同じであると、、、

    そのうえで、調査によって得られるデータは
    「n人家族と回答した人が〇人」ですが、
    一般的には、家族の平均人数は、
    n×〇を合計し、〇の合計で割るという方法かと思いますが、
    世帯ごとの平均人数を求めるためには、
    アンケート参加人数(回答数)をアンケート参加世帯数で割って求められるのではないかと思います。
    そのためには、世帯数を出す必要があり、それは〇/nで求められると思います。←ここで補正

    0_1497822624462_キャプチャ 平均人数.JPG

    だんだん混乱してきたので、間違っていたらすみません。

    ※やっと図を表示することが出来ました。訂正、修正があります。



  • @マーモセット

    1人世帯は1/4
    2人世帯は(1/4)x2
    2人世帯は補正で1/2にしても1/4にしか補正効果がないし、1人世帯は1/4のまま
    ここに問題があるのではと考えられませんか?

    買い物の出先でふと考えたら、1人家族の2人が1/4のままでも2人家族の合計も1/4になるのならそれぞれの世帯の間では同等になっていると考えることができるのでしょうか?
    余計に分からなくなってしまいました。



  • @ソム さん
    何度も思い付きを書きこんで問題を複雑化してしまい申し訳ありません。

    そして、確かに、母数を考慮に入れて、「全体の平均」を取ると、当然ながら、
    {1+2x(1/2)+1+2x(1/2)+2x(1/2)x2}/{1+(1/2)+1+(1/2)+(1/2)x2} = 1.5
    となって、全員にアンケートしたときと同じになりますね。

    私が検討した計算ではそれぞれのケースの分母が異なっているため、単純に足して平均を求めても意味がないということなのだと解釈しました。
    例1では3人から2人を選んでいますが、
    補正計算時にそれぞれ1.5人、1.5人、1人に補正されています。
    アンケートを取った相手によって、計算上アンケートを取った人数が減少した状態で計算されているということですね。
    ソムさんの例(1,2,3,4,5,5)合計6世帯20人でここから2人を選んだ場合
    1,2を選べば1.5人にアンケートを取ったということになり
    5,5を選べば0.4人にアンケートを取ったということでバランスを欠いた状態になっています。
    少人数で検討しているので、このアンバランスが頭を混乱させているのではないかと感じ始めています。
    たとえば、アンケートを取る時、「計算上の○人分取ることとする」と決めることでずれを解消できないかなどともう訳の分からない方向に向かっています。
    少人数で検討しているとうまく一致させることができませんが、規模を大きくして補正計算後10人相当(誤差範囲+-〇人)みたいに設定してアンケートを取るというのはどうだろうなどと考えているうちに、現実的にはもっと規模が大きな人数で行われるのだから、普通にアンケートをとれば誤差範囲の中に入ってしまうのだろうと行きつきました。


  • Global Moderator

    @マーモセット さん

    いえいえ、どんどん思いつきを書いてください。誰の名誉にかかわる問題でもないですし、ここはアイデアを交換する場所です。集団の統計や平均というのは、錯覚しやすい点があり難しいものだと再認識しました。私もまだ混乱中ですが、皆さんのアイデアを見ているうちに、だいぶ整理されてきたと思っています。


Log in to reply
 

Looks like your connection to パズルハウス was lost, please wait while we try to reconnect.