はてなブックマークのパブリックユーザリストを分析してみた
http://d.hatena.ne.jp/zapa/20080330/1206802861
こちらの一覧が面白かったので、触発されてなんとなくやってみた。
ていうか上位の人すごすぎる。ブックマーク数5桁Overって・・・。
- ブックマーク数が多いユーザ順に上位5%刻みで、ブックマーク総数を集計
いわゆるパレートの法則が成り立っているかどうか確認してみました。果たして、上位20%のユーザが全ブックマーク総数の80%を占めているのか?
データ元:
こちら (http://irons.jp/blog/2008/03/03/hatebu/) の「はてブパブリックユーザリストその2」を使っています。
今回使用しているのは、2008/03/30 18:45 くらいに取得したデータです。
母集団の情報:
ユーザ数 | 60509 |
---|---|
ブックマーク数合計 | 16729337 |
5%刻みでブックマーク数の合計を計算した結果:
上位% | ユーザ数 | ブックマーク数合計 | ブックマーク数割合 |
---|---|---|---|
0% | 0 | 0 | 0% |
5% | 3025 | 11132286 | 66.54% |
10% | 6050 | 13528681 | 80.87% |
15% | 9076 | 14737129 | 88.09% |
20% | 12101 | 15446020 | 92.33% |
25% | 15127 | 15884956 | 94.95% |
30% | 18152 | 16168995 | 96.65% |
35% | 21178 | 16355500 | 97.77% |
40% | 24203 | 16479762 | 98.51% |
45% | 27229 | 16564347 | 99.01% |
各情報の算出方法:
- ブックマーク数合計 ... 上位X%のユーザのブックマーク数の和をとったもの
- ユーザ数 ... 上位X%のユーザ数(小数点以下は切捨て)
- ブックマーク数割合 ... 上位X%のブックマーク数合計の、全体のブックマーク数に対する割合(=占有率)
なんと、上位10%のユーザだけで全体の80%を占めていました。
上位20%のユーザだと、全体の92%です。
なんとなく対数曲線っぽく見えますね。プロットが5%単位なので、1%単位でプロットすればきれいに見えるかも。
なお参考までに、上位1%のユーザのブックマーク数占有率は34.92%でした。恐るべし・・・。
気になること:
アクティブでないユーザ(数回使ってみたけど、いまいち手に馴染まないのでそのまま放置、みたいなユーザ)がある程度含まれているとは思います。が、何をもって「アクティブでない」と判断するのかは難しいため、今回はリストに掲載されている全ユーザを対象に集計を行っています。
また、当然ながら、上記にはプライベートユーザは含まれていません。まぁプライベートユーザを含めても、おそらく結果はほぼ同じになると思いますが。