cht電腦資訊
adm Find login register

從 Debian popcon 小談統計偏差

caleb
joined: 2007-09-22
posted: 630
promoted: 134
bookmarked: 90
1subject: 從 Debian popcon 小談統計偏差Promote 0 Bookmark 02007-12-24quote  

因為寫這篇有感而發:

http://hyperrate.com/topic-view-thread.php?tid=2183

 

Debian Popularity Contest,簡稱 popcon,是個用來統計 Debian 套件的 安裝/使用/受歡迎? 程度。

若使用官方建議的安裝方式,預設會安裝 popularity-contest 這個套件,然後定期以匿名的方式向 Debian server 回報本系統所 安裝/使用 的各種套件。

 

這個統計本身沒啥大作用,最主要的功能是用以決定「哪些套件應該盡量放在前幾片光碟」。

以目前的 Debian stable 來說,CD 數量高達 21 片,DVD 多達 3 片,popcon 因此成為一個很合理的數據,用以協助安排光碟中的套件。

 

稍有統計常識的人應該都想像得到它有哪些偏差,不過我在這特別想提的,是我最愛用的 Window Manager, evilwm 的 popcon 數據

會喜歡 evilwm 的人基本上是喜歡「簡單、不花俏、乾淨、沒有多餘功能、沒有 eye candy、省資源」,而且上至 upstream、evilwm hacker,下至 evilwm packager、evilwm end user,每個人的網頁或 blog 都是乾淨到不行,常常只用最基本的 html tag,不用任何雜七雜八的 icon / 顏色 / 圖片/ flash / script。

也就是說,我們可以合理推測 evilwm user 也會喜歡系統裡乾乾淨淨,不安裝任何多餘的套件…

絕大多數 evilwm user 一定會把 popularity-contest 移除掉,因而導致 popcon 統計數據嚴重偏低…

 

當然啦,gcin 和 popcon 的關係不像 evilwm 這麼明顯,我只是舉這個極端的例子來說明,popcon 的數據看完笑笑就好,不要太相信。

 

cht電腦資訊
adm Find login register
views:4025