En sık kullanılan rakamlar: istatistik, psikolinguistik ve Benford kanunu
Giriş: Rakam, bilgi birimi ve kültürel işaret
Rakamların kullanım sıklığı sorusu basit görülse de, analizi matematik istatistik, algı psikolojisi, dilbilim ve bilgi teorisi arasındaki sınıra dayanmaktadır. Gerçek dünya sayısal verilerinde rakamların doğal sıklık dağılımı ile insan实践活动 (numaralar, fiyatlar, seçimler) içindeki subjektif sıklığını ayırmak önemlidir. En şaşırtıcı şey, bu dağılımların rastlantısız ve dengesiz olmadığı, aksine, veri analizi, sahtecilik tespiti ve kognitif yanılgıların anlaşılması için önemlidir.
1. Benford Kanunu: rakamlar dünyasında beklenmedik asimetri
Rakamların sıklığı hakkında en güçlü ve karşı-tutumsal gerçek Benford Kanunu (ilk rakam kanunu) tarafından açıklanmaktadır. Bu kanun, birçok doğal sayısal veri setinde (elektrik faturalar ve dağ yüksekliklerinden moleküler ağırlıklara ve borsada fiyatlandırma) ilk önemli rakamın (1'den 9'a kadar) d'ye eşit olma olasılığının log₁₀(1 + 1/d) formülü ile hesaplandığını belirtir.
Bu, ilk rakam için olasılık dağılımını şu şekilde verir:
1, yaklaşık %30.1'de ortaya çıkar.
2 — yaklaşık %17.6.
3 — yaklaşık %12.5.
Sonra sıklık düşer: 9, sadece %4.6'da ortaya çıkar.
Neden: Kanun, çok sayıda büyük ölçekli dağıtılmış veriler (birimlerden milyonlara kadar) ve büyüme veya çarpma süreçlerini tanımlayan veriler için çalışır. Örneğin, şehir nüfusu, hisse senedi fiyatları, göllerin alanları. Sayı 1 lider, çünkü 1'den 2'ye geçiş için değer %100 artmalı, 8'den 9'a geçiş ise sadece %12.5 artmalıdır. Sistem "1" ile başlayan sayılarda daha uzun süre "kalır".
Uygulama: Dünya genelinde vergi ve finansal organlar, insanların sayıları eşit dağılımlı (her rakam için yaklaşık %11) olarak intüитив olarak eğilim göstermesi, bu da istatistiksel olarak doğal olmayan olduğundan, şüpheli raporları ve sahtecilik verileri tespit etmek için Benford Kanunu'nu kullanmaktadır.
2. Subjektif tercihler: insanın sevdiği rakamlar
İnsanlar bilinçli olarak rakamla ...
Читать далее