萍聚社区-德国热线-德国实用信息网

 找回密码
 注册

微信登录

微信扫一扫,快速登录

萍聚头条

查看: 252|回复: 0

[国际新闻] 西媒:数据为何喜爱从“1”开始?

[复制链接]
发表于 2021-1-10 22:02 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

x
作者:参考消息

据西班牙《国家报》网站12月16日发表题为《为什么很多数据都从“1”开始?》的文章称,根据本福特定律,在实际生活中以“1”为首位数字的数的出现概率约为总数的30%。全文摘编如下:

西班牙马德里自治区的179座城市中,大约三分之一的城市(准确地说是54座)都表现出居民人口数以“1”开头的特点。这是本福特定律的一个例子。本福特定律指出,从实际生活得出的数据中,以“1”为首位数字的数的出现概率约为总数的30%。

本福特定律可追溯至1880年,当时美国天文学家西蒙·纽科姆在整理一本对数表书籍时发现了一个有趣现象:以“1”开头的数,其所在的页数相较其他页数破损更多。纽科姆的观察逐渐被人们遗忘,直到1938年,这个现象才引起美国工程师兼物理学家弗兰克·本福特的注意。本福特在多个来源不同的数据集合上测试了这个现象,包括美国3259座城市的居民人口、1800种物质的分子量以及美国《读者文摘》月刊308期中出现的数字。纽科姆的“第一位定律”后来被命名为“本福特定律”。

然而,并非所有数据集合都遵循本福特定律。显然,鞋码不符合这个规律,来源于随机进程的数据——如圣诞节彩票的中奖码——也不符合。因此,如果您购买的“十分之一彩票”(西班牙的一种彩票,如果所购号码中奖,所得奖金为相应奖金的十分之一——本网注)首位数字不是“1”也不必担心:无论首位数是什么,您中奖的概率都很低。

虽然本福特定律不能帮助我们中奖,但它体现在方方面面,如街道门牌号、股票价格、河流长度和国家面积等。稍作思考,就可以很容易地发现,这些数据以“1”开头的频率更高。例如,就西班牙各个街道的门牌号而言,由于很多街道是“小街道”,因此门牌号大都在10至20号之间,超过200个门牌号的“大街道”相对较少。

作为一般性规律,符合本福特定律的数据为表示规模的、不预设限制的数据(长度、人口等)。此外,数据覆盖的数量级越高,就越符合这项定律。从这个意义上来讲,本福特定律是正态分布的“亲戚”,而正态分布自然存在于各类统计现象中。

准确地说,本福特定律可以用以10为底的对数(lg)来解释。如果集合中一个元素以数字c开头的概率为lg(c+1)-lg(c),我们就说这个集合满足本福特定律。在满足本福特定律的集合中,以“1”开头的元素的概率为lg2-1g1≈0.3011。同样,以“8”开头的元素的概率为lg9-lg8≈0.0511。换句话说,大约30%的数字以“1”开头,而仅有约5%的数字以“8”开头。

本福特定律也可应用于实际生活中。假设西班牙企业向大气排放的二氧化碳吨数满足本福特定律,如果一家公司提供的二氧化碳排放量数据中,有15%的数据以“8”开头,则我们有理由认为这家公司的数据存在作假嫌疑。这可能不是决定性证据,但可以成为调查此事件的线索。

来源:参考消息网

Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

手机版|Archiver|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网

GMT+1, 2025-2-22 20:05 , Processed in 0.058825 second(s), 16 queries , MemCached On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表