什么是幂律,正态分布叠加公式

什么是幂律

什么是幂律,正态分布叠加公式

文章插图
幂律是说节点具有的连线数和这样的节点数目乘积是一个定值,也就是几何平均是定值 。幂律来自上世纪20年代对于英语单词频率的分析,发现真正常用的单词量很少,很多单词不常被使用 。
简单来说,幂律就是两个通俗的定律,一个是“长尾”理论,只有少数大的门户网站是很多人关注的,但是还有一个长长的尾巴,就是小网站、小公司 。长尾理论就是对幂律通俗化的解释 。另外一个通俗解释就是马太效应,穷者越穷富者越富 。
正态分布叠加公式在商业世界中,正态分布,就是因为“边际交付时间”等等因素导致的,好的少,差的也少,大部分企业趋向中间的一种“倒钟型”分布;
在商业世界中,幂律分布,就是因为“网络效应”等等因素导致的,强者越强,弱者越弱,大部分企业走向极端的一种“尖刀型”分布 。
掌握正态分布,和幂律分布这两种工具,有助于我们理解商业世界的基本业态,并能够在不同的业态分布中,用不同的商业逻辑,顺势而为,寻求成功 。
幂律分布就是前百分之一赚整个行业的钱;正态分布,就是大部分在平均水平线上下就可以糊口 。
用技术替代人工,或者做物流平台,做薄做广自己,都有机会实现幂律分布 。
把需要时间的事情交给别人做,自己做“轻”的事情 。比如品牌商,把生产交给制造商做 。比如美团点评做引流,把做饭的事情交给无数的饭店做 。
什么是幂律分布法则自然界与社会生活中存在各种各样性质迥异的幂律分布现象 。
1932年,哈佛大学的语言学专家Zipf在研究英文单词出现的频率时,发现如果把单词出现的频率按由大到小的顺序排列,则每个单词出现的频率与它的名次的常数次幂存在简单的反比关系,这种分布就称为Zipf定律,它表明在英语单词中,只有极少数的词被经常使用,而绝大多数词很少被使用.实际上,包括汉语在内的许多国家的语言都有这种特点 。
19世纪的意大利经济学家Pareto研究了个人收入的统计分布,发现少数人的收入要远多于大多数人的收入,提出了著名的80/20法则,即20%的人口占据了80%的社会财富.个人收入X不小于某个特定值x的概率与x的常数次幂亦存在简单的反比关系,即为Pareto定律 。
Zipf定律与Pareto定律都是简单的幂函数,我们称之为幂律分布;还有其它形式的幂律分布,像名次—规模分布,规模—概率分布,这四种形式在数学上是等价的 。
幂律分布表现为一条斜率为幂指数的负数的直线,这一线性关系是判断给定的实例中随机变量是否满足幂律的依据 。
实际上,幂律分布广泛存在于物理学,地球与行星科学,计算机科学,生物学,生态学,人口统计学与社会科学,经济与金融学等众多领域中,且表现形式多种多样.在自然界与日常生
活中,包括地震规模大小的分布(古登堡-里希特定律),月球表面上月坑直径的分布,行星间碎片大小的分布,太阳耀斑强度的分布,计算机文件大小的分布,战争规模的分布,人类语言中单词频率的分布,大多数国家姓氏的分布,科学家撰写的论文数的分布,论文被引用的次数的分布,网页被点击次数的分布,书籍及唱片的销售册数或张数的分布,每类生物中物种数的分布,甚至电影所获得的奥斯卡奖项数的分布等,都是典型的幂律分布 。以网页被点击次数的分布为例,尽管中国向七千九百万网民提供的网站接近六十万个,但只有为数不多的网站,才拥有网民一次访问难以穷尽的丰富内容,拥有接纳许多人同时访问的足够带宽,进而有条件演化成热门网站,拥有极高的点击率,像新浪,搜狐,网易等门户网站 。网页被点击次数的幂律分布其幂指数在0.60-1.03之间,而网站访问量的幂律分布其幂指数则接近1 。
统计物理学家习惯于把服从幂律分布的现象称为无标度现象,即,系统中个体的尺度相差悬殊,缺乏一个优选的规模 。可以说,凡有生命的地方,有进化,有竞争的地方都会出现
不同程度的无标度现象 。
【什么是幂律,正态分布叠加公式】

    推荐阅读