有很多同学批评我说,这个法则在审计实操中效果很差,属于“玄学”。小Rain哥你正经的不讲尽讲这种歪门邪道了。我觉得这里有必要给大家谈谈我对这个法则的认识。
首先,我的每个回答下面都摆着我多年和上市公司斗智斗勇的经验总结:如何确定未上市企业的利润真实性? - 知乎,可是大家都不喜欢这种枯燥无味的说教,那个回答一个月的赞还没这个回答一天的赞多,我作为曾经的四大审计经理,我也很心塞你们知道吗???
其次,这个法则被用于JE testing其实我是有所保留的。正如我在评论区提到的,本福特法则由于存在偏离值随样本量的扩大而收敛的情况(统计误差的收敛和造假的误差被稀释),因而事实上是没有一个可以精确定义的阈值。因此,我觉得这个方法最好的应用不应该在ToD层面,而是在合伙人、经理讨论项目的承接和续约时予以考虑最有效(即未通过检验的项目不接,好吧我知道我在说梦话)。其实我个人觉得比较可行的折中方法是对于同一样本量的数据进行学习,得到对应样本数量下残差的期望波动率,再找出残差显著大于期望波动率的样本,认为其造假可能性较大。
第三,很多会计师、律师朋友批评这个法则即使发现有问题也无法找出问题在哪。这就涉及一个精确与统计的问题了。我在做会计师的时候也一直想要做到100%的精确,但进入投资领域以后我理解了一句话“这个世界唯一能确定的就是不确定性”。因此从此以后我看问题永远都站在统计的角度看,而不追求绝对的证据或结果。事实上,各位想一下,审计的抽样检验不也是建立在统计的原理之上吗?(虽然我们总叫他非统计抽样,为了减少documentation量,会计师什么都干的出来)。站在投资者的立场,我发现一个规律,它能帮我找到对应的样本,相关样本呈现出统计上显著的正(负)超额收益,因此我可以利用相关结果在大样本环境下为投资者取得回报,难道这不也是一种很快乐的事情吗?
--------------------------------------------原答案的分割线--------------------------------------------------------
我给大家介绍一种采用数理统计大样本的方式进行验证的假账测试的细节方法。这个方法最大的优点我认为是不需要你懂会计!
这个方法叫Benford's law(本福特法则)。这是一个关于数值型数据概率分布的数学定理,最初的发现与金融、财务本来没有任何关系,主要应用于自然科学领域。
1935年,美国的一位叫做本福特的物理学家在图书馆翻阅对数表时发现,对数表的头几页比后面的页更脏一些,这说明头几页在平时被更多的人翻阅。
本福特再进一步研究后发现,只要数据的样本足够多,数据中以1为开头的数字出现的频率并不是1/9,而是30.1%。而以2为首的数字出现的频率是17.6%,往后出现频率依次减少,9的出现频率最低,只有4.6%。
本福特开始对其它数字进行调查,发现各种完全不相同的数据,比如人口、物理和化学常数、棒球统计表以及斐波纳契数列数字中,均有这个定律的身影。
数学家经过验证后得出的概率统计分布函数如下: 在a进位制中,以数n起头的数出现的机率为(loga(n + 1) − loga(n))。
在我们通常使用的十进制下首位数字的出现概率分布如下:
也行有同学要问,为什么没有0开头的数据。事实上,任何数字如果缩小一位来看都是以0开头的,因此我们其实可以认为0开头的数字出现概率为100%。
有外国人就这个现象给出了有一定参考意义的数学解释,有兴趣的同学可以看这里:Benford's Law -- from Wolfram MathWorld
本福特定律不但适用于个位数字,连多位的数也可用。 这使得金融界开始考虑本福特法则在财务数据中的应用。经过实证验证,公司的财务报表数据在大样本数据下也符合本福特法则。
我曾经读过的一本书中列举了迪士尼公司和爆出巨大会计丑闻的安然公司之间根据历史所有财务数据通过本福特法则发现的差异,如下:
很明显,安然的财务数据与本福特法则的数据出现了比迪士尼更大的偏差,而且其偏差体现为小于5的数字偏少而大于5的数字偏多,这暗示了公司通过人工扭曲数据导致数据偏离了本福特法则应有的分布情况。
我取用了大家公认的管理层诚信、业绩优良的两家好公司:贵州茅台、中国平安,取了其过去10年的利润表数据,对这些数据的首位数字分布进行了测试,并用差异的平方和作为累计征服差异的统计目标值。结果如下:
中国平安:
图表化分布情况:
贵州茅台:
图表化分布情况:
看来只要是数字就无法逃脱本福特定律的限定,从A股的这两家公司10年的理论表来看,本福特定律显然十分适用。而且考虑到10年的利润表其实只有不到300个样本点,因此能够拟合到这个程度的报表可以说应该是会计质量比较优秀的公司了。
根据我后续的大量实证检测,大部分A股公司与本福特定律的偏差额(差异平方和)在0.1-0.8%之间,而平安和茅台都在这个范围的下限附近。从这里也可以看出,这两家公司的确是非常优秀,而且财务会计数据非常真实可靠。
那么在A股中,我们是否也可以利用本福特法则发现造假的公司呢?我们也来验证一下吧。
我们挑选出几家A股历史上臭名昭著的造假或嫌疑造假公司进行本福特定律的验证,分别是信威集团(柬埔寨电信业务造假被质疑)、獐子岛(扇贝游来游去)、尔康制药(证监会进驻调查涉嫌严重造假)、雅百特(已被证明利润表注水70%,董事长公开撒谎)。结果如下:
信威集团:
獐子岛:
尔康制药:
雅百特:
可以看出,这些公司财务数据的分布和本福特定律期望分布之间存在较大的差异,与一般上市公司的差异呈现出明细的不同。尤其是某些数字和定律之间的差异甚至能超过10%,这是非常明细的异常情况。
这从数学的角度说明了这些公司财务数据造假的情况基本属实。而且从这个角度来看,偏差的比例越大可能说明造假的程度越大。
但请注意,本福特法则不是万能的。当造假者本身知道本福特法则时,他们就可以通过操纵首位数字,使得自己在造假的同时不会被发现财务数据与本福特法则呈现重大差别。因此,我们在实务中使用本福特法则一般秉承如下的原则:大幅度偏离本福特法则基本是骗子,而没有偏离本福特法则未必是好人,也有可能是高明的骗子。
但这也足够帮助我们在对公司进行评价时多一个考察的维度,以判断其业务的真实性。
Rain的金融投资漫谈:
如何确定未上市企业的利润真实性? - 知乎如果喜欢,请关注我的微信公众号:泛舟聊投资
谢谢邀请。
北京冬奥会开幕好几天了,精彩绝伦的开幕式还时常浮现在我的脑海中……
大家心里都清楚,奥运会这种国际盛会,意义远远超出体育比赛本身。举办一次奥运会,本质上是大国综合实力的全方位体现,其中很重要的一部分就是科技实力。本次北京冬奥会确实出现了不少有趣的新技术,我感兴趣的则是云上全息通信技术让光学相关的“黑科技”得以更好发挥,比如昨天一个叫做Cloud ME(云聚)的“全息显示仓”,让国际奥委会主席巴赫出现在了2022北京新闻中心给全国观众拜年。
这个“全息显示仓”要实现的目标非常简单:让远隔千山万水(国际奥委会主席巴赫在北京、阿里巴巴CEO张勇在上海)的两个(或多个)人仿佛处于同一空间中进行交流。而且从实际的观看、拍摄与交流方面来看,对记者们来说,虽然两人都不在眼前,但效果上与他们俩站在面前几乎别无二致。
当然了,虽然新闻中名称叫“全息显示仓”,但实际上这是生活中广义上的全息,并不是物理意义上的。物理意义上狭义的“全息”是衍射成像的技术,但目前的技术还远远做不到理想的动态全息显示,这是整个光学领域圣杯级别的高难度挑战。
此次堪称黑科技的“全息显示仓”虽然不是严格的物理全息,但在立体感与真实感方面远远超出了目前普通显示屏所能呈现的显示效果。可能还有小伙伴没看现场的视频,可以看一下:
https://www.zhihu.com/video/1473958962386739200明明这是一个显示技术,官方的名称为什么叫“阿里云聚”呢?其实这是因为,之所以能取得如此惊艳的效果,最重要的核心技术不仅仅是我们看得见的面前的这款显示屏本身,还包括我们看不到的、尤其是云端的大量黑科技。
要能够实现我们看到的这么棒的发布会效果,至少有三个方面的“黑科技”:
(1)拍摄与显示的硬件设备
从现场的情况来看,发布会现场的“全息显示仓”是一块一人多高的高清大屏幕,用于显示参加新闻发布会的两位嘉宾的实时影像,仿佛两个人都同时站在大家面前。
从官方透露的消息来看,拍摄端的硬件布置大概是这样的:
拍摄端在摄影棚内,有常规的灯光、交互提示用的电视屏。除此之外,还有一块不太常规的屏幕,那就是用于显示另外一个人的“显示仓”。而且这个显示仓的位置和角度是特意设计过的,使得望向屏幕中的人时,拍摄出来的视线恰好符合两人站在一起时的视线。如此一来,物品的交接才会显得如此自然。
(2)符合广播级稳定要求的实时通信网络
很多小伙伴可能会觉得,本质上这不就是个复杂一些的视频会议嘛,只不过级别更高、屏幕更大、清晰度更高、稳定性要求更高。非要这么说倒也没错,但是要注意的是,无论是什么技术,随着从量变到质变的过程,要解决的技术问题的数量和难度可都是非线性陡增的。要想实现类似高规格发布会的万无一失,网络传输环节要实现的保障度是远远超出大多数时候的。
比如为了能够实现发丝级的“全息复刻”,拍摄的原始画面清晰度是非常高的,如果按照传统方式传输,将挤占大量带宽,极有可能遇到网络拥堵问题。阿里云聚这次采用了一种叫作“窄带高清”的技术,能够在节省50%带宽的情况下,仍然保障画面的清晰度。
另外,即便我们使用的是运营商最高带宽的宽带套餐,日常生活中还是难免会遇到网络信号不好的情况,造成视频会议时的画面卡顿。平时会议稍微等一等倒也问题不大,但是对新闻发布会这种高级别会议,卡顿显然是无法接受的。为了能够在网络信号不好的情况下依然保持画面流程,阿里云聚开发了“弱网抗丢包”技术,能够在80% 丢包下可提供流畅通话,同等丢包环境弱网传输效率提升65%,实现良好的实施传输效果。
(3)强大的云端算法与算力
不知道大家有没有注意到,记者会现场的全息显示仓中,张勇与巴赫所处的似乎是一个封闭的空间,两个人的身后似乎有一定的纵深,墙上也有很自然的阴影效果,使得图像出现了较强的空间感。其实这种光影效果是计算机实时渲染出来的,起到了以假乱真的效果。这是需要强大的算法与计算力的。
其实需要算法与算力的远不止视频的实时渲染。比如音频的处理,我们都有过在嘈杂环境下开会的经历,要想听清对方讲话是非常困难的。阿里云聚通过亿次通话数据验证和海量历史数据回归,实现了持续进步的多场景智能降噪能力。而这同样需要算法与算力的加持。
根据研究,要想实现流畅舒适的交互效果,延时必须控制在200ms以内。
也就是说,端到端的实时传输和处理,比如音视频转码、光影渲染、音频智能降噪等等功能,都需要在200ms以内实现,这需要高效的算法与强大的算力,靠拍摄或发布会现场的端侧计算机是无法做到的。阿里云聚解决这个问题的方法是“云处理+端渲染”技术,即通过实时通信与云上处理的技术结合,解决因端侧算力受限的难题。
其实可以看得出,这次的高级别新闻发布会算是阿里云聚的一次“亮剑”:连如此高要求的场景都能hold住,其他的应用场景更不在话下。很明显,这种“宛若就在面前”的显示与交互技术,还可以应用在很多其他的应用场合,比如远程教育、虚拟社交、远程VR操控等等。而在新冠疫情的大背景下,甚至只用它来开个远程视频会,都让会议显得更温暖了呢……
看上去虽然没有什么联系,但拼凑在一起却十分和谐,几乎没有一点违和感,差点连自己都信了。
最后一句真的笑喷我 了!
1、情不知所起,一往而深,再而衰,三而竭。
初看起来,似乎有一点儿扯,但细细品味,似乎还是有那么一点道理。有些人的感情,是会越来越淡的,也许是失望太多心灰意冷,总回不到最初的时候。
2、劝君更尽一杯酒,与尔同销万古愁。
堪称是无缝链接,诗词拼接的完美之作。心忧愁绪,无法消除,多思多虑也没有什么作用,不如尽情地喝一杯酒,当真应了那一句“一醉解千愁”。
3、遥想公瑾当年,小乔初嫁了,使我不得开心颜。
亲,请大声说出你的故事。三角虐恋的玛丽苏气息扑面而来,但细想起来,声名远播的美人出嫁,想必当时有不少文人雅士暗暗扼腕叹息,不禁生出这种感慨。
4、有朋自远方来,尚能饭否?
这大概是“蹭饭”的最高境界了。远处而来的客人,甚至等不及与主人寒暄,开口便蹭饭,看来是个不折不扣的“吃货”呀!
5、在天愿作比翼鸟,大难临头各自飞。
这个,小编已经笑晕在电脑前,容我歇歇。不过唐玄宗面对兵变,忍痛赐死了杨贵妃,虽然是情势所逼迫于无奈,但又何尝不是“大难临头各自飞”呢?
6、少小离家老大回,安能辨我是雌雄?
看来出门在外的这些年,主人公受尽了不少磨难啊。
7、仰天大笑出门去,铁马冰河入梦来。
读了这一句,难免会生出一种豪迈的气概来,不由得浮现出这样一场画面:家国有难,思之不安,依然弃笔从戎,从此铁马冰河,置生死之于度外。
8、北方有佳人,遗世而独立,羽化而登仙。
本是写佳人,读到最后竟又变成了仙人,让人在仰慕的同时,又多了些敬畏感。
9、问君能有几多愁?才下眉头,却上心头。
南唐后主李煜和宋代才女李清照的词作,一问一答,竟然是如此协调。隔了上百年的历史人物,穿过了历史的长河,将“愁”这一字解说得生动别致,实在是令人佩服。
10、而今才道当时错,当时只道是寻常。
同是纳兰性德的词作,难怪无论是语义还是用字方面,都显得无比和谐。想必纳兰性德心中本就有此感慨,只是在无意间分两次写了出来。
11、满堂花醉三千客,更无一人是知音。
三千门客,无一知音,这样的事情也确实称得上“悲惨”了。然而,知音确实难寻,宁缺毋滥,其实又何妨呢?
12、君不见黄河之水天上来,流向那万紫千红一片海。
哈哈哈哈哈哈哈哈