从主营角度,$Snow是DB/DW工具,过去认为其上升不到SaaS,用PoC账户试过才看到它在自有Marketplace上提供的工具和撮合的数据中介外包服务(for Data Scientist/AI数据工程师之类),进而形成了对私共享和对公共享两种有偿计费的共享数据查询服务(数据资产交易市场),想必$Snow将从中抽取take rate%(费率应该不会超过20%),这是$Snow所称的SaaS,它为数据owner提供了数据资产变现的途径,同时作为中介帮助数据owner撮合了下游数据科学家/行研分析者的业态,以及更多的外包服务,那么它显然是SaaS,如下图。另外,如创始人所谈的Function as a service,演进完成是Serverless结构,基于API计费的Marketplace中介服务和工具链将对下层DB厂商和数据Owner更加透明,License fee更低,扩缩更快,费率计量单位更小。
另外,单纯从数据治理工具的技术角度:传统数仓的Admin Ops难度较高,存算资源的不平衡消耗使得浪费规模很大,那么$Snow工具链也解决这类问题 —— 虽然对于“跨云数仓管理”,有很多对标公司,但真实的做到跨多云DB的存算分离就不易了(如今流行各家CSP自身改造K8s实现),但单纯这方面并非不可超越,也没有太强的技术内核或者行业knowhow作壁垒,尤其国内市场会有与主流CSP适配同样好的后起之秀的。另外,倘若客体数仓的业务结构复杂(比如跨云且服务多个行业的异构、如贴源和共享层面的规模都很大),那么某种意义Snowflake反而可能增加运维风险和复杂度,客户希望随意变更数仓的业务模式可能也不再灵活。另外,如创始人所谈的Function as a Service,演进完成即是Serverless结构,基于API计费的Marketplace中介服务和工具链将对于供需两端的App/Data-owner和社群分析员更为透明,也使得DB/DW-Instance的License费率更灵活,资源供应和扩缩更敏捷,费率计量单位更小。
$Snow技术侧的价值壁垒在于:1、完全的云原生,并非传统Hadoop路线,而是从数据仓库演进到多租户的多云服务;2、计算与存储分离,且计算层无限扩容,兼容多类云平台,适用于多种公司和行业;3、供应费效比/性价比出色的DB/DW实例、Runtime工具链和一堆分布式数据工作算法;支撑企业级数仓功能完备,并且针对数据库应用开发者、数据科学家和分析师而打造的社区管理模式更加友好,为这些社区成员独立开发数据工具链项目以及咨询服务,并由此开展有偿交易提供了极大的技术和商业便利;同时,上述的这些自有组件和第三方组件能够以产品化/服务化/跨平台的形式供应和计费,这本身就是十分有技术含量的云管模式。
$Snow商业侧的价值壁垒是【工具软件的领域应用化】;它首先通过丰富的跨平台DB工具链吸引各行各业App-owner或是数据资产公司(Data-owner)订阅dPaaS实例,进而出于帮助这些业务owner拓展彼此之间的私有数据资产的协同置换以及对公变现渠道(数据资产交易市场),而建立了Marketplace中介交易平台和数据供应规则/APIs,以及,出于让这种有偿数据共享和业态的构造更加规模化,而维护的涵盖各行各业数据科学家/分析员的庞大社群,并最终撮合供需几方“在Marketplace平台的规则和API功能之内”达成外包交易或是数据商业化共享交易 —— 也就是说,$Snow通过召集数据分析员社群并撮合其与App/Data-owner客群建立业务履约进而收取第一笔take rate,同时也允许各方业务owner彼此之间发生数据有偿共享进而抽取第二笔take rate。在此期间,$Snow自身无意成为Palantir那样的拥有极致knowhow的数据科学家,反而,它通过Marketplace招募更多这样的行业数据科学家,平台自身仅居于“外包中介与协同履约的角色”提供电子结算和基于API的数据流供应规则,并为供需两端随时撮合“对私/对公”的数据商机。
而市场给予$Snow的估值方法,也是建立在【每售出一个单位的DW/DB License/Instance,可以撬动多少take rate回报,以及随着各方客群的数量增长,这种回报的长期规模效应】,这也符合Marketplace运营模式作为SaaS规模效应的主力驱动因素的经典设定。另外,相比于经典的领域型应用软件->工具化的模式(如Salesforce),$Snow可以作为工具类软件->领域应用化模式的典型例子。
关于风险。现在$Snow是在各云的Marketplace模式绑定中,主观认为它的长期竞争力和流量效应不在<跨多云数仓>本身,而在数据专家业务及其工具链社区这一部分;远期的风险来看,云厂商正在做相近的模式,即跨多云-混合云的数仓管理和存算分离模式(基于K8S的跨多云方案已经十分成熟,国内阿里云/华为云都具备同等的脱离单云绑定的方案),如此,逐渐的或许会削弱$Snow依附云厂商而建立起来的这种模式。
Snowflake的三个技术宅合伙人从大公司出来的时候,应该没想到在数据仓库(OLAP)这个大家不觉得是个好生意的领域,会做成一家千亿美金市值的公司。而在解禁前的最高点,曾经一度超过Zoom成为全球第三大SaaS企业,位列之前的是Salesforce和Shopify。
昨天是Snowflake解禁的第一天,面临流通股1.5倍的解禁股,公司意外地收复了开盘后的所有失地,市场对于这家全市场最贵的SaaS公司仍然非常有热情。
Snowflake从最初2016年那篇论文开始,《The Snowflake Elastic Data Warehouse》 是一篇当时跨时代的论文,也让云OLAP进入了一个新的时代。在这篇文章里,Snowflake提到:
相比Teradata、Oracle等On-Premise的数据仓库,Snowflake和其他的云OLAP一样:
而相比Resdshift、Synapse、BigQuery这样的三大云产品:
1,2两点就带来了Snowflake在大数据量级别的性能优势,和最方便的计算可拓展性。无论是Redshift、BigQuery或者Spectrum,都没法满足“让一张急用给老板汇报的的超大数据量Dashboard”比“其他普通需求”能够效率快得多的完成。做过BI的人应该都有过这种感觉,看着进度干着急的痛苦,这个给老板的需求很急,但来不及了……Fivetran的中立测试(https://fivetran.com/blog/warehouse-benchmark)也说明了Snowflake大数据量级别所花的时长是最短的,更何况这是在相同算力的情况下,而Snowflake还可以随时拓展算力。彩蛋的是,Fivetran也同时解释了其他测评报告为什么出现了偏颇……
SaaS/PaaS因为其计费模式的特点,我们很容易了解到他的单客户增长与什么Driver相关,就比如:
这也使得Snowflake产品本身有更稳定的NDR。(NDR是SaaS/PaaS公司衡量增长可持续性最常用到的指标,NDR=老客户在今年的月均recurring revenue/老客户在去年的月均recurring revenue)而当我们用NDR这个视角去看待Snowflake时候,却发现Snowflake的NDR与其他的企业有很大的不同。没有其他高NDR SaaS标的的新客户收入占比如此低,不到10%。
这样的差别是来自于产品和落地所带来的爬坡周期不同:
而带来这一变化的是OLAP产品的特性,以及企业上云整体的复杂安排,使得客户的爬坡周期能延长到接近2年。对于大多数企业而言,他们从OnPrem数据库迁移到云OLAP的爬坡周期可能是像下面这张图一样:
这也使得OLAP客户,可以很快地将存储打满到60-70%水平,但在计算的迁移上总是很缓慢。而在迁移完成后,因为解放了数据算力,BI分析师扩招后还会提供长期的增长。所以当Snowflake的CFO Scarpelli在业绩会上提到“未来几个季度的NDR都会非常稳定”时候也就不难理解了,独特的老客户增长特点使得这家公司的收入增速降得更慢,也能保持更长期的收入快速增长。这也让Snowflake更有机会完成10年20倍甚至30倍这样的高速收入增长。当我们拉长到25年维度看PS和PE的时候,估值就不一样了。
在很长的一段时间内,我们都认为交易型数据库OLTP比起分析型数据库/数据仓库OLAP,是个更好的生意。因为OLTP与开发环境/生产环境相关,有更高的迁移壁垒,比OLAP多快一倍的预算,以及与业务发展直接的调用次数关系。但现在随着数据利用效率的直线上升,这个变化正在改变。调研了解到的很多美国的集成商,都一致反映他们手上的OLAP订单增速比OLTP快得多。数据的使用可能正在经历,或者还需要经历两次飞跃性的变化:
当我们去审视现在的互联网企业的时候,字节跳动、拼多多这样数据驱动上升到价值观的企业已经站在了第二次跳跃的中后期,不少产品经理甚至运营都可以自主写SQL进行一线的数据分析。衡量腾讯这样的古典产品经理主导的公司,还停留在第一次和第二次跳跃的中间。产品经理需要向BI提出需求,需求要在类似JIRA的系统中排期,而到了BI在分析的时候,还会严重受制于数据仓库的性能、不同部门数据仓库的割裂,以及数据治理上的严重问题。从而使得大部分的数据研究只能供给决策层汇报时使用。而到了更多数量的传统企业,他们远远没有达到腾讯的使用效率,还停留在第一次跳跃前的阶段。而在5到10年后,我们甚至有可能经历第三次数据使用效率的飞跃:SQL像Excel一样成为员工的基础技能。而这也需要更可视化的界面,和更高度集成的语言。而随着Python在青少年和大学生中的进一步普及,这很可能不是一件难事。回顾到20年之前,做报表要用Excel、做估值要用Excel搭模型,也是难以想象的。
好的SaaS企业能够依托迁移壁垒最高的阵地,进行横向或者纵向拓展,典型的案例就是并购王Salesforce和扎根医疗的Veeva。
Snowflake也有一个很好的阵地,数据仓库是最接近基础设施的SaaS阵营,在SaaS上可以展开更多的应用产品:
最有想象力的还是Snowflake希望做成的Data Cloud设想,搭建一个可以自由数据交易的Marketplace,或者按我们通俗的理解”数据的应用商店“。比起三大云的Marketplace,Snowflake肯定有优势。多云属性使得客户存在任何一个IaaS厂商数据,都可以进入Snowflake的市场。与传统的数据使用方式相比,可以直接在OLAP内与自身的数据做关联,不需要二次导入到Python里。
从现在进度来看:
举一个不恰当的例子,很多互联网的业内人士都了解过之前的路由器数据市场,有很多我们耳熟能详的数据买家。如果有更安全、更合规的数据售卖,使用的场景也可以非常广泛。
对于Snowflake大部分的攻击都在于”OLAP的技术壁垒不高,三大云发力很容易追上“对于在大公司内积累了丰富失败经验的我,有很深刻的体会。在回答要不要破釜沉舟的时候,总得回答几个问题:
但如果退一步想,一个发展迅速的第三方OLAP,刺激了客户在云厂商更大的存储需求,并且没有影响到三大云互相之间的IaaS竞争格局,还证明了SaaS/PaaS的Marketplace是正确的平台发展策略。又怎么权衡呢?
中国是与美国是不同的土壤。中国最大的特点是:
这也使得国内能够给类似Snowflake这样公司提供的客户群比美国要少。云厂商,是现在就拥抱云原生,困难但坚持引导客户全都上公有云。还是满足客户的现有需求,帮他们配置OnPrem或者私有云,还是争论的焦点。而到了创业公司,因为客户群小的原因,在技术投入上也很难直接采用ROLAP的路线。
好消息是Snowflake引入国内的脚步越来越近了,我们终究应该拥抱更好的产品。
怎么没人提《圣斗士星矢》啊?
这个系列作品的特色不就是回回都是一部的戏就半天时间么?
黄道十二宫篇:纱织中了天箭座的箭,必须12小时内突破圣域十二宫。
北欧篇:奥丁代言者希露达被海皇戒指蛊惑令冰川融化,纱织代替希露达阻止冰川融化但是只能坚持12小时,必须在时限内摘下希露达的戒指。
海皇篇:纱织代替人类承受波塞冬的洪水,应该也是只能支撑一天之内的时间。
冥王十二宫篇:被哈迪斯复活的圣斗士要在12小时内取下雅典娜的首级,实际目的则是为了雅典娜去冥界并且唤醒女神圣衣,12小时候被复活的圣斗士们就消失了。
冥界篇:记不清打了多长时间,但从纱织被塞到缸里抽血开始到解决应该也是一天之内。
黄金魂:在本篇剧情里有好几天,但对应到冥界篇时间仅仅发生在冥界篇12黄金击破叹息之墙到打死神之间。
火星篇:马尔斯获得阿丽娅的权杖后建立起巴别塔吸引火星,会在12小时内毁灭地球,主角们必须在12小时内突破新十二宫。
土星篇:这篇好像打了很多天……
梁思申家庭,从剧中的暗示来看,应该是49年之前的上海工商业者。他们家至少他父母这一支还算是爱国的,49年之后并没有跑路而是留了下来,属于政治上靠得住的工商业者,文革之后被国家启用。
这样的家庭基本上在海外都有亲属,改革开放之后才重新联系上,这也是梁思申改革开放之后选择移民国外的原因之一。
梁思申自视甚高,她说自己没有歧视,但宋运辉说得对,她就是歧视了。她确实想促成中国的发展,但另一方面她心里已经内化了西方资本的逻辑,她认为中国要发展,做西方的附庸就是理所应当的。她并不知道,也没想过,为什么重点国企必须由中国掌握控股权的原因,也不在乎,只要她能完成这笔投资,受到老板的表扬,她的价值就实现了。
剧中对梁思申这一路人的小心思写的是很好的。这就是改革开放中华人华侨的真实想法。
她和宋运辉的矛盾,不是谁和谁斗气,或者性格冲突,而是根本立场不同。对梁思申来说,单子能谈成,中国市场开拓出来,她就实现了自己在美国人中的价值;但是对宋运辉,他就必须考虑中国化工几年甚至几十年之后的长远利益,为了这些利益,政治底线是不能退让的。
梁思申说自己受了歧视,实际上和宋运辉说的歧视并不是一回事。梁说的,是她作为美国华人所受到的种族歧视,这种歧视,宋和大部分中国人当然没有体会,也没有理由就要体会。毕竟梁还是要在美国社会混的,宋和大部分中国人不需要。
宋说的歧视,则是西方大公司利用自己的优势地位,并不把中国当做平等的合作伙伴,而是趁机控制中国的经济命脉。这点,梁实际上是不在乎的。毕竟,就算控制了又能怎么样?梁还是吃香的喝辣的,大不了回美国去。
对吉恩一路人来说,梁当然就是个工具。毕竟买办永远也不可能和老板真的平起平坐。
当然,梁思申并不坏,我相信她主观上也是想为中国好的。但是她长期受美国的教育,认为中国处处落后,美国的一定先进,所以自己有先天的权力去决定东海应该如何如何,还自以为是为中国好,实际上就是个二鬼子。
宋运辉也不傻,这点他肯定早就看透了,但是为了合资,一直到吃饭之前都没捅破。宋也一直在和日本还有其他公司联系,该摊牌就摊牌,可见也没有对梁这边报不切实际的希望。
大结局了补充一下:最后两集说明梁的层次还是比宋差远了。她以谈判为要挟,不仅救不了宋,而且会让上级部门更加怀疑宋和梁有不正当的交易。她以为靠自己就能扳动洛达,靠一个洛达就能改变党的组织原则。而她实际上就是个工具人,不可悲么?
最后她和宋的谈话,宋对她是大失所望的。本来吃饭的时候,宋以为她回来投资是为了帮助中国的建设,结果因为她自己的一点私心,说不投就不投了。她看得上的人就行,其他中国人统统不行。我相信随着改革的深入,梁思申这种人如果不改变自己看问题的方式,会走到完全西化派的路子上。