百科问答小站 logo
百科问答小站 font logo



如何评价snowflake这家公司,发展前景如何? 第1页

  

user avatar   zhangshujia 网友的相关建议: 
      

从主营角度,$Snow是DB/DW工具,过去认为其上升不到SaaS,用PoC账户试过才看到它在自有Marketplace上提供的工具和撮合的数据中介外包服务(for Data Scientist/AI数据工程师之类),进而形成了对私共享和对公共享两种有偿计费的共享数据查询服务(数据资产交易市场),想必$Snow将从中抽取take rate%(费率应该不会超过20%),这是$Snow所称的SaaS,它为数据owner提供了数据资产变现的途径,同时作为中介帮助数据owner撮合了下游数据科学家/行研分析者的业态,以及更多的外包服务,那么它显然是SaaS,如下图。另外,如创始人所谈的Function as a service,演进完成是Serverless结构,基于API计费的Marketplace中介服务和工具链将对下层DB厂商和数据Owner更加透明,License fee更低,扩缩更快,费率计量单位更小。

另外,单纯从数据治理工具的技术角度:传统数仓的Admin Ops难度较高,存算资源的不平衡消耗使得浪费规模很大,那么$Snow工具链也解决这类问题 —— 虽然对于“跨云数仓管理”,有很多对标公司,但真实的做到跨多云DB的存算分离就不易了(如今流行各家CSP自身改造K8s实现),但单纯这方面并非不可超越,也没有太强的技术内核或者行业knowhow作壁垒,尤其国内市场会有与主流CSP适配同样好的后起之秀的。另外,倘若客体数仓的业务结构复杂(比如跨云且服务多个行业的异构、如贴源和共享层面的规模都很大),那么某种意义Snowflake反而可能增加运维风险和复杂度,客户希望随意变更数仓的业务模式可能也不再灵活。另外,如创始人所谈的Function as a Service,演进完成即是Serverless结构,基于API计费的Marketplace中介服务和工具链将对于供需两端的App/Data-owner和社群分析员更为透明,也使得DB/DW-Instance的License费率更灵活,资源供应和扩缩更敏捷,费率计量单位更小。

$Snow技术侧的价值壁垒在于:1、完全的云原生,并非传统Hadoop路线,而是从数据仓库演进到多租户的多云服务;2、计算与存储分离,且计算层无限扩容,兼容多类云平台,适用于多种公司和行业;3、供应费效比/性价比出色的DB/DW实例、Runtime工具链和一堆分布式数据工作算法;支撑企业级数仓功能完备,并且针对数据库应用开发者、数据科学家和分析师而打造的社区管理模式更加友好,为这些社区成员独立开发数据工具链项目以及咨询服务,并由此开展有偿交易提供了极大的技术和商业便利;同时,上述的这些自有组件和第三方组件能够以产品化/服务化/跨平台的形式供应和计费,这本身就是十分有技术含量的云管模式。

$Snow商业侧的价值壁垒是【工具软件的领域应用化】;它首先通过丰富的跨平台DB工具链吸引各行各业App-owner或是数据资产公司(Data-owner)订阅dPaaS实例,进而出于帮助这些业务owner拓展彼此之间的私有数据资产的协同置换以及对公变现渠道(数据资产交易市场),而建立了Marketplace中介交易平台和数据供应规则/APIs,以及,出于让这种有偿数据共享和业态的构造更加规模化,而维护的涵盖各行各业数据科学家/分析员的庞大社群,并最终撮合供需几方“在Marketplace平台的规则和API功能之内”达成外包交易或是数据商业化共享交易 —— 也就是说,$Snow通过召集数据分析员社群并撮合其与App/Data-owner客群建立业务履约进而收取第一笔take rate,同时也允许各方业务owner彼此之间发生数据有偿共享进而抽取第二笔take rate。在此期间,$Snow自身无意成为Palantir那样的拥有极致knowhow的数据科学家,反而,它通过Marketplace招募更多这样的行业数据科学家,平台自身仅居于“外包中介与协同履约的角色”提供电子结算和基于API的数据流供应规则,并为供需两端随时撮合“对私/对公”的数据商机。

而市场给予$Snow的估值方法,也是建立在【每售出一个单位的DW/DB License/Instance,可以撬动多少take rate回报,以及随着各方客群的数量增长,这种回报的长期规模效应】,这也符合Marketplace运营模式作为SaaS规模效应的主力驱动因素的经典设定。另外,相比于经典的领域型应用软件->工具化的模式(如Salesforce),$Snow可以作为工具类软件->领域应用化模式的典型例子。

关于风险。现在$Snow是在各云的Marketplace模式绑定中,主观认为它的长期竞争力和流量效应不在<跨多云数仓>本身,而在数据专家业务及其工具链社区这一部分;远期的风险来看,云厂商正在做相近的模式,即跨多云-混合云的数仓管理和存算分离模式(基于K8S的跨多云方案已经十分成熟,国内阿里云/华为云都具备同等的脱离单云绑定的方案),如此,逐渐的或许会削弱$Snow依附云厂商而建立起来的这种模式。



user avatar   lazarchow 网友的相关建议: 
      

Snowflake的三个技术宅合伙人从大公司出来的时候,应该没想到在数据仓库(OLAP)这个大家不觉得是个好生意的领域,会做成一家千亿美金市值的公司。而在解禁前的最高点,曾经一度超过Zoom成为全球第三大SaaS企业,位列之前的是Salesforce和Shopify。

昨天是Snowflake解禁的第一天,面临流通股1.5倍的解禁股,公司意外地收复了开盘后的所有失地,市场对于这家全市场最贵的SaaS公司仍然非常有热情。

1.从16年的Snowflake论文开始

Snowflake从最初2016年那篇论文开始,《The Snowflake Elastic Data Warehouse》 是一篇当时跨时代的论文,也让云OLAP进入了一个新的时代。在这篇文章里,Snowflake提到:

  • AWS的EC2和S3已经很好了,要做一个完全云原生的系统
  • 现在主流的是Sharing Nothing的数据库架构(Teradata和AWS Redshift),这个架构主要的问题就是计算和存储没有分离,所以会导致:1)当集群增扩容的时候,需要重新分配数据;2)不容易Shut off不用的计算资源,始终会有浪费
  • Snowflake要在Share Disk的基础上做一个计算和存储完全分离的架构,称作Multi Cluster,Share Data Architecture,这个新架构有不少好处:1)Share Disk是个老概念,原来的瓶颈是计算资源加多了后,会争抢Disk资源,Snowflake根据调用频次给数据做了多备份和缓存,减少了摩擦成本;2)在这个体系里,计算和存储是双重弹性的,大的Query可以从计算层调用非常大的资源;3)Snowflake将计算层划分出了不通的Virtual Warehouse,而且分成不同的级别,就像“S、M、L、XL不同的T-shirt,客户公司里不同高矮胖瘦的人都可以选到合身的”

2.论文所描述的也成为了产品的特点

相比Teradata、Oracle等On-Premise的数据仓库,Snowflake和其他的云OLAP一样:

  • 性能快,十倍级别的快:这是部署方式的问题,是云调度能力和弹性带来的高利用率。
  • 好拓展:所有的On-Premise数据仓库用到后面都越用越慢,供需错配在任何行业都是个难题,更何况交给企业数据部门这样一个成本中心来做,发起预算配置新的机器都是漫长的过程。

而相比Resdshift、Synapse、BigQuery这样的三大云产品:

  • Snowflake的底层基本都是用Java重写,没有沿用其他的开源框架
  • Snowflake可以让大数据量需求用128 Servers跑,让小数据量需求用2 Servers跑,然后再按计算量*时长计费。技术架构带来的存算分离远比三大云同行要彻底,这不是定价模式的改变,而是技术架构决定了这样的定价模式是合理的
  • 多云的中立性。如果同时使用AWS和Azure存储的客户,用起Snowflake这样的跨云系统,也更加方便。
  • 数据仓库通常是PaaS产品,但标准化的Snowflake做成了SaaS产品。简单易上手,Oracle的DBA也可以迅速适应。SQL结果可以和可视化BI一键切换,Data Sharing安全管理也很好用。

1,2两点就带来了Snowflake在大数据量级别的性能优势,和最方便的计算可拓展性。无论是Redshift、BigQuery或者Spectrum,都没法满足“让一张急用给老板汇报的的超大数据量Dashboard”“其他普通需求”能够效率快得多的完成。做过BI的人应该都有过这种感觉,看着进度干着急的痛苦,这个给老板的需求很急,但来不及了……Fivetran的中立测试(fivetran.com/blog/wareh)也说明了Snowflake大数据量级别所花的时长是最短的,更何况这是在相同算力的情况下,而Snowflake还可以随时拓展算力。彩蛋的是,Fivetran也同时解释了其他测评报告为什么出现了偏颇……

3.NDR隐藏了Snowflake发展增速的秘密

SaaS/PaaS因为其计费模式的特点,我们很容易了解到他的单客户增长与什么Driver相关,就比如:

  • Zoom的单客收入增长与员工数相关,企业在发展的时候员工数就会变多,下滑的时候也会遇到裁员
  • Twlio和Agora的单客收入增长与C端用户数或者使用时长相关,那我们抽象一下就是直接挂钩客户产品的DAU
  • 但Snowflake代表的OLAP是和数据存量和BI分析师数目相关,产品的DAU会下降但数据存量却是上升的,而到现在企业所雇佣的BI人数增速也远远要比开发和产品要快得多,因为BI的基数小。

这也使得Snowflake产品本身有更稳定的NDR。(NDR是SaaS/PaaS公司衡量增长可持续性最常用到的指标,NDR=老客户在今年的月均recurring revenue/老客户在去年的月均recurring revenue)而当我们用NDR这个视角去看待Snowflake时候,却发现Snowflake的NDR与其他的企业有很大的不同。没有其他高NDR SaaS标的的新客户收入占比如此低,不到10%。

这样的差别是来自于产品和落地所带来的爬坡周期不同:

  • 对于大多数SaaS,“今年的客户增长”代表的就是“今年的收入增长”。1-2年后的老客户,很难再提供高速的收入增长。就好比Zoom这样的产品,三个月内就可以让所有员工形成远程开会的习惯。打个比方客户可能是第一年花了100块,第二年花了150块,第三年花了180块。
  • 但对于Snowflake这样的产品,,“今年的客户增长”代表的可能是”两年后的收入增长”。新客户可能第一年花了100块,第二年花了300块,第三年花了500块。

客户的增速被延迟了,报表的收入满足感也被延迟了。

而带来这一变化的是OLAP产品的特性,以及企业上云整体的复杂安排,使得客户的爬坡周期能延长到接近2年。对于大多数企业而言,他们从OnPrem数据库迁移到云OLAP的爬坡周期可能是像下面这张图一样:

这也使得OLAP客户,可以很快地将存储打满到60-70%水平,但在计算的迁移上总是很缓慢。而在迁移完成后,因为解放了数据算力,BI分析师扩招后还会提供长期的增长。所以当Snowflake的CFO Scarpelli在业绩会上提到“未来几个季度的NDR都会非常稳定”时候也就不难理解了,独特的老客户增长特点使得这家公司的收入增速降得更慢,也能保持更长期的收入快速增长。这也让Snowflake更有机会完成10年20倍甚至30倍这样的高速收入增长。当我们拉长到25年维度看PS和PE的时候,估值就不一样了。

4.抽象去看OLAP行业,天花板仍然在不断提高

在很长的一段时间内,我们都认为交易型数据库OLTP比起分析型数据库/数据仓库OLAP,是个更好的生意。因为OLTP与开发环境/生产环境相关,有更高的迁移壁垒,比OLAP多快一倍的预算,以及与业务发展直接的调用次数关系。但现在随着数据利用效率的直线上升,这个变化正在改变。调研了解到的很多美国的集成商,都一致反映他们手上的OLAP订单增速比OLTP快得多。数据的使用可能正在经历,或者还需要经历两次飞跃性的变化

  • 第一次:OnPrem迁移到云olap。因为在OnPrem的环境里,受制于运算能力,企业只能雇佣这么多BI,到了云Olap后展开算力后,反过来也需要更多的BI。
  • 第二次:云Olap后,降低了SQL的使用门槛和易用性,不再有环境部署、安装、教学的难题。更多的岗位可以跑SQL。公司的组织架构也可能调整,让数据更加流通。

当我们去审视现在的互联网企业的时候,字节跳动、拼多多这样数据驱动上升到价值观的企业已经站在了第二次跳跃的中后期,不少产品经理甚至运营都可以自主写SQL进行一线的数据分析。衡量腾讯这样的古典产品经理主导的公司,还停留在第一次和第二次跳跃的中间。产品经理需要向BI提出需求,需求要在类似JIRA的系统中排期,而到了BI在分析的时候,还会严重受制于数据仓库的性能、不同部门数据仓库的割裂,以及数据治理上的严重问题。从而使得大部分的数据研究只能供给决策层汇报时使用。而到了更多数量的传统企业,他们远远没有达到腾讯的使用效率,还停留在第一次跳跃前的阶段。而在5到10年后,我们甚至有可能经历第三次数据使用效率的飞跃:SQL像Excel一样成为员工的基础技能。而这也需要更可视化的界面,和更高度集成的语言。而随着Python在青少年和大学生中的进一步普及,这很可能不是一件难事。回顾到20年之前,做报表要用Excel、做估值要用Excel搭模型,也是难以想象的。

5.Snowflake的业务不止在OLAP领域

好的SaaS企业能够依托迁移壁垒最高的阵地,进行横向或者纵向拓展,典型的案例就是并购王Salesforce和扎根医疗的Veeva。

Snowflake也有一个很好的阵地,数据仓库是最接近基础设施的SaaS阵营,在SaaS上可以展开更多的应用产品:

  • 最典型的就是向BI和Machine Learning拓展。Snowflake的BI产品正在测试,而ML也有很好的技术基础,在底层数据自动化上已经超过了同行。
  • 也可以纵向向生产链的上游拓展,例如与OLTP连接的Data Integration,Snowpark或者未来的其他产品可以给客户一个云原生的选择。
  • 也可以横向向非结构化数据拓展,统一的查询平台在未来也会与Databricks有更多的交集。

最有想象力的还是Snowflake希望做成的Data Cloud设想,搭建一个可以自由数据交易的Marketplace,或者按我们通俗的理解”数据的应用商店“。比起三大云的Marketplace,Snowflake肯定有优势。多云属性使得客户存在任何一个IaaS厂商数据,都可以进入Snowflake的市场。与传统的数据使用方式相比,可以直接在OLAP内与自身的数据做关联,不需要二次导入到Python里。

从现在进度来看:

  • 好的方面是,Data Marketplace的使用率已经从一年多的不到5%,提高到现在的23%。大多数的客户都是在最近三年加入Snowflake的,经历了两年的爬坡周期,他们刚刚安顿下来,有了使用外部数据或者变现数据的需求。
  • 难的方面是,数据变现对于大多数客户不是很有必要,而且还面临隐私和数据安全的问题。需要期待客户的数据部门从成本中心,思考是否要成为利润中心时,能不能找到可以变现的脱敏数据源。现在还主要停留在地理、风控、市场等信息,卖家也主要是第三方数据生产商。
  • 而长远来看,共同的数据格式和使用习惯也是逐年提高的产品壁垒。数据好不好外,也需要数据方不方便用。

举一个不恰当的例子,很多互联网的业内人士都了解过之前的路由器数据市场,有很多我们耳熟能详的数据买家。如果有更安全、更合规的数据售卖,使用的场景也可以非常广泛。

6.大公司在抵御Snowflake时的困局

对于Snowflake大部分的攻击都在于”OLAP的技术壁垒不高,三大云发力很容易追上“对于在大公司内积累了丰富失败经验的我,有很深刻的体会。在回答要不要破釜沉舟的时候,总得回答几个问题:

  • 这项业务对我有多重要?是占到云收入2%的自有OLAP重要,还是锁定一个IaaS客户,为他提供更开放的应用层环境重要?
  • 对人才有多大的吸引力?我能给得起创业公司更高的待遇和职业路径吗,会打破我现有的薪酬体系吗,我的股票值钱还是创业公司的股票值钱?毕竟这样一个业务放在Snowflake就是千亿美金市值,但放在AWS体内隐含的市值可能也就100亿美金水平。
  • 有多重的历史技术包袱?开发OLAP时候,有的是收购来的框架(Redshift)有的是基于自己公司使用发展的路径(BigQuery)有的适用现有IaaS中小客户的需求(Synapse),值得我进行技术路线的重写吗?
  • 能够与竞对合作到什么层面?Redshift和Synapse都发布了和对方的打通合作策略,以对抗Snowflake的多云中立性,但比起可能流失一个IaaS客户,OLAP的意义有多重要?又怎么保证双方产品在技术上同时迭代,有相同的吸引力?如果不同时迭代,那迭代慢的那方,岂不是吃亏了……
  • 中台和KPI层面能提供多大的重视?对于IaaS厂商来说,销售、架构师通常都会负责所有的产品,二线优先级的产品应该提高到多大的重要程度?KPI又怎么能保证这样收入低、毛利高的产品受到销售重视?这不是产品的问题,这是组织架构和管理导向的问题。
  • 还有内部各部门之间的协调。不过计算业务估计不会介意OLAP部门改用存算分离后,由于减少冗余造成的计算使用量减少,毕竟给了IaaS客户更好的产品体验。

但如果退一步想,一个发展迅速的第三方OLAP,刺激了客户在云厂商更大的存储需求,并且没有影响到三大云互相之间的IaaS竞争格局,还证明了SaaS/PaaS的Marketplace是正确的平台发展策略。又怎么权衡呢?

7.中国有Snowflake式产品的土壤吗?

中国是与美国是不同的土壤。中国最大的特点是:

  • 传统企业,尤其是国企和金融企业,有去IOE的需求,更信赖私有云
  • 互联网企业的CTO和CIO都非常自信,认为自己搭一个开源的OLAP更好,而且只用适配自己,不看长期的更新和功能需求的话,短期来看效果说不定更好。

这也使得国内能够给类似Snowflake这样公司提供的客户群比美国要少。云厂商,是现在就拥抱云原生,困难但坚持引导客户全都上公有云。还是满足客户的现有需求,帮他们配置OnPrem或者私有云,还是争论的焦点。而到了创业公司,因为客户群小的原因,在技术投入上也很难直接采用ROLAP的路线。

好消息是Snowflake引入国内的脚步越来越近了,我们终究应该拥抱更好的产品。


user avatar   yaoling-lc 网友的相关建议: 
      

怎么没人提《圣斗士星矢》啊?

这个系列作品的特色不就是回回都是一部的戏就半天时间么?

黄道十二宫篇:纱织中了天箭座的箭,必须12小时内突破圣域十二宫。

北欧篇:奥丁代言者希露达被海皇戒指蛊惑令冰川融化,纱织代替希露达阻止冰川融化但是只能坚持12小时,必须在时限内摘下希露达的戒指。

海皇篇:纱织代替人类承受波塞冬的洪水,应该也是只能支撑一天之内的时间。

冥王十二宫篇:被哈迪斯复活的圣斗士要在12小时内取下雅典娜的首级,实际目的则是为了雅典娜去冥界并且唤醒女神圣衣,12小时候被复活的圣斗士们就消失了。

冥界篇:记不清打了多长时间,但从纱织被塞到缸里抽血开始到解决应该也是一天之内。

黄金魂:在本篇剧情里有好几天,但对应到冥界篇时间仅仅发生在冥界篇12黄金击破叹息之墙到打死神之间。

火星篇:马尔斯获得阿丽娅的权杖后建立起巴别塔吸引火星,会在12小时内毁灭地球,主角们必须在12小时内突破新十二宫。

土星篇:这篇好像打了很多天……


user avatar   sheng-dong-huo-po-68 网友的相关建议: 
      

梁思申家庭,从剧中的暗示来看,应该是49年之前的上海工商业者。他们家至少他父母这一支还算是爱国的,49年之后并没有跑路而是留了下来,属于政治上靠得住的工商业者,文革之后被国家启用。

这样的家庭基本上在海外都有亲属,改革开放之后才重新联系上,这也是梁思申改革开放之后选择移民国外的原因之一。

梁思申自视甚高,她说自己没有歧视,但宋运辉说得对,她就是歧视了。她确实想促成中国的发展,但另一方面她心里已经内化了西方资本的逻辑,她认为中国要发展,做西方的附庸就是理所应当的。她并不知道,也没想过,为什么重点国企必须由中国掌握控股权的原因,也不在乎,只要她能完成这笔投资,受到老板的表扬,她的价值就实现了。

剧中对梁思申这一路人的小心思写的是很好的。这就是改革开放中华人华侨的真实想法。

她和宋运辉的矛盾,不是谁和谁斗气,或者性格冲突,而是根本立场不同。对梁思申来说,单子能谈成,中国市场开拓出来,她就实现了自己在美国人中的价值;但是对宋运辉,他就必须考虑中国化工几年甚至几十年之后的长远利益,为了这些利益,政治底线是不能退让的。

梁思申说自己受了歧视,实际上和宋运辉说的歧视并不是一回事。梁说的,是她作为美国华人所受到的种族歧视,这种歧视,宋和大部分中国人当然没有体会,也没有理由就要体会。毕竟梁还是要在美国社会混的,宋和大部分中国人不需要。

宋说的歧视,则是西方大公司利用自己的优势地位,并不把中国当做平等的合作伙伴,而是趁机控制中国的经济命脉。这点,梁实际上是不在乎的。毕竟,就算控制了又能怎么样?梁还是吃香的喝辣的,大不了回美国去。

对吉恩一路人来说,梁当然就是个工具。毕竟买办永远也不可能和老板真的平起平坐。

当然,梁思申并不坏,我相信她主观上也是想为中国好的。但是她长期受美国的教育,认为中国处处落后,美国的一定先进,所以自己有先天的权力去决定东海应该如何如何,还自以为是为中国好,实际上就是个二鬼子。

宋运辉也不傻,这点他肯定早就看透了,但是为了合资,一直到吃饭之前都没捅破。宋也一直在和日本还有其他公司联系,该摊牌就摊牌,可见也没有对梁这边报不切实际的希望。


大结局了补充一下:最后两集说明梁的层次还是比宋差远了。她以谈判为要挟,不仅救不了宋,而且会让上级部门更加怀疑宋和梁有不正当的交易。她以为靠自己就能扳动洛达,靠一个洛达就能改变党的组织原则。而她实际上就是个工具人,不可悲么?

最后她和宋的谈话,宋对她是大失所望的。本来吃饭的时候,宋以为她回来投资是为了帮助中国的建设,结果因为她自己的一点私心,说不投就不投了。她看得上的人就行,其他中国人统统不行。我相信随着改革的深入,梁思申这种人如果不改变自己看问题的方式,会走到完全西化派的路子上。




  

相关话题

  计算机专业应该如何发展? 
  特朗普当选美国总统会对硅谷造成什么影响? 
  Python/Pandas如何处理百亿行,数十列的数据? 
  大数据是不是泡沫? 
  如何看UCBerkeley RISELab即将问世的Ray,replacement of Spark? 
  硅谷最值得去的餐馆有哪些?有什么推荐餐品? 
  从硅谷回国后有什么感想? 
  在美国硅谷生活到底是什么感觉? 
  如何评价美剧《硅谷》(Silicon Valley)第六季第五集(S06E05)? 
  大数据听着很牛,实际上也很牛吗? 

前一个讨论
如何评价英特尔(Intel)将NAND业务出售给韩国SK海力士(SK Hynix)?
下一个讨论
《海边的卡夫卡》中令你印象最深刻的话?





© 2024-12-27 - tinynew.org. All Rights Reserved.
© 2024-12-27 - tinynew.org. 保留所有权利