图片来源:Unsplash
记者:娄晓晶
2020年9月16日,美国云数据仓库公司Snowflake在纽交所上市,这匹云端独角兽创造了史上规模最大的软件业界募资案例,市值达到700亿美元。声称已经54年没有参与过新股发售的、并且鲜少认同科技股的巴菲特旗下的伯克希尔-哈撒韦公司也参与了这次IPO。
Snowflake成立于2012年,是一家为企业提供云原生数据仓库的企业。在Snowflake云数据仓库中,企业不仅可以存储大规模的数据,还可通过机器学习算法等应用进行数据处理。
Snowflake营收的快速增长和上市后的股价表现对于中国的云上企业服务软件公司来说,意味着什么?中国的百亿美金云上独角兽在哪里?
2020年11月中,企业级开源分布式数据库厂商PingCAP宣布完成了2.7亿美元D轮融资。从2015年创立到完成D轮融资,在融资之冬、企业服务之春里完成新一轮融资的PingCAP在似乎可以部分还原“寻找中国Snowflake”的故事,中国的投资人正在展开对更多片“雪花们”的捕捉。
数据库与开源文化
近年来,国内的互联网和移动互联网应用发展奇快,用户量、交易量、数据量及其增量已经是世界第一。当用户的数据量大到一定级别,比如当单表超过5000万条或者1亿条数据时,过去的数据库和数据库集群已经不能很好地支撑业务需求,有的甚至开始频繁宕机,公司业务受到很大影响。
PingCAP创始人、CEO刘奇在京东担任资深系统架构师时,就深刻感受到传统数据库性能的痛点,以及国内市场对新型数据库的庞大需求。
刘奇开始思考,能不能设计一个工具,既可以保持像原来操作Oracle和MySQL一样的易用性,让用户轻松上手,同时又能获取一个弹性伸缩架构,创造一款NewSQL产品?
2013年,谷歌Spanner论文发布,2014年Raft论文发布。刘奇反复研读这几篇论文,论文的理论为分布式数据库NewSQL为创造工具解决传统数据库痛点提供了理论基础。
刘奇与豌豆荚时期的两位同事黄东旭、崔秋决定通过自己的技术去挑战新时代的数据库痛点,并用自己热爱的开源Open Source方式解决这个巨型问题。
像硅谷公司大多都有个车库故事一样,许多北京海淀区的创业公司都有蛰伏居民区的起点。PingCAP的创业也是从西二旗一间小屋开始,只有一块小白板、几台电脑和三、四个工程师就开始起步。最开始时,未来的分布式关系型数据库TiDB只有算法概念,没有完整的产品。刘奇和联合创始人们写了第一版,并在每周六上午10点在海淀区“专家国际公馆”举行技术沙龙。
刘奇还记得,第一次沙龙“Infra Meetup”只来了两个外部参会人员,一位来自京东,另一位来自华为。后来,来参加沙龙的人陆续变多,起初的成员都成了社区贡献代码的活跃分子,TiDB产品也在工程师们对开源社区的数据贡献与测试中不断成形。
PingCAP由此创立了分布式关系型数据库TiDB,辅助企业关键业务。作为开源分布式数据库,TiDB弹性伸缩的架构具备云原生的特性,可以轻松部署在任何公有云、私有云和混合云之上,以降低用户的总体拥有成本(TCO),提升资源利用率。
偶然的机会,云启资本董事总经理陈昱看到了PingCAP的项目商业计划书。
PingCAP创造的TiDB让陈昱回想起Google的分布式关系型数据库Spanner和F1。在谷歌纽约办公室工作时,昔日程序员陈昱的座位和Spanner的第三作者相隔不远,二人经常分享产品的研发心得。曾有15年编程经验的职业习惯促使陈昱花了一个下午把TiDB 的代码核心看了一遍,就像当年做codereview一样。
另外,华为和京东已经加入TiDB的开源社区也让陈昱感到惊讶,作为一个年轻的开源系统,就能吸引到大体量公司的技术人员参与到开源社区中,其背后的研发杠杆潜力巨大。
陈昱辗转通过前豌豆荚员工联系上了刘奇,只聊了5分钟到10分钟,时任云启资本副总裁的陈昱就确定这是一个值得去跟进的项目,“可能还是一个非常大型的项目”。
在很长一段时间内,中国的VC投资也会参考美国的趋势,对标美国的公司。当时中国还没有专门关注科技类公司的VC,云启在国内是较早专注技术类项目的基金。
陈昱注意到,美国的科技投资人已经开始关注大数据领域,判断国内大数据领域也会跑出有潜力的公司。从遥远的大赛道中跳回眼前,陈昱觉得PingCAP把稳定、灵活的数据库变成大众产品这件事,应该是一个百亿美金市场。
刘奇在早期需要花费许多时间向投资方解释数据库、开源社区与潜在的商业模式。“我们融资的特点是快,因为懂的就懂了,不懂的可能短期内也没法看懂。”这让PingCAP的早期融资并不太顺利。看懂了代码的陈昱火速做了决定,随后在A轮阶段领投。
除了PingCAP,云启资本也通过早期领投和连续跟投ZILLIZ、Jina AI等项目,在该“数字基建”中的“Infra&开源”领域布局。
“Infra&开源”:基础软件的商业价值在哪里?
数字基础设施infra,指云计算基础设施、基础层数据存储与处理、云原生代表技术,且这类公司和产品多以开发者为用户,即做的是to D市场,开源是常见模式。
在开源社区里,PingCAP产品的contributors、commits、stars等数据一直增长很快。开源模式之下,全球的优秀开发者都是PingCAP产品的贡献者。截止到2020年10月,TiDB项目在GitHub上已总计获得超过25000颗星,近1200位开源代码贡献者,步入全球知名的开源软件厂商行列。
开源到底意味着什么?在产品不断迭代更新之外,PingCAP的开源社区文化凝聚了大批工程师。
2020年3月,PingCAP CTO黄东旭在TiDB 4.0 发布在即时,发起了一个邀请:他计划约一波TiDB社区伙伴,在当周周五21:00至周日21:00的48小时之内,写一本关于TiDB的技术书籍。
截止周日,共有102位来自社区的作者参与,共同完成了开源电子书《TiDB in Action》第一版,全过程在Zoom会议室中随时沟通,并在B站公开直播。
工程师们积极参与的社区文化让PingCAP实现了48小时之内写本书的任务,而参与贡献者获得了“只有贡献者才能”获得的定制版T恤。
开源富有创造力,但是否具有商业能力?
“过去大家都会想,开源软件所有人都拿得到,为什么要付费?把开源产品源代码改个名加上‘企业级特性’卖给企业级用户,就是成功的唯一路径?”
在刘奇看来,其实底层的数据库服务对当代创业公司就像“电力”一样,使用者其实并不关心电厂修在哪儿,也不关心电厂用的是水电或者火电,只有使用的需求。而过往的数据库却需要企业投入人力物力,来自己“搭电厂”。
而PingCAP在开源社区中积累的技术能力就像搭建了一家先进的巨型电厂,从而可以为各类企业提供灵活、弹性的分布式数据库管理方案,企业可以订阅数据库服务或者只调用服务,其他的都交给PingCAP来处理,商业化随之即可完成。
在陈昱看来,开源文化协助技术派公司完成了D端的“营销推广”,不需要养大规模的销售团队,开源就是公司的营销杠杆。
“在美国市场上,开源公司MongoDB和Elastic分别在2017年和2018年上市,市值分别超过150亿和90亿美金。一般SaaS类的上市企业在二级市场会有10倍的PS(市销率),但是开源的项目市市销率可以达到20倍以上。另外,即便是未上市的企业,估值表现也非常不错,例如Databricks、Confluence、HashiCorp等,估值都超过50亿美元。”陈昱说。
而在华创资本管理合伙人吴海燕看来,基础软件的变革是不可忽视的趋势。华创资本从16年开始关注infra基础设施领域,并列出了华创在软件投资里的“大纲”和关键词。除了从2014年开始就在投资的 SaaS,她还认为,云时代即将全面到来,IT基础架构的底层变革、云安全技术的兴起讲成为必然,这也将给创业公司提供大量机会。
2016年下半年,华创在与软件社区的开发者们交流时,发现许多开发者都推荐了 PingCAP 团队。2017年初,吴海燕拜访了PingCAP团队,CTO黄东旭把复杂的技术缘起、产品细节、应用场景简明讲完。数据库作为互联网的底层应用,这个领域有技术挑战、商业挑战,要从底层创新,是高难度的创作动作。
虽然公司还没有一张商业化订单,只有100多位社区客户,但CEO刘奇对公司的估值很坚持,高过了吴海燕的预期。“我当时冷静下来想,关系型数据库在世界范围内是一个每年500亿美金的市场,其中有许多像Oracle一样千亿美金市值的公司,像PingCAP所做的在云端重塑数据库的事,可能是个百亿美金级别甚至更大潜力的事业。”
吴海燕另外要考虑的问题是,一家中国公司能不能成为在国际上有竞争力的公司,完成这个百亿美金的任务?与团队接触下来,吴海燕发现,对于上一代国产软件公司来讲,成为一家全球化的企业服务公司看起来可能是一个“不可能任务”。但是,在新一代公司里,以最好的工程师人才加上世界顶级场景中锻炼的实践能力,让中国公司的机会变得更具可能性。
最终,吴海燕接受了超出预期的估值,华创在2017年领投了PingCAP的B轮融资,并在C轮继续跟投。
迄今,PingCAP在世界范围内已被多家企业用于线上生产环境,如Square(美国)、PayPay(日本)等。PingCAP 在2020年预计收入可达亿级水平,其中海外市场与国内市场收入持平,海外市场收入可能首次略超过国内营收。
变革的时代
对于中国企业服务创业公司的片片snowflake(雪花)来说,它们面临的到底是一个什么样的时代?
在此之前,企业服务领域SaaS应用端的创新不时涌现。过往在中国市场不被看好的开源以及数字基础设施层的项目,成为不少科技赛道投资人的关注焦点。
图片来源:华创资本
在吴海燕看来,对这一代基础软件创业者来说,当下是最好的时刻。
近年来,国内创新由互联网、移动互联网领域To C到To B的企业服务应用层接连兴起,也会刺激应用层之下的底层发生创新,以反哺应用层的需求。而云计算发展到一定程度,也在向下突破底层基础设施的局限,基础设施变革的转折点已经到了。新一代的数据库产品具有非常大的成长机会。
根据IDC发布的报告,到2024年,50%的大型中国企业将在容器、开源和云原生应用开发方面依赖于第三方服务提供商。 而国内的互联网行业锻炼了一大批大数据和云计算的工程师,具有全世界最丰富的工程师人才。吴海燕认为,如果说行业也有天时地利人和,中国的云基础软件行业正当其时。
在Infra基础软件领域,华创陆续早期布局了PingCAP、TigerGraph、才云、云杉等项目,覆盖了分布式数据库、图数据库、容器云、SDN、智能运维、企业级身份管理等多个细分领域。
Fastdata极数数据显示,自2017年来,企业服务领域领域融资总金额超一万亿元,底层技术创新的机会之窗挤满了看风景的人。
2020年上半年融资趋势图(图片来源:Fastdata极数)
然而在应用场景创新位于全球前列后,企业服务端的创业公司能走多远?中国snowflake何时诞生?
在数据库技术社区墨天轮的国产数据库排行榜中,有PingCAP研发的TiDB,也有阿里巴巴体系下的OceanBase和PolarDB等国产数据库开始占领市场。
图片来源:墨天轮国产数据库排行榜10月数据
关系型数据库之外,从新型的图数据库、到向量搜索引擎、深度学习框架等领域,也涌现了一批中国的基础软件团队。其中有数据处理公司Zilliz和Apache软件基金会项目Apache Kylin核心团队创建的AI增强数据仓库公司Kyligence等等。
“PingCAP本轮融资对整个中国的基础软件来说是一个很大的鼓舞。首先,大家不会再有偏见,说中国做不出好的基础软件出来。其次,会激励更多的创业者投身于这个领域,做的人越多,中国以后出现伟大的基础软件公司的概率就会越大。”陈昱说。
随着行业独角兽的诞生,中国基础软件迎来企业服务的发展浪潮,在世界范围内最先进的应用场景下是否会诞生一批像Snowflake、甚至超越Snowflake的公司,只有时间会给予证明。