公司專注于大數據領域,技術原創性強,產品矩陣完整。
1.技術原創性強,產品自主可控,與國產生態適配性強
公司成立于2013年,其核 心研發團隊曾任職于英特爾,在英特爾基于Apache Hadoop 1.x技術研發開源的 Hadoop發行版產品,是行業中較早探索、研發大數據技術的團隊。在具有一定技術 積累的基礎上,公司通過自研大數據技術逐步取代開源技術,經過多年的發展,軟 件產品自主率行業領先。截止2021年11月,其核心產品大數據基礎平臺TDH代碼自 主率為74%。此外,相較于數據庫產品,公司開發的大數據平臺產品的定位更為綜 合。面向數據接入、處理、存儲、查詢檢索、分析挖掘等全生命周期,公司已形成 大數據與云基礎平臺、分布式關系型數據庫、數據開發與智能分析工具的軟件產品 矩陣,產品在金融、能源、電信、交通等行業廣泛應用。

公司大數據產品在開源技術的基礎上進行了較大比例的自研開發,技術壁壘較高。 公司在開源技術的基礎上,進行了較大比例的自研開發工作,其大數據產品在高并 發事務處理、多模型融合分析以及多方數據安全協作等方面具有較高的技術壁壘。 公司對開源技術的核心組件實現了自研替換,包括YARN資源調度組件、Storm流處理組件以及HDFS分布式存儲管理系統。公司自研的大數據平臺產品采用分布式、云 原生等技術,不僅在逐漸替代傳統的關系型數據庫產品,而且在部分應用場景中實 現了對Cloudera和Oracle等海外公司數據庫產品的國產替代。
公司的大數據和數據庫產品與國產軟硬件基礎平臺產品有較強的適配性。公司完成 了和多個國產硬件平臺的適配,支持在一個集群內允許多個不同的硬件架構(如X86 架構和國產鯤鵬、飛騰、龍芯等架構)混合部署,能夠更好的讓用戶實現逐步的國 產化替代進程。分布式分析型數據庫ArgoDB已經完成和飛騰、鯤鵬等國產硬件及麒麟、UOS 等國產操作系統的深度適配。分布式交易型數據庫KunDB支持X86與各種 國產芯片架構,以及CentOS、RedHat、UOS、麒麟等國內外主流的操作系統,能 夠運行在異構CPU架構以及多種操作系統混合部署的集群環境中。我們認為,公司 在國產軟硬件生態的適配性具有相對優勢,預計將受益于金融、電信等行業信息系 統的國產替代進程。

公司的大數據產品較好滿足公共部門數字化轉型的需求。隨著公共部門數字化轉型 的深化,政務數據體系存在統籌管理機制不健全、供需對接不順暢、共享應用不充 分、標準規范不統一、安全保障不完善等問題。2022年9月,國務院印發了《全國 一體化政務大數據體系建設指南》,提出了加強數據匯聚融合、共享開放和開發利 用的要求。我們認為,公司的大數據平臺產品具備的多源異構數據融合分析能力較 好的滿足了政務數據融合聯通的需求,未來有望受益于政務大數據體系建設。公司 在政務數據平臺領域已具有一定項目經驗。例如,公司給上海市大數據資源平臺提 供的數據云平臺TDC產品支撐全市數據的歸集,為各類數據治理工作提供多樣化存 儲和計算能力,保障對外服務的時效性、可靠性,提升上層數據應用的安全性。 公司營收快速增長,金融和公共部門行業客戶貢獻營收較大。
公司營收由2018年的 1.1億元增長至2021年的3.3億元,CAGR為43.1%。在金融、公共部門和能源等行業 數字化轉型的需求旺盛的背景下,公司推出的大數據基礎平臺TDH、數據云平臺TDC 等產品較好的滿足了海量、異構、多源數據處理和分析的需求,相應產品在各行業 快速滲透,帶動營收快速增長。2022年前三季度,公司營收1.7億元,同比增加24.8%。 分行業來看,2021年,金融和公共部門客戶貢獻營收分別為1.4億元和9232萬元, 占營收比重分別為42.6%和27.9%。
1. 在金融領域,公司不僅提供數據倉庫、數據分析等常用的大數據產品擴大客戶覆 蓋面,還拓展了智能風控、隱私計算等業務,深度挖掘客戶價值。公司已覆蓋監 管機構、交易所、銀行、證券公司等金融機構。2021年,金融領域客戶貢獻營收同比增長35.8%。 2. 在公共部門領域,公司的大數據產品有效推動數據基礎設施的構建,滿足了政務 信息化、民生服務、社會治理、市場監管等相關應用需求。2021年,公共部門 領域客戶貢獻營收同比增長54.8%。 3. 此外,在能源領域,公司大數據產品在國家電網、南網集團等公司落地,推動其 數字化轉型。2021年,能源領域客戶貢獻營收3552萬元,同比增長36.7%,占 營收比重為10.7%。

公司已在多個行業實現了國產替代。相較于海外競品,公司在技術架構、SQL兼容 性、存儲管理系統方面實現了較大的技術進步,對Oracle、Elastic以及Cloudera等 公司的大數據產品實現了國產替代。公司的大數據基礎平臺TDH、分布式分析型數 據庫ArgoDB以及智能分析工具Sophon已在金融、能源、制造、交通等多個行業實 現了關鍵信息系統的國產替代。2019-2021年,公司具有國產替代功能相關軟件產 品收入分別為1.1億元、1.3億元和1.8億元,占總營收比重59.4%、42.4%和42.2%。
2.大數據基礎平臺是營收主力,標準化軟件產品授權占比有所提升
大數據基礎平臺業務是營收主力,產品交付以軟件授權為主。在數字化基礎設施建 設過程中,公司主要為客戶提供數字化基礎設施底層、中間層的基礎軟件和技術服 務,支持客戶進行數字化轉型。公司具體主要提供以下產品和服務:1. 大數據基礎 軟件業務包括大數據與云基礎平臺、分布式關系型數據庫、數據開發與智能分析工 具等標準軟件及配套技術服務,以軟件產品授權的方式交付為主,毛利率較高。2021 年,該業務營收2.6億元,同比增長18.4%,占營收比重為79.9%。2. 應用與解決方 案,主要針對具體應用場景,提供大數據存儲、處理以及分析等相關場景下的咨詢 及定制開發等服務的解決方案。3. 此外,公司根據客戶及項目需求銷售少量第三方 軟件、硬件等其他業務。
公司的大數據基礎平臺產品主要按照節點收費。在分布式架構中,一個計算節點一 般對應一臺服務器。在軟件產品授權模式下,公司的大數據基礎軟件主要按照節點 數量收費。大數據基礎平臺TDH作為公司成熟的產品品類,功能全面,性能優異, 其銷售量較大且呈現逐年增長的趨勢。2021年,TDH銷售節點數量為5416個,同比 增長40.7%;TDH均價1.43萬元/節點,較2020年的單價也有所增長。相較于TDH, 其他產品的單節點均價更高,但銷量仍處于爬坡過程中。2021年,TDC、TDS、Sophon、 ArgoDB和KunDB的單節點均價分別為4.7萬元、1.9萬元、7.3萬元、7.4萬元和4.1 萬元。公司在金融、公共部門、能源等領域已經具有一定的用戶粘性。我們認為, 單價更高的軟件產品有望實現在老客戶中的拓展銷售,從而提升單客戶價值。

2021年,公司軟件產品授權收入占總營收比重有所提升。2021年,公司軟件產品授 權收入為1.2億元,同比增長61.4%,占營收比重為35.9%。2019-2021年,公司軟 件產品授權及配套服務業務占營收比重分別為49.6%、30.5%和20.7%。我們認為, 公司產品在商業化落地過程中,偏定制化的配套服務占比正逐漸減少,標準化軟件 產品交付的營收占比有望持續提升。
公司軟件產品及技術服務業務毛利率逐年上升。軟件產品授權過程基本只涉及產品 安裝和交付,不涉及技術服務,因此其毛利率較高。2019-2021年,軟件產品授權 毛利率分別為96.9%、97.2%和97.3%。此外,隨著軟件產品標準化程度及客戶IT技 術水平逐漸提高,公司提供的安裝服務成本逐年下降。2019-2021年,軟件產品授 權及配套服務毛利率分別為51.8%、58.1%和61.4%,呈現出逐年提升的趨勢。總體 而言,隨著標準化軟件產品占總營收比重逐漸提升,公司的軟件產品及技術服務業 務毛利率逐年上升。2019-2021年,軟件產品及技術服務業務毛利率分別為64.4%、 66.3%和71.8%。
3.營收現階段以大數據平臺各組件為主,數據庫營收快速增長
公司現階段的營收來源以大數據計算引擎、分析組件為主。公司各軟件品類中,大 數據基礎平臺TDH占總營收比例較大。分拆來看,其各組件中實現營收較多的以關 系型分析引擎Inceptor、實時流計算引擎Slipstream以及科學計算平臺Sophon Discover等組件為主,而寬表數據庫Hyperbase、圖數據庫StellarDB等數據庫產品 實現營收占比較低。我們認為,計算引擎、分析組件等大數據平臺關鍵核心組件是 公司過去的研發重點。經過多年迭代,核心組件的性能已具有較強競爭力,是營收 主力。
公司大數據平臺代碼自主化率較高,技術原創性更強,自研組件品類豐富。公司在 開源技術的基礎上,對數據存儲層、計算引擎層、編譯器層、資源管理層等核心功能進行了重構,基本實現底層技術的自主研發。根據工信部電子五所出具的《代碼 掃描測試報告》,截止2021年11月,其核心產品大數據基礎平臺TDH代碼自主率為 74%;截止2022年5月,數據云平臺TDC代碼自主率為73%。我們認為,相較于國 內外廠商,公司的大數據產品自研占比較高,更加滿足在部分場景自主可控、安全 可靠的要求。此外,公司的技術原創性更強,自研的組件和產品更加豐富,下游應 用場景覆蓋面更廣。
TDH、ArgoDB和Sophon等產品已實現部分場景的國產替代。TDH和ArgoDB產品 不僅憑借分布式架構的優勢對傳統數據庫Oracle、IBM DB2以及Teradata等傳統數 據庫實現了較好的替代,還以較高的性價比和安全性實現了Ealstic Search、CDP等 海外分布式架構數據產品的替代。此外,公司開發的智能分析工具Sophon自2014 年至今持續迭代,其內置的分布式統計算法、機器學習算法可實現在大數據集上高 校的復雜統計和預測性分析,對于海外智能統計分析工具SAS有較好的替換效果。 目前,公司的大數據基礎平臺TDH、分布式分析型數據庫ArgoDB以及智能分析工具 Sophon已在金融、能源、制造、交通等多個行業實現了關鍵信息系統的國產替代。
公司數據庫營收快速增長,占總營收比重持續提升。在軟件產品授權模式下,2021 年,公司的寬表數據庫Hyperbase、搜索型數據庫Scope、分析型數據庫ArgoDB、 圖數據庫StellarDB和交易型數據庫KunDB分別實現營收1036萬元、1030萬元、839 萬元709萬元和101萬元。各數據庫產品雖然營收規模較小,但其增速較快。 2019-2021年,在軟件產品授權模式下,公司數據庫產品實現的營收分別為1644萬 元、2332萬元和3716萬元,營收CAGR為50.3%。我們認為,公司的研發采取自底 向上、由核心到應用的策略,在底層核心組件實現較大比例自研的情況下,未來有 望向各數據庫研發投入更多資源。各類數據庫產品功能不斷完善、性能持續提升, 其實現的營收有望保持快速增長趨勢。
公司分布式數據庫產品代碼自主化率較高,在國產替代方面更具優勢。根據工信部 電子五所出具的《代碼掃描測試報告》,截止2022年2月,交易型數據庫KunDB代 碼自主率為74.3%;截止2022年5月,分析型數據庫ArgoDB代碼自主率為90.6%。 我們認為,公司的數據庫產品自研占比較高,更加滿足在部分場景自主可控、安全 可靠的要求,在對海外產品進行國產替代過程中具有相對優勢。2021年3月,中央 國家機關政府采購中心發布關于中央國家機關2021年數據庫軟件協議供貨采購項目 成交公告,公司ArgoDB和KunDB已入圍數據庫管理系統供應商名單。 公司的寬表數據庫Hyperbase、圖數據庫StellarDB等非關系型數據庫推出時間早、 迭代時間久,具有較強的競爭力,營收規模相對較大。
公司的關系型數據庫ArgoDB 和KunDB分別于2018、2019年推出,其升級迭代時間較短。此外,在分布式關系型 數據庫領域,華為的GaussDB、阿里云的OceanBase通過自研開發,持續迭代,已 具備一定技術積累。云計算公司憑借軟硬件基礎設施的綜合能力以及公有云部署的 優勢,其關系型數據庫已在多個行業、多個場景廣泛落地。因此,我們預計,公司 的關系型數據庫產品ArgoDB和KunDB預計將面臨比非關系型數據庫領域更大的競 爭壓力。