2023年12月13日至15日,“2023第二屆數據治理年會暨博覽會”在北京展覽館隆重舉辦。本屆大會由中國電子信息行業聯合會主辦,以“數據強基、智領未來”為主題,展示中國數據治理成果。上海羅盤公司作為數據治理行業先行者,也應邀參加此次博覽會,集中展示數據治理體系和能力建設成果。
在數字化轉型大背景下,“數據是企業的核心戰略資產”已然成為社會共識。然而金融行業數據資產運營目前普遍存在“錨不定”,缺少企業級數據戰略,業數融合不足;“驅不動”,缺少業務和運營思維,以技術為驅動的推進模式,缺乏升級活力;“配不對”,數據資產運營沒有形成閉環機制,高質量數據供給不足,導致供給和需求錯位匹配等諸多問題,金融行業要想充分挖掘數據潛能,更好的實現數據驅動和數據資產入表,離不開數據資產運營在背后的“百煉成金”。
針對這些問題,上海羅盤憑借多年的行業積累和先進的技術實力提出了自己的解決方案,并且榮獲了“2023數智杯數據管理創新應用大賽智能化數據治理應用賽道優秀獎”。這表明上海羅盤的數智化解決方案已經獲得了行業內的高度認可。
具體問題具體分析,上海羅盤為客戶解決實際痛點
據悉,本次上海羅盤獲獎項目的具體客戶是上海期貨交易所。
需要指出的是在證監會發布《證券期貨行業分類分級指引》以后,交易所作為證券期貨行業的核心機構,它的職能除了提供交易場所確保公平交易以外,還有一個很重要的職能是進行監管。
因此他的分類分級要求是要做到全覆蓋,但是客戶的數據量又比較龐大,也是百萬級的元數據,并且項目一期做了比較長的時間,二期的資產盤點人力投入還是比較大,主要工作就是將系統中的表和字段與前期項目中梳理出來的資產目錄和資產項進行物理映射,另外就給表和字段分配相應的安全級別以滿足后續對數據安全的精細化管理,因此客戶期望能夠通過智能化手段來完成這一過程。
為了解決客戶的這一痛點,首先在模型的構建上,上海羅盤創新性的將百度的ERNIE模型和DPCNN深度神經網絡模型進行融合。這兩大模型各有各的優勢,其中百度的ERNIE模型,它是一個基于知識遮蔽策略的語言表征預訓練模型,在上海羅盤的測試當中,他的效果超過了Google的BERT模型,而DPCNN深度神經網絡模型,則在解決文本的長距離依賴上比較有優勢。
其次在模型的訓練上,上海羅盤采用了k折交叉驗證、數據增強及分詞等方法來不斷增強模型的泛化能力和輸出效果。
最后在智能化落地上,可以分為以下幾個步驟,第一步是自動捕獲元數據的變更,然后創建盤點任務,提交給AI模型進行盤點,盤點結果可以導出進行人工復核和調整,調整結果經過評審以后就可以一鍵提交入庫了。其中AI模型盤點的結果給出了表和字段對應資產目錄和資產項的推薦映射關系及安全級別,可以分為已有資產項、新增資產項和新增資產目錄三大類,已有資產項的判定標準是表匹配度達到40%,字段匹配度達到80%,新增資產項的判定標準是表的匹配度已達40%但是字段匹配度未達80%,新增資產目錄的判定標準是表的匹配度沒達到40%,這就意味著現有的資產目錄已經不能滿足該表的分類需求,需要增加新的資產目錄了。至于這個匹配度的判定閾值還可以進行參數化設置。
正是因為上海羅盤為客戶找準了真正的痛點、提供了有針對性的方案,使得整個項目獲得了客戶和行業的認可。而這背后則是上海羅盤長年深耕這一行業帶來的實踐積累。
知中行、行中知,上海羅盤商業化進程不斷加快
眾所周知,做學問不能只一味的空談,要從實踐中來到實踐中去,實現知行合一;做企業亦是如此,要平衡好技術開發和商業化之間的關系,為客戶創造價值,從而獲得長期發展的動力。
上海羅盤也是深諳此道,其始終致力與為企業提供最佳數據服務,一直秉承“從理論到實踐,再從實踐到理論的飛躍”。
以前文提及的上海期貨交易所為例,上海羅盤助力其實實在在實現了降本增效。根據上海羅盤的估算,上線智能化盤點功能以后,數管部用戶不用再頻繁去找業務部門用戶核對資產項信息了,整體資產盤點流程工作效率提升達到30%以上。減少了兩個專職崗位,到目前為止給客戶節約成本超過120萬,這個是按照人均30萬年成本,從功能上線到現在估算出來的,而且還沒有考慮和業務部門溝通占用的業務部門資源成本,上海羅盤也因此獲得了客戶的高度認可。
此外這個項目的另一層意義還在于提供了一個可復制的商業模式和案例。管理學大師彼得·德魯克曾說過:“當今企業之間的競爭,不是產品之間的競爭,而是商業模式之間的競爭”。
在企業成長的過程中,將優秀的商業模式和案例復制到新的項目中,成為很多企業做大做強歷程中的必經之路。并且選擇可復制的商業模式還可以幫助企業節省大量的成本。
根據賽迪顧問《金融科技發展白皮書》數據,2016-2020年,我國金融科技市場規模保持增長態勢,增速保持在10%左右。2022年,中國金融科技整體市場規模達到5423億元左右。也就說2023年中國金融科技的整體市場規模在6000億左右。
面對這樣一個廣闊的市場,有優秀的可復制的商業案例,將為上海羅盤持續拓展客戶提供有力的支撐。
面對不同的客戶需求,上海羅盤具有差異化服務能力
在此背景下,面對不同的客戶需求,能否具有差異化服務能力變成了決定企業能否具有長期生命力的又一關鍵。
而上海羅盤的EDGS自2016年投產至今,成功服務200+大型客戶,已經積累較多用戶群體,涉及金融、類金融、互聯網、制造業等不同領域。并且也在不斷地升級更新當中。
能服務不同領域的不同客戶,說明了上海羅盤公司的產品已經有了差異化和精細化的優勢。
產品差異化上,在數據資產治理系列產品上,面對數據治理工作專業化、獨立化程度提升,上海羅盤產品能夠解決企業全面綜合數據治理和專題數據治理多樣性、專業化訴求。其是由多個模塊組成的整套解決方案,致力于幫助企業控制數據風險、運營數據資產、發掘數據價值。產品以元模型為核心、元數據為基礎、AI算法為支撐,數據管理流程為紐帶,實現了數據從被創建到退役全生命周期管理。EDGS自2016年投產至今,已經積累較多用戶群體,涉及金融、類金融、互聯網、制造業等領域。并且也在不斷地升級更新當中。
在數據資產應用系列產品上,在相較市場大多提供的封閉且重型數據中臺應用產品,難以滿足大量探索性強、需求變化快且反復、難以固化成專業數據系統的分析需求,上海羅盤產品能夠以低耦合的架構,低成本AI場景賦能、短平快持續交付、全流程安全管理,解決數據最后一公里的廣泛業務訴求。
隨著技術的不斷進步和市場的不斷變化,數據資產運營將面臨更多的挑戰和機遇。未來,企業需要更加注重數據的活性管理和綜合評價,釋放數據價值。為此,上海羅盤也將在數據資產運營領域持續創新,結合數據能力優勢,幫助金融機構推進數據資產的創新實踐,真正實現數據資產化、數據要素化,打造金融機構數字時代的新引擎。