首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|芯片報告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 論壇 >> 正文

運營商大數(shù)據(jù)建模的五個方向

2017年11月21日 16:46  與數(shù)據(jù)同行(ysjtx_fyp)  作 者:傅一平,就職于浙江移動大數(shù)據(jù)中心

運營商的大數(shù)據(jù)有價值毋容置疑,筆者在《PK BAT大數(shù)據(jù)?談?wù)勥\營商大數(shù)據(jù)的價值》一文中有詳細(xì)的闡述,但當(dāng)前面對的挑戰(zhàn)不少。


“為什么公司擁有這么多大數(shù)據(jù),好像對于內(nèi)部經(jīng)營的改善還不多!”


“對外價值變現(xiàn)的收入還不怎么夠看,什么原因呢?”


“建立了大數(shù)據(jù)平臺,采集了很多數(shù)據(jù),投資什么時候回本呢?”


當(dāng)然可以有很多的理由,諸如組織、機制、流程、人才等等原因,老生常談了,特別是安全像達摩克利斯劍一樣懸在胸前。


但除了外部客觀因素,也需要思考一下,是否也有內(nèi)生的原因?當(dāng)前的運營商新增大數(shù)據(jù)的質(zhì)量真的經(jīng)受得住市場的檢驗嗎?


在運營商內(nèi)部經(jīng)營中,似乎賬單、用戶、訂購、話單老的小數(shù)據(jù)仍然是分析的主要數(shù)據(jù),也是營銷的主要依賴數(shù)據(jù),諸如位置、上網(wǎng)、社交、信令等很多大數(shù)據(jù)似乎“名不符實”, 實際用的還比較少,什么原因呢?


當(dāng)然有推廣培訓(xùn)的因素,但筆者還認(rèn)為有更重要的原因,即這些大數(shù)據(jù)的“原生價值”有限,只有經(jīng)過加工,比如建模,才能讓這些數(shù)據(jù)發(fā)揮出真正的價值。


舉個例子,說運營商的上網(wǎng)數(shù)據(jù)有價值,那運營商上網(wǎng)的原始記錄是怎樣的呢?這里以http為例:


這個冰冷的URL對于網(wǎng)絡(luò)性能分析可能有價值,比如可以統(tǒng)計京東APP的流量啥的, 但與結(jié)構(gòu)化的ARPU、MOU等能直接用于營銷的小數(shù)據(jù)相比,業(yè)務(wù)人員似乎沒有什么手段去獲得這個URL承載的信息或知識。


高喊著運營商DPI數(shù)據(jù)有價值沒有意義,談DPI被HTTPS也有點杞人憂天,運營商需要用工匠的精神去挖掘出這些數(shù)據(jù)的潛力,這些數(shù)據(jù)就如浮在海面上的冰山,你只看到了10%,90%都沉在下面,然后束手無策:


互聯(lián)網(wǎng)公司跟運營商也是有合作的,他們對于DPI數(shù)據(jù)是非?粗氐,馬上能拿去變現(xiàn),差距在哪里呢? 當(dāng)然有渠道的因素,但不僅于此。


很大的差距就在于數(shù)據(jù)加工能力,一般有兩個層面的含義,解析和建模,解析是把原生的數(shù)據(jù)加工成可以使用的結(jié)構(gòu)化業(yè)務(wù)信息,建模是基于這個信息再去挖掘出知識,以下統(tǒng)一稱為建模能力。


筆者總結(jié)了運營商大數(shù)據(jù)需要具備的五個核心建模能力,社交網(wǎng)絡(luò)、序列模式、空間建模、內(nèi)容挖掘及在線推薦,這對于運營商未來的內(nèi)外規(guī);儸F(xiàn)至關(guān)重要。


當(dāng)前運營商最大的變現(xiàn)應(yīng)用,逃不過用戶信息的驗真及基于位置的客流、旅游、公安等等,這些都還是淺層次的應(yīng)用。


客戶的應(yīng)用一旦深入,很多運營商大數(shù)據(jù)應(yīng)用的底層數(shù)據(jù)的質(zhì)量恐怕會面臨挑戰(zhàn),現(xiàn)在有不少的應(yīng)用場景由于數(shù)據(jù)的原因而無法推進,比如上海迪士尼樂園關(guān)于位置數(shù)據(jù)精度的要求,雖然商業(yè)前景極其廣闊,但其對于數(shù)據(jù)的要求卻是及其嚴(yán)苛的,這個在未來激烈的市場競爭中會成為常態(tài),現(xiàn)在能賺錢的并不代表客戶一直愿意為你買單,筆者常常想,換成我是客戶,我會為這些產(chǎn)品買單嗎,運營商產(chǎn)品給我到底帶來了什么價值?


想到了炒股總有虧有賺的,最終的贏家似乎還是價值投資者,不求一時但求長遠(yuǎn),運營商也許需要一步一個腳印,用厚重來打造出自己的大數(shù)據(jù)優(yōu)勢,以下五個建模能力也許能支撐起運營商大數(shù)據(jù)的未來。


1、社交網(wǎng)絡(luò)


運營商以前的營銷都是基于個人的營銷,隨著家庭市場、政企市場、簇群市場的崛起,運營商未來必將以群體營銷為一個核心,今天跟杭分的一個同事交流,給了我一個啟示,未來所有的流量營銷可能都要以家庭為單位,你必須知道每個人的家庭關(guān)系,才能對于家庭成員進行精細(xì)的分析,才能得到新的群體營銷機會。


政企也許也這樣,你必須找到集團的關(guān)鍵人物,才能進行一次營銷,客戶經(jīng)理縱有通天的本領(lǐng),你也不知道新的集團什么時候產(chǎn)生,什么時候有新的營銷機會,你總是滯后的,也許,社交網(wǎng)絡(luò)可以幫到他。


業(yè)界用的很成熟的PageRank,運營商似乎也沒怎么用,仍然用交往圈大小來粗獷的判斷一個用戶的影響力, 關(guān)系和影響力也未在運營商的營銷中占據(jù)一個位置,能否改變一下用通信arpu判斷用戶價值的方式?


在對外變現(xiàn)中,客戶已經(jīng)有家庭,朋友,同事方面的標(biāo)簽要求了,未來這類需求將會越來越多。


簇群營銷一定會茁壯成長,換終端,用戶更愿意相信身邊朋友的推薦和建議,看視頻,我其實更關(guān)注朋友們在追蹤啥,這些,對于運營商都是機會,因為維系著一張最硬的社交網(wǎng)絡(luò),這張網(wǎng)絡(luò)的價值不僅僅是以前的通信價值,未來的社交價值將越來越大。


2、序列模式


運營商傳統(tǒng)營銷中基于ARPU、流量等進行規(guī)則限制的營銷都屬于靜態(tài)營銷,丟失了大量有價值的時間信息,比如月末流量飽和度高和月初流量飽和度高反映了不同的需求,但營銷中可能仍然一視同仁,因為尋找頻繁序列需要一定的建模技能。



中國移動的天盾反欺詐系統(tǒng)正是通過信令的時間序列建模精準(zhǔn)的進行了欺詐的識別和攔截,天盾只是一個簡單的案例,運營商還有位置序列、通話序列、上網(wǎng)序列、短信序列以及這些序列的組合,基于這些序列運營商可以挖掘到更有價值的信息,比如曾經(jīng)在某個地市的位置序列中發(fā)現(xiàn)固定的人群的遷移規(guī)律,序列代表了一種生活規(guī)律,也許,商機就蘊藏在這些序列中,有待于運營商去挖掘。


3、空間建模


運營商當(dāng)前80%的商業(yè)變現(xiàn)估計是基于位置數(shù)據(jù)創(chuàng)造的吧,但運營商的空間能力可遠(yuǎn)不止于此。


 

隨著運營商變現(xiàn)的深入,商業(yè)驅(qū)動著運營商會去做位置精度的持續(xù)提升,從基于基站的幾百米到MR的幾十米再到幾米,當(dāng)前浙江移動的位置精度已經(jīng)到了商場級別了,位置精度的提升也帶來了產(chǎn)品能力的提升,如下圖所示:

位置是理解客戶的一把鑰匙,新零售創(chuàng)新的一個抓手,運營商最為寶貴的數(shù)據(jù)財富,將隨著精度的提升創(chuàng)造無限的應(yīng)用場景。


4、內(nèi)容挖掘


運營商的原生DPI價值不大,但通過網(wǎng)址解析、爬蟲和文本挖掘,就可以讓DPI數(shù)據(jù)產(chǎn)生巨大的價值,這是毋容置疑的,以下圖一是爬蟲邏輯,圖二是爬取的示意,圖三是獲得的知識庫示意。

從DPI中的URL可以獲得有效的爬蟲網(wǎng)址,通過爬蟲獲得知識庫信息,這將能真實的反應(yīng)是否是用戶點擊了某部電影,某首歌曲,某本書等等, URL的解析能力和知識庫的規(guī)模決定了運營商DPI數(shù)據(jù)的價值。


如果獲得的是文本信息,可以采取文本挖掘技術(shù),比如信息抽取,文本摘要、文本聚類和文本分類等,從而構(gòu)建出用戶的內(nèi)容偏好,以下是一個示例:


從數(shù)據(jù)的角度看,運營商管道是不是啞了不是由互聯(lián)網(wǎng)說了算,而是由運營商的建模能力決定,諸如電商https影響很大,但這個世界很大,并不是僅僅只有電商,互聯(lián)網(wǎng)的長尾效應(yīng)還是很長的。


但內(nèi)容挖掘涉及的技術(shù)很多,爬蟲系統(tǒng)得靠自己建,知識庫建立需要較大的人力投入和維護成本,自然語言處理+搜索也不是那么容易搞定,對于運營商挑戰(zhàn)實在有點大,但運營商一定要堅持做這個,從管道中逼真的還原用戶的行為,這個才是未來。


5、在線推薦


隨著新零售口號的響起,線上線下融合也將在運營商刮起旋風(fēng),運營商強大的線下能力逐步要為線上引流了,線上的大數(shù)據(jù)最大價值就是推薦吧,智能推薦技術(shù)將是運營商必須掌握的建模技術(shù)。


這個領(lǐng)域門檻不是很高,但起步也并不容易,浙江移動的咪咕愛看是個視頻APP,推薦大家下載使用,經(jīng)常有流量優(yōu)惠和贈送,性價比很高哦,近期上線的猜你喜歡欄目采用的推薦引擎是如下四個模型的綜合:

習(xí)慣了線下目標(biāo)用戶群用經(jīng)驗規(guī)則取數(shù)的業(yè)務(wù)人員,從線下轉(zhuǎn)到線上,除了營銷渠道發(fā)生了變化,推薦方式也有了巨大改變,要相信智能推薦技術(shù)會比人工經(jīng)驗好,這是為互聯(lián)網(wǎng)公司證明了的,只要迭代次數(shù)夠多,模型就能實現(xiàn)千人千面,這一點,要向互聯(lián)網(wǎng)公司學(xué)習(xí),人工選擇的熱門推薦當(dāng)然也不錯,但機器學(xué)習(xí)推薦是有長尾效應(yīng)的,比如亞馬遜假如總是向我推薦最熱門的書籍就沒啥意義了。


五大數(shù)據(jù)模型,是筆者認(rèn)為運營商進一步提升自身數(shù)據(jù)價值要去努力的方向,它是基于運營商特有數(shù)據(jù),綜合采用爬蟲、社交網(wǎng)絡(luò)、搜索、推薦、自然語言處理等技術(shù)才能打造出來的,正如互聯(lián)網(wǎng)公司花了很大代價去做ID-MAPPIN1NG一樣,這些都是核心能力,需要運營商以工匠的精神去傾力打造。

編 輯:章芳
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。如網(wǎng)站內(nèi)容涉及作品版權(quán)和其它問題,請在30日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時間刪除內(nèi)容。本站聯(lián)系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內(nèi)容核實”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
工信部張云明:大部分國家新劃分了中頻段6G頻譜資源
精彩專題
專題丨“汛”速出動 共筑信息保障堤壩
2023MWC上海世界移動通信大會
中國5G商用四周年
2023年中國國際信息通信展覽會
CCTIME推薦
關(guān)于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像