【標簽畫(huà)像系列】標簽評分,大量標簽如何進(jìn)行系統治理
標簽評分是標簽治理的一個(gè)重要措施,通過(guò)打分可從各個(gè)維度評估標簽,掌握標簽真實(shí)使用情況,進(jìn)行標簽持續優(yōu)化,助力業(yè)務(wù)運營(yíng)。那么,要如何進(jìn)行標簽評分呢?一起來(lái)看一下吧。
本篇是「標簽畫(huà)像系列」的第四篇,此前我們已經(jīng)介紹過(guò)了標簽畫(huà)像體系建設方法論、標簽體系設計與加工、標簽加工與落庫,這次我們來(lái)介紹一下「標簽評分」。
標簽評分是標簽治理的一個(gè)重要措施,通過(guò)給標簽打分,可清晰直觀(guān)地從各個(gè)維度評估標簽,掌握標簽真實(shí)使用情況,進(jìn)行標簽持續優(yōu)化,助力業(yè)務(wù)運營(yíng)。同時(shí),也能幫助數據團隊判斷哪些標簽更應該投入計算與存儲資源,合理規劃集群資源。
一、為何要進(jìn)行標簽評分
經(jīng)過(guò)前期標簽體系設計、標簽加工,標簽終于可以上線(xiàn),讓業(yè)務(wù)人員使用,發(fā)揮價(jià)值了!
隨著(zhù)標簽上線(xiàn)一段時(shí)間后,我們開(kāi)始關(guān)心每天占用計算資源與存儲空間,跑出來(lái)的上百個(gè)標簽,業(yè)務(wù)同學(xué)真的用到了多少,業(yè)務(wù)收益是否能覆蓋數據成本呢?標簽上線(xiàn)后,其質(zhì)量怎么樣,是否存在老規則不適用、需要持續優(yōu)化的情況?
帶著(zhù)這一問(wèn)題,我們需要用一種方法來(lái)評估標簽上線(xiàn)后的使用情況,標識各個(gè)標簽的價(jià)值。參考電影評分、花唄評分等形式,我們決定也給標簽打個(gè)分、排個(gè)序,簡(jiǎn)單明了。
二、標簽評分模型
標簽評分模型,經(jīng)過(guò)考慮我們選取了*個(gè)維度作為評分入參:
標簽總評分= a* 標簽使用度評分 + b * 標簽關(guān)注度評分 + c * 標簽質(zhì)量評分 + d * 標簽持續優(yōu)化讀評分 + e * 標簽安全度評分
其中標簽使用度、標簽關(guān)注度、標簽質(zhì)量、標簽持續優(yōu)化度作為核心維度,標簽安全度可根據實(shí)際情況考慮是否納入。a、b、c、d、e是權重,總和為*00%。
*. 標簽使用度評分
標簽使用度,用以評估標簽被分析、外部系統的使用情況。
在袋鼠云標簽產(chǎn)品中,標簽有這幾種使用場(chǎng)景:
標簽引用:如原子標簽被衍生標簽應用、衍生標簽被組合標簽引用等,基于該場(chǎng)景,計算“標簽引用次數”指標。
標簽分析:標簽在標簽圈群、群組畫(huà)像、群組對比、顯著(zhù)性分析等畫(huà)像分析功能中被分析的情況,計算“標簽分析次數”指標。
標簽調用:標簽通過(guò)數據API被外部應用查詢(xún)的次數,計算“標簽調用次數”指標。
基于以上*個(gè)指標,我們首先采用Sigmoid函數將指標轉化為評分,再將各個(gè)指標的評分加權匯總成標簽使用度評分。
2. 標簽關(guān)注度評分
標簽關(guān)注度,用以評估被搜索、查看、收藏的情況。
袋鼠云標簽產(chǎn)品中,標簽關(guān)注度與以下場(chǎng)景有關(guān):
標簽搜索:標簽在標簽市場(chǎng)被用戶(hù)搜索的情況,計算“標簽搜素次數”指標。
標簽查看:標簽被點(diǎn)擊查看基礎信息、分析頁(yè)面等的次數,計算“標簽查看次數”指標。
標簽收藏:收藏該標簽的用戶(hù)數,計算“收藏用戶(hù)數”指標。
以上*個(gè)指標可反映標簽的關(guān)注熱度,我們依然采用Sigmoid函數將指標轉化為評分,再將各個(gè)指標的評分加權匯總成標簽關(guān)注度評分。
*. 標簽質(zhì)量評分
標簽質(zhì)量,用以評估用戶(hù)被打標情況,反映標簽規則的合理性。
當我們定義了標簽和標簽值,經(jīng)過(guò)計算之后,標簽值打在用戶(hù)身上的很少,那說(shuō)明我們的規則執行不合理。比如我們定義了“活躍度”這個(gè)標簽,分為“高活躍、中活躍、低活躍度”等,但真實(shí)被打上的這個(gè)標簽的用戶(hù),低于70%,還有很大一部分比例是空值,未打上該標簽,說(shuō)明我們制定的標簽值規則有漏洞,需要完善。
系統將計算每個(gè)標簽的“標簽覆蓋度”,將覆蓋度歸一化為分數,轉化成評分。
*. 持續優(yōu)化度評分
持續優(yōu)化度,用以評估標簽上線(xiàn)后,是否后續再去優(yōu)化該標簽。
在客戶(hù)的生命周期中,不斷有新用戶(hù)流入、沉默用戶(hù)流失。公司戰略調整、產(chǎn)品發(fā)布等都會(huì )影響客戶(hù)行為,這些變化我們需要以數據的方式呈現,所以我們需要不斷根據業(yè)務(wù)調整、客戶(hù)變化調整我們的標簽策略,以追求可通過(guò)標簽直接地、迅速地反映客戶(hù)情況,指導業(yè)務(wù)運營(yíng)。
持續優(yōu)化度,我們通過(guò)“標簽優(yōu)化次數”指標來(lái)評估,指標簽上線(xiàn)后標簽被編輯再次發(fā)布的的次數。我們同樣采用Sigmoid函數將指標轉化為評分。
*. 安全度評分
標簽安全度,不能反映標簽的熱度,但也將其作為了標簽評分的一個(gè)維度,可根據企業(yè)情況考慮是否納入。
在袋鼠云標簽產(chǎn)品中,標簽安全相關(guān)的策略有:
標簽的可見(jiàn)度:標簽可編輯、可查看的用戶(hù)范圍
標簽使用是否需要申請授權:標簽發(fā)布后,其他人使用該標簽,是否需要申請審批
標簽是否進(jìn)行行級權限控制:上面我們控制了標簽的列權限,行級權限反映該標簽是否設置了行級權限
標簽是否脫敏:標簽是否進(jìn)行脫敏
根據標簽的安全度策略配置情況,我們也采用評分的方式來(lái)評估。
基于以上*個(gè)維度的評分,我們根據前面提的公式加權匯總,得到總評分。
三、標簽評分的應用
基于標簽評分,為了更加直觀(guān)的讓標簽管理員、業(yè)務(wù)人員查看熱門(mén)標簽、沉默標簽等,通過(guò)排行榜的方式呈現:
*)熱門(mén)標簽排行榜
基于標簽的使用度、關(guān)注度、持續優(yōu)化度*個(gè)角度來(lái)計算標簽的熱門(mén)評分,展示TOP N的熱門(mén)標簽。
熱門(mén)標簽說(shuō)明這些標簽被經(jīng)常使用,我們需要持續關(guān)注這些標簽的正常運行、質(zhì)量,保障業(yè)務(wù)使用。
2)沉默標簽排行榜
熱門(mén)的標簽的反向排序便是沉默標簽,沉默標簽說(shuō)明這些標簽使用率很低,可考慮定期下線(xiàn),節省集群資源。
*)綜合排行榜
綜合排行榜便根據標簽的綜合評分進(jìn)行排序,從標簽使用度、關(guān)注度、持續優(yōu)化度、質(zhì)量、安全等幾個(gè)維度評估,全面評估標簽。
*. 標簽使用度、關(guān)注度、持續有優(yōu)化度、質(zhì)量、安全分榜單排行
用戶(hù)可根據自己更加關(guān)注的維度,查看標簽使用度、關(guān)注度、持續優(yōu)化度、質(zhì)量、安全各個(gè)子維度的排行榜。同時(shí),可查看各個(gè)標簽的具體指標,如使用度維度,可查看各個(gè)標簽的當前引用次數、分析次數、調用次數,針對具體指標具體分析,滿(mǎn)足不同的標簽分析場(chǎng)景。
標簽評分模型上線(xiàn)后,我們需要根據實(shí)際情況調整不同維度的權重,符合自身實(shí)際情況。當經(jīng)過(guò)一段時(shí)間的應用,大家認可這套評估邏輯之后,便可以將靜態(tài)化的評分展示轉化為動(dòng)態(tài)化的告警、自動(dòng)化治理等,可設置標簽質(zhì)量告警、評分告警,自動(dòng)通知標簽管理員、責任人等。
以上便是在產(chǎn)品中應用的評分邏輯,希望對大家有所幫助,也可提出不同思路優(yōu)化評分模型,達到更好的標簽治理效果。
本文由 @木研 原創(chuàng )發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉載。
題圖來(lái)自 Unsplash,基于 CC0 協(xié)議。