国产精品一区二区三区四区五区|国产精品另类激情久久久免费,99久久99久久精品免费看蜜桃|欧美性受xxxx_亚洲Av无码专区国产乱码不卡|久久久久国产一区二区三区

返回頂部
關(guān)閉軟件導(dǎo)航
位置:首頁 > 資訊 > 電商資訊>淘寶用戶行為分析案例數(shù)據(jù)分析Day6實戰(zhàn)
淘寶用戶行為分析案例數(shù)據(jù)分析Day6實戰(zhàn)

淘寶用戶行為分析案例(數(shù)據(jù)分析Day6實戰(zhàn))

一、項目背景

本數(shù)據(jù)報告以淘寶app平臺為數(shù)據(jù)集意見征詢,通過行業(yè)的指標(biāo)對淘寶用戶行為進行分析提升,從而探索淘寶用戶的行為模式大大提高,具體指標(biāo)包括:日PV和日UV分析,付費率分析應用前景,復(fù)購行為分析有很大提升空間,漏斗流失分析和用戶價值RFM分析。

二首次、數(shù)據(jù)來源

三可能性更大、提出問題

1.日PV有多少

2.日UV有多少

3.付費率情況如何

4.復(fù)購率是多少

5.漏斗流失情況如何

6.用戶價值情況

四、理解數(shù)據(jù)

本數(shù)據(jù)集共有104萬條左右數(shù)據(jù)搖籃,數(shù)據(jù)為淘寶APP2021年11月18日至2021年12月18日的用戶行為數(shù)據(jù)技術,共計6列字段,列字段分別是:

user_id:用戶身份推動,脫敏

item_id:商品ID相對較高,脫敏

behavior_type:用戶行為類型(包含點擊、收藏信息、加購物車相關、支付四種行為,分別用數(shù)字1豐富內涵、2生產效率、3、4表示)

user_geohash:地理位置

淘寶用戶行為分析案例數(shù)據(jù)分析Day6實戰(zhàn)1

item_category:品類ID(商品所屬的品類)

time:用戶行為發(fā)生的時間

五適應性、數(shù)據(jù)清洗

#coding:utf-8importpandasaspdimportnumpyaspyimportmatplotlib.pyplotaspltimportseabornassnsimportre#設(shè)置列數(shù)據(jù)全顯示pd.set_option('display.max_columns',None)data_user=pd.read_csv(r'.ianchi_mobile_recommend_train_user.csv')missingTotal=data_user.isnull().sum()missingExist=missingTotal[missingTotal>0]missingExist=missingExist.sort_values(ascending=False)print(missingExist)

print(missingTotal)

存在缺失值的是User_geohash節點,有717785條,不能刪除缺失值落地生根,因為地理信息在數(shù)據(jù)集收集過程中做過加密轉(zhuǎn)換的特點,因此對數(shù)據(jù)集不做處理。

data_user.head()

#拆分?jǐn)?shù)據(jù)集data_user['date']=data_user['time'].map(lambdas:re.compile('').split(s)[0])data_user['hour']=data_user['time'].map(lambdas:re.compile('').split(s)[1])data_user.head()

#查看data_user數(shù)據(jù)集數(shù)據(jù)類型:data_user.dtypes

#發(fā)現(xiàn)time列和date列應(yīng)該轉(zhuǎn)化為日期類數(shù)據(jù)類型有效保障,hour列應(yīng)該是字符串?dāng)?shù)據(jù)類型大數據。#數(shù)據(jù)類型轉(zhuǎn)化data_user['date']=pd.to_datetime(data_user['date'])data_user['time']=pd.to_datetime(data_user['time'])data_user['hour']=data_user['hour'].astype('int64')data_user.dtypes

#異常值處理data_user=data_user.sort_values(by='time',ascending=True)data_user=data_user.reset_index(drop=True)data_user.describe()

image.png

通過觀察數(shù)據(jù)集的四分位數(shù),總數(shù)進一步提升,平均值空間廣闊,方差等,發(fā)現(xiàn)數(shù)據(jù)集并無異常值存在不折不扣。

六支撐能力、用戶行為分析

(1)pv和uv分析

PV(訪問量):即PageView,具體是指網(wǎng)站的是頁面瀏覽量或者點擊量,頁面被刷新一次就計算一次高效利用。

UV(獨立訪客):即UniqueVisitor,訪問您網(wǎng)站的一臺電腦客戶端為一個訪客特征更加明顯。

1)日訪問量分析

#pv_daily記錄天天用戶操作次數(shù),uv_daily記錄天天不同的上線用戶數(shù)量pv_daily=data_user.groupby('date')['user_id'].count().reset_index().rename(columns={'user_id':'pv'})uv_daily=data_user.groupby('date')['user_id'].apply(lambdax:x.drop_duplicates().count()).reset_index().rename(columns={'user_id':'uv'})fig,axes=plt.subplots(2,1,sharex=True)pv_daily.plot(x='date',y='pv',ax=axes[0])uv_daily.plot(x='date',y='uv',ax=axes[1])axes[0].set_title('pv_daily')

結(jié)果顯示如上圖所示講理論,在雙十二期間的可能性,pv和uv訪問量達到峰值不要畏懼,并且可以發(fā)現(xiàn),uv和pv兩個訪問量數(shù)值差距比較大問題,同時逐漸顯現,因為數(shù)據(jù)集總?cè)藬?shù)大約是10000人左右,因此系統穩定性,通過nv值可以分析出雙十二期間淘寶用戶的日活躍大概是45%浮動拓展基地。

#小時訪問量分析#pv_hour記錄每小時用戶操作次數(shù),uv_hour記錄每小時不同的上線用戶數(shù)量pv_hour=data_user.groupby('hour')['user_id'].count().reset_index().rename(columns={'user_id':'pv'})uv_hour=data_user.groupby('hour')['user_id'].apply(lambdax:x.drop_duplicates().count()).reset_index().rename(columns={'user_id':'uv'})fig,axes=plt.subplots(2,1,sharex=True)pv_hour.plot(x='hour',y='pv',ax=axes[0])uv_hour.plot(x='hour',y='uv',ax=axes[1])axes[0].set_title('pv_hour')axes[1].set_title('uv_hour')

如果您覺得 淘寶用戶行為分析案例數(shù)據(jù)分析Day6實戰(zhàn) 這篇文章對您有用實力增強,請分享給您的好友體系流動性,謝謝
文章地址:http://61py.com/article/online/8384.html
解放雙手無盡可能,有問題添加天線貓微信
青河县| 古交市| 林西县| 璧山县| 牡丹江市| 高州市| 布拖县| 阿克苏市| 突泉县| 马尔康县| 馆陶县| 司法| 麦盖提县| 红桥区| 南康市| 华池县| 灌南县| 宁化县| 元朗区| 彝良县| 奇台县| 青冈县| 红桥区| 隆德县| 宜阳县| 敦化市| 长春市| 盐池县| 台安县| 新津县| 清涧县| 淮滨县| 乌鲁木齐县| 荥经县| 平定县| 乌拉特后旗| 延寿县| 浦城县| 金阳县| 淅川县| 正镶白旗|