import pandas as pd data = pd.read_csv('/Users/jenifferli_0605hotmail.com/Downloads/data.csv',encoding='ISO-8859-1',nrows=541910) data.head() 看下数据集 data.shape检察数据集 data.info()检察缺失值以及缺失值占比 data.isnull().sum()missing_percentage = data.isnull().sum() / data.shape[0] * 100 missing_percentage 删除缺失值 data1 = data.dropna(how='any')data1.info() 日期范例转换 data1['InvoiceDate'] = pd.to_datetime(data1['InvoiceDate']) #12/1/2010 8:26转换为2010-12-01data1['InvoiceDate'] =data1['InvoiceDate'].APPly(lambda x: x.strftime('%Y-%m-%d')) #将datetime64[ns] 转为 object data1.info() 新建一个销售金额的字段,即产物数目乘以单价。 data1['Price'] =data1['Quantity']*data1['UnitPrice']data1.head() 【第一个题目:采办商品数前十的国家是?】 data1[data1['Quantity']>0].groupby('Country')['Quantity'].sum().sort_values(ascending=False).head(10)可视化 plt.subplot(1,1,1)x=np.array(["UK","NLD","EIRE","GER ","France","AUS","SE","Swi","Spain ","Jpn "]) y=np.array([4269472,2009370,140525,119263,111472,84209,36083,30083,27951,26016]) plt.bar(x,y,width = 0.5,align = "center",label = "采办量",color='green') plt.title("采办商品数前十的国家",loc = "center") for a,b in zip (x,y): plt.text(a,b,b,ha='center',va= 'bottom',fontsize = 12) plt.xlabel('国家') plt.ylabel('采办量') plt.legend()#显现图例 plt.show() 【第二个题目:买卖额前十的国家是?】 price_first_10 = data1[data1['Quantity'] > 0].groupby('Country').sum()['Price'].sort_values(ascending=False).head(10)price_first_10.head(10) 可视化 plt.figure(figsize=(9,5), dpi=70)plt.style.use('Solarize_Light2') plt.bar(price_first_10.index.tolist(), price_first_10.values.tolist(), color='green', label='Quantity', alpha=0.7) plt.title('Country Sales Top 10', pad=10) plt.xlabel('Country') plt.legend(loc='best') plt.ylabel('price') plt.xticks(rotation=45) 【第三个题目:前十国家月营业额趋向?】 data1['month'] = pd.to_datetime(data1['InvoiceDate']).dt.monthdata1['year'] = pd.to_datetime(data1['InvoiceDate']).dt.year year_11 = data1[(data1['Quantity'] > 0) & (data1['year'] == 2011)] pivot_year_11 = year_11.pivot_table(values='Price', index='Country', columns='month', aggfunc='sum', \ margins=True).sort_values('All',ascending=False).head(11) country_price = pivot_year_11.values.tolist() month = pivot_year_11.columns.tolist()[:-1] labels = pivot_year_11.index.tolist() pivot_year_11 可视化 plt.rcParams['font.sans-serif'] = ['SimHei']plt.rcParams['axes.unicode_minus'] = False plt.figure(figsize=(12, 9)) for data, l in zip(country_price, labels): plt.plot(month, data[:12], 'o-', label=l) plt.legend(loc='best') plt.xticks([1,2,3,4,5,6,7,8,9,10,11,12]) # plt.yticks(ticks=list(np.arange(0, 12.1, 0.5))) plt.title('营业额前十国家月支出趋向', pad=10) plt.xlabel('月份',fontdict={'color':'black', 'fontsize':13}) plt.ylabel('营业额',fontdict={'color':'black', 'fontsize':13}) plt.show() 【第四个题目:那些月份销量较佳?】 month_first_10 = data1[data1['Quantity'] > 0].groupby('month').sum()['Quantity'].sort_values(ascending=False).head(10)month_first_10 可视化 【第五个题目:客单价是几多?】 sumPrice=data1[data1['Quantity']>0]['Price'].sum()countID=data1[data1['Quantity']>0]['InvoiceNo'].count() avgPrice = sumPrice/countID print(avgPrice) 【第六个题目:用户消耗行为分析】 data1[data1['Quantity']>0].groupby('CustomerID').agg({'InvoiceNo':'nunique', 'Quantity':'sum','Price':'sum'}).describe()营收分析: 2010和2011年采办商品数目前十国家别离是(按从高到低): United Kingdom Netherlands EIRE Germany France Australia Sweden Switzerland Spain Japan 2010和2011年营业额前十国家别离是(按从高到低): United Kingdom Netherlands EIRE Germany France Australia Spain Switzerland Belgium Sweden 可以看出,日本虽是商品销售数目前十的国家但销售额并没进入前十。而Belgium的销售数目并不是前十,销售额却是前十,是一个有潜力的国家 2011年,英国的月销售额对月总销售额的走势有着间接的关系。 用户行为分析 用户均匀消耗4次,有的客户甚至消耗高达210次,是产物的虔诚客户用户均匀消耗金额为2053元, 而75%的用户消耗金额只要1661元,可见,有些用户消耗金额较大,属于很是有代价的用户,需要重点连结关注 用户采办产物数目品均高达1194件,由于销售工具主如果批发商,算是一般的数目 |
17年毕业的小姐姐,18年6月从护肤品行业跳槽到电商会计。对电商会计处理一无所知,仅
近日,社交电商成为大众关注的焦点,一边是拼多多“从0到1”的快速发展,创造了成立三
案例简介先来看看本周采访的牛人,他搭建了一个CPS+社交电商模式的平台,内部有70人的
本期核心观点:在私域电商元年,一位创业者乘着风口,在私域电商领域创下一月2000万流
分享来源:果集2021-至今内容电商全面发展,品牌加速布局直播电商,品牌自播成为增长
我们唯有通过与他人结合,方能实现自我,“个别我”(I)需要结合“团体我”(We),
2021年的电商行业发生了不少大事:阿里因垄断被罚182亿;叮咚、每日优鲜上市,也没能
等待了一个月,赵鹏还是没等到贝店的解决方案。8月初,多家媒体报道,杭州贝贝集团疑
在深耕私域一年半后,零一私域研究部近期开始将团队所有的项目操盘经验、SOP全面进行
每经记者:李卓 每经实习记者:杨昕怡 每经编辑:刘雪梅2021电商行业发生了哪些变化?
编辑导语:互联网有形的边界逐渐崩塌,走向互联互通的道路,在这之后,平台和品牌都会
1、本文是基于私域这个大帽子来写的,因为私域最近比较火,这样写你更愿意看;2、本文
都在讲社交电商,那么社交电商到底是什么意思?今天,就和给大家简单的聊一下社交电商
本期核心观点:“自组织”模式的团体,让其中的每个人不自觉的形成利益共同体,通过这
不管你什么时间翻看朋友圈,总会碰上几个微商。相比前几年的面膜,在品类上也全面开花
中商情报网讯:4月23日,社交电商云集微店宣布拿到1.2亿美元B轮融资。此前几天,有消
俗话说,详情页乃兵家必争之地,得详情页者得天下。那本文分别从功能结构、以及细节,
编辑导语:随着互联网时代的不断进步,电商行业也随着迅速发展,并且与多种模式相互融
CDF会员购是去年2020年6月在疫情的情况下,CDF会员购是中免集团推出的服务于cdf会员体
图片来源@视觉中国继阿里的淘小铺下线之后,京东的东小店也关停了,两大巨头梦碎社交
声明:本站内容由网友分享或转载自互联网公开发布的内容,如有侵权请反馈到邮箱 1415941@qq.com,我们会在3个工作日内删除,加急删除请添加站长微信:15924191378
Copyright @ 2022-2024 私域运营网 https://www.yunliebian.com/siyu/ Powered by Discuz! 浙ICP备19021937号-4