一、数据来源
创新互联是一家专业提供沂水企业网站建设,专注与成都网站制作、成都网站设计、H5响应式网站、小程序制作等业务。10年已为沂水众多企业、政府机构等服务。创新互联专业网络公司优惠进行中。
本节选用的是Python的第三方库seaborn自带的数据集,该小费数据集为餐饮行业收集的数据,其中total_bill为消费总金额、tip为小费金额、sex为顾客性别、smoker为顾客是否吸烟、day为消费的星期、time为聚餐的时间段、size为聚餐人数。
- import numpy as np
- from pandas import Series,DataFrame
- import pandas as pd
- import seaborn as sns #导入seaborn库
- tips=sns.load_dataset('tips') #seaborn库自带的数据集
- tips.head()
二、问题探索
三、数据清洗
- tips.shape #数据集的维度
(244,7)
共有244条数据,7列。
- tips.describe() #描述统计
描述统计结果如上所示。
- tips.info() #查看缺失值信息
此例无缺失值。
四、数据探索
- tips.plot(kind='scatter',x='total_bill',y='tip') #绘制散点图
由图可看出,小费金额与消费总金额存在正相关性。
- import numpy as np
- from pandas import Series,DataFrame
- import pandas as pd
- import seaborn as sns #导入seaborn库
- tips=sns.load_dataset('tips')#seaborn库自带的数据集
- tips.head()
3.0896178343949052
- female_tip = tips[tips['sex'] == 'Female']['tip'].mean() #女性平均消费金额female_tip
2.833448275862069
- s = Series([male_tip,female_tip],index=['male','female'])
- s
male 3.089618
female 2.833448
dtype: float64
- s.plot(kind='bar') #男女平均小费柱状图
由图可看出,女性小费金额小于男性小费金额。
- sun_tip = tips[tips['day'] == 'Sun']['tip'].mean()
- sat_tip = tips[tips['day'] == 'Sat']['tip'].mean()
- thur_tip = tips[tips['day'] == 'Thur']['tip'].mean()
- fri_tip = tips[tips['day'] == 'Fri']['tip'].mean()#各个日期的平均小费值
- s = Series([thur_tip,fri_tip,sat_tip,sun_tip],index=['Thur','Fri','Sat','Sun'])
- s
- s.plot(kind='bar') #日期平均小费柱状图
由图可看出,周六、周日的小费比周四、周五的小费高。
- tips['percent_tip'] = tips['tip']/(tips['total_bill']+tips['tip'])
- tips.head(10) #小费所占百分比
- tips['percent_tip'].hist(bins=50)#小费百分比直方图
由图可看出,小费金额占小费总金额的百分比基本服从正态分布。
分享标题:Python数据分析实战,小费数据集应用
浏览地址:http://www.mswzjz.cn/qtweb/news7/279607.html
攀枝花网站建设、攀枝花网站运维推广公司-贝锐智能,是专注品牌与效果的网络营销公司;服务项目有等
声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 贝锐智能