2025年kaggle之共享单车案例

kaggle之共享单车案例kaggle 之共享单车案例 自行车共享系统是租借自行车的一种手段 通过这些系统 人们可以从任意地点租借一辆自行车 到达目的地后归还 自行车共享系统明确记录了旅行时间 出发地点 到达地点和时间 因此 其可用于研究城市中的移动性 在本项目中 要求将历史使用模式与天气数据结合起来

大家好,我是讯享网,很高兴认识大家。

kaggle之共享单车案例

自行车共享系统是租借自行车的一种手段,通过这些系统,人们可以从任意地点租借一辆自行车,到达目的地后归还。自行车共享系统明确记录了旅行时间,出发地点,到达地点和时间。因此,其可用于研究城市中的移动性。在本项目中,要求将历史使用模式与天气数据结合起来,以预测华盛顿特区的自行车租赁租赁需求。

数据提供了跨越两年的每小时租赁数据,包含天气信息和日期信息,训练集由每月前19天的数据组成,测试集是每月第20天到当月底的数据。


讯享网

变量说明:

  • datetime(日期) - 年 、月、 日+ 整点时刻
  • season(季节) - 1 =春, 2 = 夏, 3 = 秋, 4 = 冬
  • holiday - 是否是节假日
  • workingday - 是否是工作日
  • weather(天气等级)1. 清澈,少云,多云。2. 雾+阴天,雾+碎云、雾+少云、雾 3. 小雪、小雨+雷暴+散云,小雨+云 4. 暴雨+冰雹+雷暴+雾,雪+雾
  • temp 温度
  • atemp 体感温度
  • humidity 相对湿度
  • windspeed 风速
  • casual 非用户租赁数量
  • registered 会员租赁数量
  • count 租赁总量

数据探索

  • 缺失值检查
  • 异常值检查
import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns from datetime import datetime #忽略警告提示 import warnings warnings.filterwarnings('ignore') %matplotlib inline 

讯享网
讯享网data_train = pd.read_csv('./data/train.csv') data_test = pd.read_csv('./data/test.csv') data_train.info() print('-'*40) data_test.info() 
<class 'pandas.core.frame.DataFrame'> RangeIndex: 10886 entries, 0 to 10885 Data columns (total 12 columns): datetime 10886 non-null object season 10886 non-null int64 holiday 10886 non-null int64 workingday 10886 non-null int64 weather 10886 non-null int64 temp 10886 non-null float64 atemp 10886 non-null float64 humidity 10886 non-null int64 windspeed 10886 non-null float64 casual 10886 non-null int64 registered 10886 non-null int64 count 10886 non-null int64 dtypes: float64(3), int64(8), object(1) memory usage: 1020.6+ KB ---------------------------------------- <class 'pandas.core.frame.DataFrame'> RangeIndex: 6493 entries, 0 to 6492 Data columns (total 9 columns): datetime 6493 non-null object season 6493 non-null int64 holiday 6493 non-null int64 workingday 6493 non-null int64 weather 6493 non-null int64 temp 6493 non-null float64 atemp 6493 non-null float64 humidity 6493 non-null int64 windspeed 6493 non-null float64 dtypes: float64(3), int64(5), object(1) memory usage: 456.6+ KB 

数据没有缺失值

讯享网data_train.head() 
小讯
上一篇 2025-03-22 12:08
下一篇 2025-02-15 16:40

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/124574.html