<
>

python小练习之航空公司数据练习题(二)

2020-06-28 11:50:51 来源:易采站长站 作者:易采站长站整理

写在开头:这一节的内容是根据家庭作业来的,我们会对家庭作业中的问题展开的进行代码的运行与讲解,然后将代码进行封装直接跑出所有程序,数据的话会放在百度网盘以供下载。

航空公司数据匹配

今天要完成的一个小任务就是利用pandas去匹配航空公司数据,会给定几个简单的题目,然后对每个任务分别进行完成。首先呢我们需要对数据的字符段进行说明。
数据段说明

变量名解释说明
year、month、day起飞日期
dep_time、arr_time起飞(departure)时间和到达时间。格式:HHMM,当地时间。
sched_dep_time、sched_arr_time计划起飞时间、计划到达时间
dep_delay、arr_delay起飞延误、到达延误
hour、minute计划起飞时间拆分为 hour 和 minute
carrier承运商缩写
tailnum飞机尾号
origin、dest始发地、目的地
airtime空中时间
distance机场间距

未说明数据可以忽略。
问题展示

问题内容
问题1a寻找达到延误2小时或者更多的航班
问题1b寻找飞往IAH或HOU机场的航班
问题1c寻找联合航空、美利坚航空和三角洲航空的航班
问题1d寻找7、8、9月的航班
问题1e寻找到达延误2小时但出发时间没有延误的航班
问题1f寻找延误1小时但飞行弥补30分钟的航班的航班
问题2计算每驾飞机在第一次延误超过1小时前的飞行次数
问题3找到至少两个航空公司直达的目的地,并且对该目的地根据航班数对航空公司进行排序
问题4验证是否每架飞机只属于一个航空公司

问题解答
下面跟着笔者的思路一道题一道题的完成问题吧,当然每个题的解不唯一,
数据查看
在进行研究前我们先来加载数据,然后看一看数据逇整体信息,

import os
import pandas as pd
import numpy as np
os.chdir('C:UsersHsmDesktop数据fixtures')
flights = pd.read_csv("flights.csv")
print("1.查看数据规模")
print(flights.shape) #观察数据规模
print("-"*40)
print("n2.查看变量名")
print(flights.columns) #观察数据变量名
print("-"*40)
print("n3.查看数据基本信息")
flights.info() #观察变量数量与类型
print("-"*40)
暂时禁止评论

微信扫一扫

易采站长站微信账号