python小练习之航空公司数据练习题(二)
2020-06-28 11:50:51 来源:易采站长站 作者:易采站长站整理
写在开头:这一节的内容是根据家庭作业来的,我们会对家庭作业中的问题展开的进行代码的运行与讲解,然后将代码进行封装直接跑出所有程序,数据的话会放在百度网盘以供下载。
航空公司数据匹配
今天要完成的一个小任务就是利用pandas去匹配航空公司数据,会给定几个简单的题目,然后对每个任务分别进行完成。首先呢我们需要对数据的字符段进行说明。
数据段说明
| 变量名 | 解释说明 |
|---|---|
| year、month、day | 起飞日期 |
| dep_time、arr_time | 起飞(departure)时间和到达时间。格式:HHMM,当地时间。 |
| sched_dep_time、sched_arr_time | 计划起飞时间、计划到达时间 |
| dep_delay、arr_delay | 起飞延误、到达延误 |
| hour、minute | 计划起飞时间拆分为 hour 和 minute |
| carrier | 承运商缩写 |
| tailnum | 飞机尾号 |
| origin、dest | 始发地、目的地 |
| airtime | 空中时间 |
| distance | 机场间距 |
未说明数据可以忽略。
问题展示
| 问题 | 内容 |
|---|---|
| 问题1a | 寻找达到延误2小时或者更多的航班 |
| 问题1b | 寻找飞往IAH或HOU机场的航班 |
| 问题1c | 寻找联合航空、美利坚航空和三角洲航空的航班 |
| 问题1d | 寻找7、8、9月的航班 |
| 问题1e | 寻找到达延误2小时但出发时间没有延误的航班 |
| 问题1f | 寻找延误1小时但飞行弥补30分钟的航班的航班 |
| 问题2 | 计算每驾飞机在第一次延误超过1小时前的飞行次数 |
| 问题3 | 找到至少两个航空公司直达的目的地,并且对该目的地根据航班数对航空公司进行排序 |
| 问题4 | 验证是否每架飞机只属于一个航空公司 |
问题解答
下面跟着笔者的思路一道题一道题的完成问题吧,当然每个题的解不唯一,
数据查看
在进行研究前我们先来加载数据,然后看一看数据逇整体信息,
import os
import pandas as pd
import numpy as np
os.chdir('C:UsersHsmDesktop数据fixtures')
flights = pd.read_csv("flights.csv")
print("1.查看数据规模")
print(flights.shape) #观察数据规模
print("-"*40)
print("n2.查看变量名")
print(flights.columns) #观察数据变量名
print("-"*40)
print("n3.查看数据基本信息")
flights.info() #观察变量数量与类型
print("-"*40)
暂时禁止评论













闽公网安备 35020302000061号