写入csv文件
import pandas as pd
import numpy as np
data = pd.read_csv('MTdata.csv')
print(data)
运行结果:
读取数据
读取头部及尾部前5行
print(data.head(5))
print(data.tail(5))
运行结果:
显示索引(index()),列(column())和底层NumPy对象(to_numpy())
print(data.index)
print(data.columns)
print(data.to_numpy())
运行结果:
注意:DataFrame.to_numpy() 的输出不包含行索引和列索引
显示数据快速统计摘要(describe()),转置数据(T()),按轴排序(sort_index()),按值排序(sort_values())
print(data.describe())
print(data.T)
print(data.sort_index(axis=1, ascending=False))
# print(data.sort_values(by='B'))
输出结果:
按范围选择
选择一个列
print(data['Name'])
注意这个Name就是csv中某一列第一个单元格的Name
对数据进行切片(0到3行)
print(data[0:3])
按标签选择
获取一行,获取多列,在二维上切片
print(data.loc[0])
print(data.loc[:, ['Name', 'Duration']])
print(data.loc[0:10, ['Name', 'Duration']])
按位置选择
print(data.iloc[4])
print(data.iloc[1:3,:])
print(data.iloc[:,1:3])
print(data.iloc[3:6,0:2])
print(data.iloc[[1,3,5],[0,2]])
print(data.iloc[1,1])
# print(data.iat[1,1])
布尔索引
data[data.A>0]
data[data>0]
isin()方法
print(data[data['Name'].isin(['MATLAB R2017b'])])
参考自官方文档:[ https://www.pypandas.cn/ ](