python基操(英文环境下输入代码)

tech2024-10-12  22

#导入库 import pandas as pd import numpy as np from sklearn.utils import shuffle #读取数据(注意是文件路径,即需要加文件后缀) xlsx1_filePath = 'D:/study/radiomics/data/breast_cancer1.xlsx' xlsx2_filePath = 'D:/study/radiomics/data/breast_cancer2.xlsx' data_1 = pd.read_excel(xlsx1_filePath) data_2 = pd.read_excel(xlsx2_filePath) #看行列数 rows,cols = data_1.shape print(rows,cols) #看前几行 data_1.head() #看列标题 data_1.columns #新增一列(从0行开始,每行定义为1) data_1.insert(0,'lable1',[1]*rows) #新增后查看 data_1.head() #定义数据(合并前) rows_2,cols_2=data_2.shape #合并数据 data=pd.concat([data_1,data_2]) #混序 data=shuffle(data) #排除无效数据NaN data['FrequencySize']=np.nan #无效数据NaN赋值 data=data.fillna(0) #附加 #选择多列 data[['列名称1','列名称2']] #选择多行(左闭右开区间) data[0:2] #定向选择 data.iloc[1:4,3:6] #若无限则只用: 进阶(数据类型) #数字(整数int,浮点型float) a=1 b=1.0 print(type(a)) print(type(b)) #字符串string c=1’ d=1.0print(type(c)) print(type(d)) #布尔值bool e=true f=false print(type(e)) print(type(f)) #赋值及运算 x=1 y=2 z=x x=y y=z print(x,y)
最新回复(0)