数据框是一种二维数据结构,其中数据以表格格式存储,以行和列的形式。
它可以可视化为SQL数据表或excel工作表表示形式。可以使用不同的方法删除数据框中的列。
我们将看到'del'运算符,该运算符将需要删除的列的名称作为参数,并将其删除-
import pandas as pd my_data = {'ab' : pd.Series([1, 8, 7], index=['a', 'b', 'c']), 'cd' : pd.Series([1, 2, 0, 9], index=['a', 'b', 'c', 'd']), 'ef' : pd.Series([56, 78, 32],index=['a','b','c']), 'gh' : pd.Series([66, 77, 88, 99],index=['a','b','c', 'd']) } my_df = pd.DataFrame(my_data) print("数据框为:")print(my_df) print("使用“del”运算符删除列") del my_df['cd']print(my_df)
输出结果
数据框为: ab cd ef gh a 1.0 1 56.0 66 b 8.0 2 78.0 77 c 7.0 0 32.0 88 d NaN 9 NaN 99 使用“del”运算符删除列 ab ef gh a 1.0 56.0 66 b 8.0 78.0 77 c 7.0 32.0 88 d NaN NaN 99
导入所需的库,并为其指定别名,以方便使用。
创建由键和值组成的字典值,其中值实际上是序列数据结构。
该字典随后作为参数传递给存在于“ pandas”库中的“ Dataframe”函数
关键字“ del”用于删除特定的列。
需要删除的列名作为参数传递给'del'运算符。
新的数据框将打印在控制台上。
注意-“ NaN”一词指的是“不是数字”,这意味着特定的[row,col]值没有任何有效的条目。