编写Python代码,将给定的序列转换为虚拟变量,并删除所有存在的NaN值

假设您有一个序列,转换为虚拟变量的结果为,

   Female Male
0    0    1
1    1    0
2    0    1
3    1    0
4    0    1
5    0    0
6    1    0
7    1    0

为了解决这个问题,我们将遵循以下步骤-

解决方案

  • 创建一个包含“男性”和“女性”元素的列表,并将其分配给“系列”。

  • 在系列内部应用get_dummies函数,并将dummy_na值设置为False。它的定义如下

pd.get_dummies(series, dummy_na=False)

例子

让我们检查以下代码以获得更好的理解-

import pandas as pd
import numpy as np
gender = ['Male','Female','Male','Female','Male',np.nan,'Female','Female',]
series = pd.Series(gender)
print("Series is:\n",series)
print("Dummy code is:\n", pd.get_dummies(series, dummy_na=False))

输出

Series is:
0    Male
1    Female
2    Male
3    Female
4    Male
5    NaN
6    Female
7    Female
dtype: object
Dummy code is:
   Female Male
0    0    1
1    1    0
2    0    1
3    1    0
4    0    1
5    0    0
6    1    0
7    1    0