pandas DataFrame数据过滤:isin

pandas中的isin方法用于检查DataFrame中的元素是否包含在指定的序列(如列表、Series或另一个DataFrame)中。这方法通常用于过滤或标记DataFrame中的数据。以下是isin方法的用法和示例:

DataFrame.isin(values)
  • DataFrame:要进行匹配的DataFrame。
  • values:包含要匹配的元素的序列,可以是列表、Series、或另一个DataFrame。

isin方法返回一个布尔DataFrame,其中包含与values中的元素匹配的元素,如果匹配则为True,否则为False。该布尔DataFrame的形状与原始DataFrame相同。

示例:

import pandas as pd

data = {'A': [1, 2, 3, 4, 5],
        'B': ['apple', 'banana', 'cherry', 'date', 'elderberry']}
df = pd.DataFrame(data)

# 创建一个包含要匹配的值的列表
values_to_match = [2, 'date']

# 使用isin方法检查DataFrame中的元素是否在values_to_match中
result = df.isin(values_to_match)

print(result)

输出:

A      B
0  False  False
1   True  False
2  False  False
3  False   True
4  False  False

上述示例中,result DataFrame 的每个元素表示对应位置的元素是否与values_to_match中的元素匹配。在列'A'中,2匹配了,所以第二行的值为True。在列'B'中,'date'匹配了,所以第三行的值为True。其他位置的元素不匹配,所以值为False。

isin方法常用于数据过滤,例如,你可以使用它来筛选DataFrame中与某些特定值匹配的行。


发表评论

评论列表,共 0 条评论

    暂无评论