Использование функции вырезания для сортировки числового столбца создает значения NAN

0

Я пытаюсь собрать значения в столбце фрейма данных панды, который является floar64 (min = 0,000000, max = 48,100000). Изначально в данных не было пропущенных значений / NAN, но после биннинга теперь есть значения NAN в дополнение к меткам / категориям. Как это случилось? И если кто-нибудь может мне помочь, как это решить.

bins = [0.0, 10.0, 20.0, 30.0, 50.0]
labels = ['1', '2', '3', '4']
df['Distance'] = pd.cut(df['Distance'], bins=bins, labels=labels)
df.Distance.unique()

Результат:

['1', '2', '3', '4', NaN]
Categories (4, object): ['1' < '2' < '3' < '4']
1
  • Неужели ваши данные есть Nan? Кроме того, вы можете пройти, include_lowest=Trueкак 0и yield NaN. Например, попробуйте pd.cut(bins, bins, labels=labels)... 8 минут назад