0
голосов
0ответы
8 просмотров

Использование функции вырезания для сортировки числового столбца создает значения NAN

Я пытаюсь собрать значения в столбце фрейма данных панды, который является floar64 (min = 0,000000, max = 48,100000). Изначально в данных не было пропущенных значений / NAN, но после биннинга теперь есть NAN ...
0
голосов
2ответы
Просмотров: 22

Как определить функцию, которая будет проверять любой фрейм данных на предмет наличия столбца «Возраст» и возвращаемых корзин?

Я пытаюсь определить функцию, которая будет принимать любой фрейм данных со столбцом «Возраст», отбирать возраст и возвращать количество X в каждой возрастной категории. Рассмотрим следующее: def age_range (): x = ...
0
голосов
1отвечать
28 просмотров

usmaps R: используйте ggplot2, чтобы установить ячейки и вручную раскрасить

Я использую пакет usmaps () в R для создания карты США. У меня есть данные, настроенные так: Ces_State_Only: State 1990 Alabama 0.2 Alaska 0.31 Arizona 0.40 Я хочу создать хлороплетную карту. Я ...
0
голосов
1отвечать
Просмотров: 43

Бинированные данные физиологического временного ряда в R: вычислить продолжительность, проведенную в каждом бункере

У меня есть набор данных, содержащий изменения среднего артериального кровяного давления (САД) с течением времени от нескольких участников. Вот пример фрейма данных: df = structure (list (ID = c (1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, ...
1
голосование
1отвечать
73 просмотра

В python, как дискретизировать непрерывную переменную, используя точность в качестве критерия с учетом класса

Для набора субъектов у меня есть непрерывная переменная с диапазоном от 0 до 100, представляющая количественную оценку cont_attribute состояния субъекта. Для каждого предмета у меня также есть порядковая переменная, представляющая ...
0
голосов
1отвечать
25 просмотров

Объединение нескалярных объектов в Python

Я хотел бы изобразить условную вероятность того, что какое-то событие A произойдет в отношении некоторой переменной X. У меня есть набор данных образцов, где каждый образец представляет собой пару значений X и погоды A ...
2
голосов
1отвечать
28 просмотров

Как разместить переменную в нескольких наблюдениях для каждого образца?

Новый пользователь R. Я измерил цвет (оттенок) нескольких корпоративных логотипов. Количество наблюдений для каждого логотипа может быть разным. Мои данные имеют следующий формат: Industry <- c ("Fossil & ...
0
голосов
0ответы
26 просмотров

Есть ли быстрый способ сортировки данных в бункеры по нескольким столбцам?

У меня есть большой (350 000 строк) набор данных, содержащий историческую информацию о волнах. Я хотел бы отсортировать данные по определенным ячейкам, каждая из которых содержит общее состояние моря. Скажем, около 3000 ящиков. Я составил диапазоны ...
0
голосов
1отвечать
40 просмотров

Извлечение данных из гистограммы с настраиваемыми ячейками в Python

У меня есть набор данных о расстояниях между двумя частицами, и я хочу разместить эти данные в настраиваемых ячейках. Например, я хочу увидеть, сколько значений расстояния лежит в интервале от 1 до 2 микрометров, и ...
0
голосов
0ответы
9 просмотров

Биннинг на сенсоре камеры imx258

Хочу спросить, на каком этапе производится биннинг в датчике. Это делается во время считывания строк (для меня не имеет смысла из-за рольставни)? Интересно, почему я ...
0
голосов
1отвечать
44 просмотра

Дискретизируйте xarray.DataArray

Допустим, у меня есть массив, состоящий из чисел с плавающей запятой, и для каждой точки я хотел бы преобразовать его значение с плавающей запятой в определенное целое число, в зависимости от бункера / диапазона, в который попадает это значение с плавающей запятой: Лучшее I ...
0
голосов
0ответы
31 просмотр

Как мне с помощью python объединить значения валюты, в которых вначале есть символ валюты?

У меня есть значения валюты, например, 569000 долларов в моем наборе данных, и я хочу объединить их как 500000-600000 долларов с символом валюты впереди. Однако из-за символа валюты значения не ...
0
голосов
1отвечать
20 просмотров

Поиск значения строки одного столбца на основе ближайшего значения другого столбца в кадре данных

Я пытаюсь получить ближайшее значение столбца, соответствующего другому столбцу в df. пример ниже для иллюстрации: У меня есть фрейм данных df: df <- as.data.frame (dnorm (c (1: 100), 50)) df $ "bin & ...
0
голосов
0ответы
16 просмотров

Уменьшение размера набора 3D-данных для программирования на Python

У меня есть 11 файлов hdf5 по 500 МБ каждый, то есть всего 5,5 ГБ данных. Мне нужно нанести эти данные на трехмерную диаграмму рассеяния. Однако из-за большого размера набора данных код занимает вечность, чтобы ...
0
голосов
0ответы
15 просмотров

Создание бинов из 3D-точек (большой набор данных) с помощью Python для более быстрой обработки

Я пытаюсь создать трехмерный график каталога галактик и иметь большое количество координат x, y, z и значения данных (w4), хранящихся в отдельных файлах hdf5, все общим размером 5,5 ГБ (500 МБ x 11 файлов. ). Я ...