Загрузка и очистка данных

Question

Программе доступен файл data.csv.

Загрузите данные из этого файла, заполнив пропуски NaN прямо при загрузке.
Удалите строки, в которых есть Nan.
Выведите на экран размеры нового датасета через пробел
Формат ввода
Файл формата CSV

Формат вывода
Два целых числа - размеры датасета через пробел.

как это решить на python

Answer 1

Ниже приведён пример решения на Python с использованием библиотеки pandas.

Считаем файл data.csv, при этом пустые значения или типичные маркеры пропусков (например, "NaN") автоматически будут интерпретированы как пропуски (NaN).
Удалим все строки, где есть хоть один пропуск (dropna() удаляет строки с NaN по умолчанию).
Выведем число строк и столбцов через пробел.

python
import pandas as pd

# Шаг 1. Считываем CSV, пропуски автоматически распознаются как NaN
df = pd.read_csv('data.csv')

# Шаг 2. Удаляем строки, содержащие хотя бы один NaN
df = df.dropna()

# Шаг 3. Выводим размеры набора данных (число строк и столбцов)
print(df.shape[0], df.shape[1])

Таким образом, в df останутся только те строки, в которых нет пропусков, и на экран будет выведено два целых числа: количество строк и количество столбцов итогового DataFrame.

Загрузка и очистка данных

Question

Thought

Answer

Share this Q&A