Pandas는 파이썬에서 데이터 분석을 위한 패키지입니다. 이 패키지는 다양한 형태의 데이터를 가공하고 분석할 수 있는 기능을 제공합니다.
Pandas에는 두 가지 주요한 자료구조가 있습니다. 하나는 시리즈(Series)이고 다른 하나는 데이터프레임(DataFrame)입니다. 시리즈는 단일 열의 데이터를 나타내며 데이터프레임은 다양한 열의 데이터를 나타냅니다.
Pandas는 다양한 형태의 데이터를 가공하고 분석하는데 매우 유용합니다. 예를 들어 데이터프레임에서 열을 추가하거나 삭제하거나, 열의 이름을 바꾸거나, 데이터를 정렬하거나, 열 또는 행을 합치거나 분할하거나, 누락된 데이터를 채우거나, 데이터를 그룹화하거나 분석하거나 등의 작업을 수행할 수 있습니다.
Pandas는 또한 다양한 형태의 데이터를 읽고 쓰기 위한 다양한 기능을 제공합니다. 예를 들어 CSV, Excel, HTML, SQL 등의 다양한 파일 형식의 데이터를 읽고 쓸 수 있습니다.
파이썬 Pandas에서 데이터를 추가하거나 삭제하는 방법은 다음과 같습니다.
1. 데이터 추가하기
파이썬 Pandas는 데이터를 추가하기 위해 다양한 방법을 제공합니다. 가장 일반적인 방법은 기존 데이터프레임에 새로운 행을 추가하는 것입니다. 예를 들어 다음과 같이 기존 데이터프레임이 있다고 가정합시다.
df = pd.DataFrame({'Name':['John','Paul','George','Ringo'],'Age':[20,21,22,23]})
이 데이터프레임에 새로운 행을 추가하려면 다음과 같이 하면 됩니다.
new_row = {'Name':'Pete', 'Age':24}
df = df.append(new_row, ignore_index=True)
2. 데이터 삭제하기
파이썬 Pandas는 데이터를 삭제하기 위해 다양한 방법을 제공합니다. 가장 일반적인 방법은 특정 행을 삭제하는 것입니다. 예를 들어 다음과 같이 기존 데이터프레임이 있다고 가정합시다.
df = pd.DataFrame({'Name':['John','Paul','George','Ringo'],'Age':[20,21,22,23]})
이 데이터프레임에서 특정 행을 삭제하려면 다음과 같이 하면 됩니다.
df = df.drop(index = 1)
이렇게 하면 행 번호가 1인 행이 삭제됩니다.
'파이썬' 카테고리의 다른 글
Tensorflow 란 무엇입니까? (0) | 2023.02.26 |
---|---|
파이써 1주 5일차 (0) | 2023.02.24 |
파이썬 1주 4일차 (0) | 2023.02.23 |
파이썬 1주 3일차 (0) | 2023.02.22 |
파이썬 1주 2일차 (0) | 2023.02.21 |
댓글