archive
[Doit!] 1. 파이썬 패키지 이해하기 본문
1. 패키지 로드, 패키지 내부 함수 이용하기
-패키지의 함수를 사용하려면 우선 패키지를 로드해야하는데, 이는 import 키워드를 활용하여 가능하다
-패키지 약어롤 지정하려면 패키지를 로드하는 코드 뒤에 as 와 약어를 입력하면 된다
-패키지의 함수를 이용하려면 도트 연산자 (.)를 이용하여 seaborn.countplot() 과 같이 사용한다
-countplot 함수는 빈도막대그래프로 값의 개수(빈도)를 막대이 길이로 표현하는 함수로 매개변수로 x와 y의 값을 지정할 수 있다.
import seaborn as sns
var=['a','a','b','c']
sns.countplot(x=var)
- load_dataset( ) 메소드는 seaborn 패키지 안에 담긴 메소드로 이를 이용하면 seaborn 패키지에 들어있는 데이터를 불러올 수 있다.
-countplot()에 입력한 x는 빈도 막대 그래프의 x축을 정하는 기능을 하는데, 이처럼 함수의 옵션을 설정하는 명령어를 파라미터(parameter)라고 함
import seaborn as sns
df=sns.load_dataset('titanic')
sns.countplot(data=df, x='sex')
- 파라미터 설정을 바꾸면서 countplot의 기능이 어떻게 달라지는지 확인이 가능하다, class는 선실 등급, alive는 생존여부를 나타낸 변수이며, hue의 경우 변수의 항목별로 막대의 색을 다르게 표현한 파라미터이다.
#case 1
import seaborn as sns
df=sns.load_dataset('titanic')
sns.countplot(data=df, x='class', hue='alive')
//alive별 색 표현
#case2
import seaborn as sns
df=sns.load_dataset('titanic')
sns.countplot(data=df, y='class', hue='alive')
2. 모듈 알아보기
-어떤 패키지에는 함수가 굉장히 많기 때문에 비슷한 함수끼리 묶어 몇 개의 모듈(module)로 나뉘어 있음, 큰 꾸러미 안에 비슷한 함수들을 넣어둔 작은 꾸러미라고 생각하면 됨
- sklearn 패키지에는 metrics, tree, model_section등의 여러 모듈이 들어있음, metrics 모듈에는 accuracy_score() 함수가 내장이 되어있음, 이를 활용하려면 도트 연산자를 활용해 다음과 같이 명령어를 작성해야함
import sklearn.metrics
sklearn.metrics.accuracy_score()
- 혹은 모듈의 함수를 사용할 때 매번 패키지 명을 입력하는 것이 번거롭다면 from 패키지명 import 모듈명 으로 모듈을 로드하면 된다.
from sklearn import metrics
metrics.accuracy_score()
- 동일한 매커니즘으로, 모듈명을 입력하는 것도 번거롭다면 위와 같이 함수를 로드하면 됨
-그러나 아래와 같이 함수를 지정해 로드하게 된다면 로드한 함수만 사용이 가능하고 모듈의 다른 함수는 사용이 불가능하기 때문에 모듈의 특정 함수만 자주 사용하게 될 경우 함수를 지정해 로드하고 모듈의 여러 함수를 함께 사용할 때에는 모듈 전체를 로드하는 것이 현명하다.
from sklearn.metrics import accuracy_score()
accuracy_score()
'Data > 파이썬 데이터 처리' 카테고리의 다른 글
쿼리 대강 이해하기 (0) | 2023.07.22 |
---|---|
웹크롤링 라이브러리 대강 정리하기 (0) | 2023.07.15 |
[Doit!] 3. 데이터 분석 기초 - 데이터 파악 (0) | 2023.05.10 |
[Doit!] 2. 데이터 프레임 이해하기 (0) | 2023.05.09 |