본문 바로가기

프로그램이야기/Python6

[DATA한입] 파이썬을 활용한 경영데이터 분석(6) [DATA한입] 파이썬을 활용한 경영데이터 분석(6) (출처 :campus.hunet.co.kr/) 7. 데이터 합치기와 정렬하기 1) append 함수로 데이터 프레임 합치기 ( 두 개의 데이터 프레임의 컬럼이 같은 구조일 것) 2) concat 함수로 데이터 프레임 합치기 3)ignore_index=true 옵션 : 합쳐진 데이터 프레임의 순서대로 인덱스 값 설정 4)하나의 데이터 프레임에 다른 데이터 프렘의 컬럼 추가하기 * 행 기준으로 추가할 경우 : 'axis=1' 옵션사용 X 컬럼 기준으로 추가할 경우 : 'axis=1' 옵션사용 O 5) merge 함수 : 여러 군데에 나눠져 있는 데이터를 합치는 함수 6) sort_values 함수 : 데이터 정렬 가능 * ascending=False 옵션.. 2020. 12. 6.
[DATA한입] 파이썬을 활용한 경영데이터 분석(5) [DATA한입] 파이썬을 활용한 경영데이터 분석(5) (출처 :campus.hunet.co.kr/) 6.기술통계계산과 요약 1.기술통계계산 1) describe : 컬럼의 기본적인 특징을 나타내는 요약정보 2) include='all' : 모든 유형의 컬럼에 대한 기초 통계정보 확인 가능 * NA값(값이 비거나 없는 수)을 갖는 행이 있다면, count(행의 수)에서 제외하여 통계됨 3)regyear, regmon : 연도와 달은 실질적으로 범주형에 가까움 pd.Categorical() : regyear를 범주형 변수로 변경 4) 딕셔너리 변수 만들기 *pd.DataFrame() : 딕셔너리를 데이터 프레임으로 변경 5)NaN 값을 가진 행을 제거하거나 임의의 값으로 변경하기 *Customer.type... 2020. 12. 5.
[DATA한입] 파이썬을 활용한 경영데이터 분석(4) [DATA한입] 파이썬을 활용한 경영데이터 분석(3) (출처 :campus.hunet.co.kr/) 5.데이터 불러오기와 다루기 1. 데이터 불러오기 1) NumPy : 연산, 통계 기능들을 모아놓은 라이브러리 Pandas : NumPy 기반으로 개발된 빠르고 쉬운 데이터 분석 도구 제공 2) 데이터 불러오기 데이터를 불러오기 위해 pandas 패키지를 불러와야 합니다. 3) read_csv 함수로 불러온 파일을 customer 변수에 할당합니다. 4) 데이터 첫 번째 줄이 컬럼이 아닐경우, 'header=None' 삽입 5) 불러오는 다양한 옵션 - encoding : 한글 데이터를 불러오는 인코딩 방식 지정 'euc-kr' 혹은 'CP949' 6) 엑셀파일 불러오기 2. 데이터 프레임 1) DATAF.. 2020. 12. 5.
[DATA한입] 파이썬을 활용한 경영데이터 분석(3) [DATA한입] 파이썬을 활용한 경영데이터 분석(3) (출처 :campus.hunet.co.kr/) 여러개의 값을 가지는 변수 1. 리스트 1) 리스트 : 하나의 변수가 여러 개의 값을 가지도록 선언 * 대괄호 [ ] 로 표시 2) Python은 원소의 인덱스가 '0'부터 시작한다. 3) len(length) 함수 : 원소의 갯수를 알려줌 4) 특정범위의 원소를 불러올 수 있음 5) 비어있는 리스트 선언 : stuff 변수 입력 -> list ( ) 입력 append( ) : 리스트 변수에 원소 추가 6) in, not in : 리스트 변수가 특정 값을 가지고 있는지 확인 7) sort ( ) : 원소들을 순서대로 정렬 max( ) , min( ) , sum( ) 2. 딕셔너리 1) 리스트 : 순서 기반.. 2020. 11. 30.