본문 바로가기

프로그램이야기/Python6

[DATA한입] 파이썬을 활용한 경영데이터 분석(6) [DATA한입] 파이썬을 활용한 경영데이터 분석(6) (출처 :campus.hunet.co.kr/) 7. 데이터 합치기와 정렬하기 1) append 함수로 데이터 프레임 합치기 ( 두 개의 데이터 프레임의 컬럼이 같은 구조일 것) 2) concat 함수로 데이터 프레임 합치기 3)ignore_index=true 옵션 : 합쳐진 데이터 프레임의 순서대로 인덱스 값 설정 4)하나의 데이터 프레임에 다른 데이터 프렘의 컬럼 추가하기 * 행 기준으로 추가할 경우 : 'axis=1' 옵션사용 X 컬럼 기준으로 추가할 경우 : 'axis=1' 옵션사용 O 5) merge 함수 : 여러 군데에 나눠져 있는 데이터를 합치는 함수 6) sort_values 함수 : 데이터 정렬 가능 * ascending=False 옵션.. 2020. 12. 6.
[DATA한입] 파이썬을 활용한 경영데이터 분석(5) [DATA한입] 파이썬을 활용한 경영데이터 분석(5) (출처 :campus.hunet.co.kr/) 6.기술통계계산과 요약 1.기술통계계산 1) describe : 컬럼의 기본적인 특징을 나타내는 요약정보 2) include='all' : 모든 유형의 컬럼에 대한 기초 통계정보 확인 가능 * NA값(값이 비거나 없는 수)을 갖는 행이 있다면, count(행의 수)에서 제외하여 통계됨 3)regyear, regmon : 연도와 달은 실질적으로 범주형에 가까움 pd.Categorical() : regyear를 범주형 변수로 변경 4) 딕셔너리 변수 만들기 *pd.DataFrame() : 딕셔너리를 데이터 프레임으로 변경 5)NaN 값을 가진 행을 제거하거나 임의의 값으로 변경하기 *Customer.type... 2020. 12. 5.
[DATA한입] 파이썬을 활용한 경영데이터 분석(4) [DATA한입] 파이썬을 활용한 경영데이터 분석(3) (출처 :campus.hunet.co.kr/) 5.데이터 불러오기와 다루기 1. 데이터 불러오기 1) NumPy : 연산, 통계 기능들을 모아놓은 라이브러리 Pandas : NumPy 기반으로 개발된 빠르고 쉬운 데이터 분석 도구 제공 2) 데이터 불러오기 데이터를 불러오기 위해 pandas 패키지를 불러와야 합니다. 3) read_csv 함수로 불러온 파일을 customer 변수에 할당합니다. 4) 데이터 첫 번째 줄이 컬럼이 아닐경우, 'header=None' 삽입 5) 불러오는 다양한 옵션 - encoding : 한글 데이터를 불러오는 인코딩 방식 지정 'euc-kr' 혹은 'CP949' 6) 엑셀파일 불러오기 2. 데이터 프레임 1) DATAF.. 2020. 12. 5.
[DATA한입] 파이썬을 활용한 경영데이터 분석(3) [DATA한입] 파이썬을 활용한 경영데이터 분석(3) (출처 :campus.hunet.co.kr/) 여러개의 값을 가지는 변수 1. 리스트 1) 리스트 : 하나의 변수가 여러 개의 값을 가지도록 선언 * 대괄호 [ ] 로 표시 2) Python은 원소의 인덱스가 '0'부터 시작한다. 3) len(length) 함수 : 원소의 갯수를 알려줌 4) 특정범위의 원소를 불러올 수 있음 5) 비어있는 리스트 선언 : stuff 변수 입력 -> list ( ) 입력 append( ) : 리스트 변수에 원소 추가 6) in, not in : 리스트 변수가 특정 값을 가지고 있는지 확인 7) sort ( ) : 원소들을 순서대로 정렬 max( ) , min( ) , sum( ) 2. 딕셔너리 1) 리스트 : 순서 기반.. 2020. 11. 30.
[DATA한입] 파이썬을 활용한 경영데이터 분석(2) [DATA한입] 파이썬을 활용한 경영데이터 분석(2) (출처 :campus.hunet.co.kr/) 조건문 이론과 활용 1. 조건문 1) Python은 들여쓰기 여부로 실행 영역을 인식 2) 등호(=) 한개 : 할당하는 경우, 등호(==) 두개 : '같다' 뜻하는 경우 3) if else : 조건이 참일때 if 아래 영역 실행, 거짓일때 else 영역 실행 4) if 와 else 의 줄바꿈에 주의하자 2. 함수만들기 1) def(define) : 함수선언 function_name : 함수이름 (argument) : 함수의 인수 *자주 쓰는 함수를 직접 만들어 활용하자 3. 반복문 1)반복문 : 대량의 데이터를 반복처리 2) while *Python은 if/while의 영역을 들여쓰기로 구분 3) brea.. 2020. 11. 30.
[DATA한입] 파이썬을 활용한 경영데이터 분석(1) 01.파이썬을 활용한 경영데이터 분석 어제 IT 직원한테 추천받은 휴넷 강의를 오늘부터 리뷰해보려고 합니다. (출처 :campus.hunet.co.kr/) 과정은 파이썬의 기본적인 사용방법에 대한 내용이고 19시간 정도 학습분량인데 빨리듣기로 일주일에 완강을 목표로 하고 있습니다^^ 2. Pythond의 기본적인 문법 1. 변수정의 *변수의 이름을 정하는 규칙 1)프로그램밍에 사용되는 특정 단어들은 피해라 2)여러 개의 단어 구성시, 구분하기 쉽게 이름을 정하라 3)대소문자를 구별하여 정하라 4)변수의 의미를 고려하여 정하라 5)변수 이름을 과도하게 축약하지 마라 '변수이름 = 변수에 할당되는값'의 순서로 입력하기 2. 변수의 연산 1)시작되는 줄의 위치를 동일하게 위치 2)%(나머지) 연산은 나머지값으.. 2020. 11. 28.