본문 바로가기

프로그램이야기54

[DATA한입] 파이썬을 활용한 경영데이터 분석(6) [DATA한입] 파이썬을 활용한 경영데이터 분석(6) (출처 :campus.hunet.co.kr/) 7. 데이터 합치기와 정렬하기 1) append 함수로 데이터 프레임 합치기 ( 두 개의 데이터 프레임의 컬럼이 같은 구조일 것) 2) concat 함수로 데이터 프레임 합치기 3)ignore_index=true 옵션 : 합쳐진 데이터 프레임의 순서대로 인덱스 값 설정 4)하나의 데이터 프레임에 다른 데이터 프렘의 컬럼 추가하기 * 행 기준으로 추가할 경우 : 'axis=1' 옵션사용 X 컬럼 기준으로 추가할 경우 : 'axis=1' 옵션사용 O 5) merge 함수 : 여러 군데에 나눠져 있는 데이터를 합치는 함수 6) sort_values 함수 : 데이터 정렬 가능 * ascending=False 옵션.. 2020. 12. 6.
[DATA한입] 파이썬을 활용한 경영데이터 분석(5) [DATA한입] 파이썬을 활용한 경영데이터 분석(5) (출처 :campus.hunet.co.kr/) 6.기술통계계산과 요약 1.기술통계계산 1) describe : 컬럼의 기본적인 특징을 나타내는 요약정보 2) include='all' : 모든 유형의 컬럼에 대한 기초 통계정보 확인 가능 * NA값(값이 비거나 없는 수)을 갖는 행이 있다면, count(행의 수)에서 제외하여 통계됨 3)regyear, regmon : 연도와 달은 실질적으로 범주형에 가까움 pd.Categorical() : regyear를 범주형 변수로 변경 4) 딕셔너리 변수 만들기 *pd.DataFrame() : 딕셔너리를 데이터 프레임으로 변경 5)NaN 값을 가진 행을 제거하거나 임의의 값으로 변경하기 *Customer.type... 2020. 12. 5.
[DATA한입] 파이썬을 활용한 경영데이터 분석(4) [DATA한입] 파이썬을 활용한 경영데이터 분석(3) (출처 :campus.hunet.co.kr/) 5.데이터 불러오기와 다루기 1. 데이터 불러오기 1) NumPy : 연산, 통계 기능들을 모아놓은 라이브러리 Pandas : NumPy 기반으로 개발된 빠르고 쉬운 데이터 분석 도구 제공 2) 데이터 불러오기 데이터를 불러오기 위해 pandas 패키지를 불러와야 합니다. 3) read_csv 함수로 불러온 파일을 customer 변수에 할당합니다. 4) 데이터 첫 번째 줄이 컬럼이 아닐경우, 'header=None' 삽입 5) 불러오는 다양한 옵션 - encoding : 한글 데이터를 불러오는 인코딩 방식 지정 'euc-kr' 혹은 'CP949' 6) 엑셀파일 불러오기 2. 데이터 프레임 1) DATAF.. 2020. 12. 5.
13.데이터 전처리를 위한 SAS명령어(2) 13.데이터 전처리를 위한 SAS명령어(2) 출처 : wikidocs.net/31046 위키독스 온라인 책을 제작 공유하는 플랫폼 서비스 wikidocs.net 5-2. 수식을 활용한 계산 (1)명령어 YYY=XXX+N; : 칼럼 YYY를 숫자 칼럼 XXX에 숫자 N을 더한 변수로 정의합니다. YYY+N; : 숫자 칼럼 YYY에 숫자 N을 더합니다. (2) 예제_1 아래 코드로 실행해 보았습니다. 새로운 테이블 TEST명으로 생성합니다. 테이블 SASSHELP.CLASSS로 불러오되 칼럼 AGE2는 AGE에 1을 더한 값입니다. (2) 예제_2 아래 코드로 실행해 보았습니다. 새로운 테이블 TEST명으로 생성합니다. 테이블 SASSHELP.CLASSS로 불러오되 칼럼 AGE2는 AGE에 1을 더한 값입니.. 2020. 12. 3.
[DATA한입] 파이썬을 활용한 경영데이터 분석(3) [DATA한입] 파이썬을 활용한 경영데이터 분석(3) (출처 :campus.hunet.co.kr/) 여러개의 값을 가지는 변수 1. 리스트 1) 리스트 : 하나의 변수가 여러 개의 값을 가지도록 선언 * 대괄호 [ ] 로 표시 2) Python은 원소의 인덱스가 '0'부터 시작한다. 3) len(length) 함수 : 원소의 갯수를 알려줌 4) 특정범위의 원소를 불러올 수 있음 5) 비어있는 리스트 선언 : stuff 변수 입력 -> list ( ) 입력 append( ) : 리스트 변수에 원소 추가 6) in, not in : 리스트 변수가 특정 값을 가지고 있는지 확인 7) sort ( ) : 원소들을 순서대로 정렬 max( ) , min( ) , sum( ) 2. 딕셔너리 1) 리스트 : 순서 기반.. 2020. 11. 30.
[DATA한입] 파이썬을 활용한 경영데이터 분석(2) [DATA한입] 파이썬을 활용한 경영데이터 분석(2) (출처 :campus.hunet.co.kr/) 조건문 이론과 활용 1. 조건문 1) Python은 들여쓰기 여부로 실행 영역을 인식 2) 등호(=) 한개 : 할당하는 경우, 등호(==) 두개 : '같다' 뜻하는 경우 3) if else : 조건이 참일때 if 아래 영역 실행, 거짓일때 else 영역 실행 4) if 와 else 의 줄바꿈에 주의하자 2. 함수만들기 1) def(define) : 함수선언 function_name : 함수이름 (argument) : 함수의 인수 *자주 쓰는 함수를 직접 만들어 활용하자 3. 반복문 1)반복문 : 대량의 데이터를 반복처리 2) while *Python은 if/while의 영역을 들여쓰기로 구분 3) brea.. 2020. 11. 30.
[DATA한입] 파이썬을 활용한 경영데이터 분석(1) 01.파이썬을 활용한 경영데이터 분석 어제 IT 직원한테 추천받은 휴넷 강의를 오늘부터 리뷰해보려고 합니다. (출처 :campus.hunet.co.kr/) 과정은 파이썬의 기본적인 사용방법에 대한 내용이고 19시간 정도 학습분량인데 빨리듣기로 일주일에 완강을 목표로 하고 있습니다^^ 2. Pythond의 기본적인 문법 1. 변수정의 *변수의 이름을 정하는 규칙 1)프로그램밍에 사용되는 특정 단어들은 피해라 2)여러 개의 단어 구성시, 구분하기 쉽게 이름을 정하라 3)대소문자를 구별하여 정하라 4)변수의 의미를 고려하여 정하라 5)변수 이름을 과도하게 축약하지 마라 '변수이름 = 변수에 할당되는값'의 순서로 입력하기 2. 변수의 연산 1)시작되는 줄의 위치를 동일하게 위치 2)%(나머지) 연산은 나머지값으.. 2020. 11. 28.
12.데이터 전처리를 위한 SAS명령어(1) 12.데이터 전처리를 위한 SAS명령어(1) 출처 : wikidocs.net/31045 위키독스 온라인 책을 제작 공유하는 플랫폼 서비스 wikidocs.net 5-1. KEEP과 DROP (1)명령어 DATA XXX: 새로운 테이블 XXX를 생성합니다 SET YYY: 기존 테이블 YYY를 불러옵니다. KEEP ZZZ: 칼럼 ZZZ를 테이블에서 유지합니다. DROP PPP: 칼럼 PPP를 테이블에서 버립니다. (2) 예제_1 아래 코드로 실행해 보았습니다. 새로운 테이블 TEST명으로 생성합니다. 테이블 SASSHELP.CLASSS로 불러오되 칼럼 AGE와 NAME만 유지합니다. 2) 예제_2 아래 코드로 실행해 보았습니다. 새로운 테이블 TEST명으로 생성합니다. 테이블 SASSHELP.CLASSS로 .. 2020. 11. 27.
11.포맷(FORMAT)의 개념(3) 11.포맷(FORMAT)의 개념(3) 출처 : wikidocs.net/31042 위키독스 온라인 책을 제작 공유하는 플랫폼 서비스 wikidocs.net 4-3. 날짜 포맷 (1) 명령어 포맷 명령어 포맷 설명 포맷 예시 입력 값 포맷 출력값 DATE숫자. 숫자값을 날짜값으로 변경(일월년) DATE9. 3 4JAN1960 YYMMDD숫자. 숫자값을 날짜값으로 변경(연도-월-일) YYMMDD10. 3 1960-01-04 WEEKDATE. 숫자값을 날짜값으로 변경(요일, 월일, 연도) WEEKDATE. 3 Monday, January 4, 1960 WORDDATE. 숫자값을 날짜값으로 변경(월일, 연도) WORDDATE 3 January 4, 1960 NLDATE숫자. 숫자값을 날짜값으로 변경(연도 월 일).. 2020. 11. 24.
10.포맷(FORMAT)의 개념(2) 10.포맷(FORMAT)의 개념(2) 출처 : wikidocs.net/31041 위키독스 온라인 책을 제작 공유하는 플랫폼 서비스 wikidocs.net 4-2. 문자 포맷 (1) 명령어 포맷 명령어 포맷 설명 포맷 예시 입력 값 포맷 출력값 $숫자. 자리 수만큼 문자를 표시 $6. 라이올라 라이올 (2) 예제 아래 코드로 실행해 보았습니다. 새로운 테이블 TEST명으로 생성합니다. 테이블에 name(문자형) , age(숫자형)으로 입력합니다. 테이블에 CARDS 내용을 입력합니다. *포맷을 설정할 때 ‘.’을 입력해주시는 건 대단히 중요합니다. ‘6.′,‘7.’처럼 포맷 형식의 마지막에 ‘.’을 찍어주세요. 이는 모든 포맷에 동일한 사항입니다. 2020. 11. 24.
9.포맷(FORMAT)의 개념(1) 9.포맷(FORMAT)의 개념(1) 출처 : wikidocs.net/31040 위키독스 온라인 책을 제작 공유하는 플랫폼 서비스 wikidocs.net 4-1. 숫자 포맷 (1) 명령어 포맷 명령어 포맷 설명 포맷 예시 입력 값 포맷 출력값 숫자. 자리 수만큼 정수 숫자값을 표시 5. 324.5678 325 숫자.숫자 앞자리 숫자만큼 전체 길이를 표현하고, 뒷자리 숫자만큼 소수로 표현(만약 입력값 길이가 앞자리 숫자를 초과할 경우 소수점 이하 길이가 축소될 수 있음) 6.2 324.5678 324.57 BEST숫자. ‘.’을 포함하여 숫자 자리수만큼 수를 표현(최상의 숫자 표기법으로 알려져 있음) BEST5. 324.5678 324.6 COMMA숫자.숫자 3자리 숫자값마다 ‘,’를 표시 COMMA5. 3.. 2020. 11. 24.
8.데이터 생성법(3) 8.데이터 생성법(3) 출처 :wikidocs.net/31043 위키독스 온라인 책을 제작 공유하는 플랫폼 서비스 wikidocs.net 3-3. 테이블을 불러와서 새 테이블 생성하기 (1) 명령어 DATA XXX: 새로운 테이블 XXX를 생성합니다. SET YYY: 기존 테이블 YYY를 불러옵니다. (2) 예제 아래 코드로 실행해 보았습니다. 새로운 테이블 TEST명으로 생성합니다. 기존에 sashelp라이브러리에서 테이블 class를 불러옵니다. *TEST 앞에는 라이브러리 명이 없으므로 임시 라이브러리인 WORK에 배정됩니다. 2020. 11. 23.
7.데이터 생성법(2) 7.데이터 생성법(2) 출처 : wikidocs.net/31039 위키독스 온라인 책을 제작 공유하는 플랫폼 서비스 wikidocs.net 3-2. 외부 데이터를 불러와서 테이블 생성하기 (1) 명령어 INFILE 'C:\SAS_TEST\TEST.TXT'; : 'C:\SAS_TEST\TEST.TXT' 파일을 불러오는 명령어 입니다. INPUT YYY $ ZZZ : 문자 변수 YYY와 숫자 변수 ZZZ를 생성함. DLM=‘X’ : 데이터의 구분자는 ‘,’로 구성돼 있음을 입력함. (숫자 변수는 변수명만 입력하면 되고 문자 변수는 변수명 뒤에 한 칸을 띄우고 $를 붙임) (2) 예제 아래 코드로 실행해 보았습니다. 2020. 11. 23.
6.데이터 생성법(1) 6.데이터 생성법(1) 출처 : wikidocs.net/31034 위키독스 온라인 책을 제작 공유하는 플랫폼 서비스 wikidocs.net 3-1. 직접 테이블 생성법 (1) 명령어 DATA XXX: 테이블 XXX를 생성함 INPUT YYY $ ZZZ: 문자 변수 YYY와 숫자 변수 ZZZ를 생성함(숫자 변수는 변수명만 입력하면 되고 문자 변수는 변수명 뒤에 한 칸을 띄우고 $를 붙임) CARDS; XX 1: XX와 1을 각각의 변수에 입력함(CARDS는 DATALINES로 바꿀 수 있습니다.) RUN: SAS 명령어 종료 (2) 예제_1 아래 코드로 실행해 보았습니다. 테이블 TEST명으로 생성합니다. 변수명은 name(문자) age(숫자) sex(문자)로 생성합니다. 변수에 cards 다음 내용을 입.. 2020. 11. 23.
5. PROC 사용법(4) 5. PROC 사용법(4) *출처 :wikidocs.net/31033 위키독스 온라인 책을 제작 공유하는 플랫폼 서비스 wikidocs.net 2-4. PROC FREQ(빈도 조회) (1) 명령어 PROC FREQ: FREQ 프로시저를 시행합니다. DATA=XXX: XXX라는 데이터를 불러옵니다. TABLE YYY ZZZ: 변수YYY와 ZZZ를 조회합니다. (2) 예제(1) 아래 코드로 실행해 보았습니다. SASHELP라이브러리의 CLASS테이블을 불러와서 실행해 주세요. CALSS테이블에서 AGE와 NAME의 빈도를 실행해 주세요. (1) 명령어 TABLE AGE * NAME : AGE와 NAME의 2차원 표를 조회합니다. (2) 예제(2) 아래 코드로 실행해 보았습니다. SASHELP라이브러리의 CL.. 2020. 11. 23.
4.PROC 사용법(3) 4.PROC 사용법(3) *출처 : wikidocs.net/31032 위키독스 온라인 책을 제작 공유하는 플랫폼 서비스 wikidocs.net 2-3. PROC CONTENTS(테이블 속성 보기) (1)명령어 PROC CONTENTS: CONTENTS 프로시저를 시행합니다. (2) 예제-1 아래 코드로 실행해 보았습니다. SASHELP라이브러리의 CLASS테이블을 불러와서 실행해 주세요. CALSS테이블의 속성정보를 보여주세요. *SAS작업을 하면서 CONTENTS 명령어를 통해 주로 확인하는 속성을 다음과 같습니다. 1.데이터셋 이름: 테이블 이름과 라이브러리명을 확인합니다. 2.생성일: 테이블 생성 일자를 확인합니다. 3.관측치: 관측값이 몇 개의 행으로 이뤄져 있는지 확인합니다. 4.변수: 변수가 .. 2020. 11. 23.
3. PROC 사용법(2) 3. PROC 사용법(2) *출처 : wikidocs.net/31031 위키독스 온라인 책을 제작 공유하는 플랫폼 서비스 wikidocs.net 2-2. PROC PRINT(테이블 보여주기) (1)명령어 PROC PRINT: PRINT 프로시저를 시행합니다. DATA=XXX: XXX라는 데이터를 불러옵니다. VAR XXX: 지정된 변수 XXX를 불러옵니다. ID XXX: 지정된 변수를 기준값으로 활용합니다. 기준값이란, 해당 행의 대푯값으로 활용하겠다는 의미입니다. BY XXX: 지정된 변수를 그룹으로 만듭니다. (2) 예제-1 아래 코드로 실행해 보았습니다. SASHELP라이브러리의 CLASS테이블을 불러와서 실행해 주세요 (3) 예제-2 아래 코드로 실행해 보았습니다. SASHELP라이브러리의 CLA.. 2020. 11. 20.
2. PROC 사용법(1) 2. PROC 사용법(1) *출처 : wikidocs.net/31030 위키독스 온라인 책을 제작 공유하는 플랫폼 서비스 wikidocs.net SAS에서 가장 많이 활용되는 간단한 명령어부터 공부하도록 하겠습니다. PROC SORT PROC PRINT PROC CONTENTS PROC FREQ 2-1. PROC SORT(순서대로 정렬하기) (1) 명령어 PROC SORT: SORT 프로시저를 시행합니다. DATA=XXX: XXX라는 데이터를 불러옵니다. OUT=YYY: 결과값을 YYY라는 테이블로 만듭니다. BY ZZZ: 변수ZZZ를 정렬합니다. DESCENDING: 내림차순으로 정렬합니다. (2) 예제 아래 코드로 실행해 보았습니다. SASHELP라이브러리에 있는 CLASS테이블을 불러오고 WORK라.. 2020. 11. 19.
1. SAS의 기초 1. SAS의 기초 *출처 : wikidocs.net/31021 1-1. 테이블과 라이브러리 - 무료프로그램인 SAS University Edition 기준으로 설명하도록 하겠습니다. - 개념정리 : 테이블은 '파일명' , 라이브러리는 '폴더명' - 라이브러리를 설정하지 않는다면 기본 라이브러리 'WORK' 라이브러리에 설정 우선 라이브러리를 만들어 주세요. 저는 'WI' 라고 했습니다. 코드문을 드레그 한다음 색반전이 되면 달리는 사람을 실행(F3) 하세요. 라이브러리가 할당되게 됩니다. 자 이제 본격적으로 명렁어를 하나씩 코드에 작성하도록 하겠습니다. 1) data xxx : xxx라는 이름의 테이블을 만들어주세요. 2) set yyy : yyy라는 이름의 테이블을 불러오세요. 3) run : SAS.. 2020. 11. 18.
chapter4. 보고서 생성 chapter4. 보고서 생성 1. 필드, 시각화하기 1) 시각화 시작하기 2) 보고서에 시각화 추가하기 3) 시각화 유형 변경하기 4) 시각화의 복사/이동, 삭제 및 확장하기 5) 보고서 저장하기 2. 유형별 시각화 작성 1) 콤보 차트로 영업사원별 매출계획과 매출이익 비교하기 2) 원형 차트로 분류별 매출금액 시각화하기 3) 계기(Gauge) 차트로 영업사원의 2년간 매출액을 비교하는 시각화 작성하기 4) 분산형 차트로 평균 매출단가와 이익율에 따른 매출의 크기 표시하기 3. 보고서 생성과 편집 1) 보고서에서 차트 정렬하기 2) 교차분석을 위한 시각적 상호 작용 3) 보고서 이름 변경하고 필요 없는 보고서 삭제하기 4. 보고서 필터와 서식으로 보고서 꾸미기 1) 보고서 제목 작성하기 2) 색 서식 .. 2020. 11. 18.
무료폰트_62570체 무료폰트_62570체 6·25전쟁 70주년 기념 글꼴 '62570체' 무료폰트 입니다. (출처 : www.mpva.go.kr/mpva/news/popupBoardView.do?id=3698) 다운로드 : software.naver.com/software/summary.nhn?softwareId=GWS_003334# 국가보훈처에서 무료로 배포하는 폰트이니 많이 사용해주세요^^ 보고서에 제목에 사용하기 좋을듯해서 다운받았습니다. 서체가 네모구조로 되어있어서 묵직한 느낌과 엄중함이 느껴지는 글에 사용하시면 느낌이 잘 맞을듯 해요. 2020. 11. 15.
chapter3. 파워BI 데이터 가져오기 chapter3. 파워BI 데이터 가져오기 1. Excel 워크시트 가져오기 1) 파일타입 : .xlsx / .xlsm , .pbix , .csv 2) 저장소타입 : 로컬드라이브, OneDrive-비지니스, OneDrive-개인, SharePoint-팀사이트 2. Excel 파워피벗 통합문서 가져오기 3. Excel 업로드 옵션으로 보고서 추가하기 2020. 11. 15.
chapter2. 파워BI 서비스 chapter2. 파워BI 서비스 1. Power BI 로그인 - Power BI 로그인하려면 직장/학교 전자 메일주소가 필요 - powerbi.com 접속 2. Power BI 포털 둘러보기 - 회사가입 후 업데이트 하겠습니다. 2020. 11. 15.
chapter1. 파워BI 소개하기 chapter1. 파워BI 소개하기 1. 하나의 창에서 전체상황 확인하기 2. 데이터를 기반으로 의사결정하기 3. 참고사이트 1) Power BI 공식사이트 : https://powerbi.com 2) Power BI 커뮤니티 : https://community.powerbi.com/ 3) Power BI 블로그 : https://powerbi.microsoft.com/ko-kr/blog/ 4) Power BI 한국 페이스북 그룹 : https://www.facebook.com/groups/PowerBIKorea 4. Power BI 요소 (Desktop, 서비스, 모바일) 5. 갤러리 2020. 11. 15.