실습 소개

이 실습에서는 마케팅 분석가 인 Emma의 인물로 가정하고 진행합니다. Emma는 Oracle Advanced Analytics를 사용하여 현재 및 과거 판매 패턴을 검토하고 해미 (데이터 과학자)의 머신러닝 학습 결과를 사용하여 중요한 고객을 대상으로하는 새로운 마케팅 프로젝트를 지원합니다. Emma는 팀원 중 일부와 협력하여 이미 Oracle Advanced Analytics를 사용하여 판매 데이터를 검토하고 있습니다. Emma는 보다 좋은 마케팅을 위하여 Data Visualization 컨텐트를 검토하려고합니다. 그녀는 다른 분석가의 콘텐츠를 가져 와서 판매 관점을 검토 한 다음 해미가 만든 신용평가 머신러닝 결과에 대한 시각화를 작성합니다.

Lab100의 Step7에서 생성한 Oracle Machine Learning 인스턴스를 사용하여 이번 실습을 진행합니다.

실습 목표

Oracle Advanced Analytics에 로그인하고 Sales.dva 프로젝트 임포트
지난 4 년간 판매 정보가 포함된 사전 제작된 대시 보드를 검토
ADWC wallet을 업로드하고 새로운 ADWC 연결 생성
새로운 credit_scoring_100k 데이터 파일 생성
신용 점수 데이터에 대한 콘텐츠 생성

사전 준비 사항

A Trial Account

Steps

판매 이력 검토

STEP 1: Oracle Analytics Cloud에 로그인하고 Sales.dva 프로젝트 임포트

Dashboard에서 Analytics Cloud 서비스를 선택합니다.
오른쪽 끝에 있는 메뉴 아이콘을 클릭하고, Oracle Analytics Cloud URL 메뉴를 선택합니다.
오른쪽 상단의 메뉴 아이콘을 클릭하여 메뉴를 확장합니다.
기존 프로젝트를 가져와서 새 프로젝트를 만듭니다. 왼쪽에있는Project를 선택하십시오.
현재 작업 공간에서 All Projects 를 선택하십시오.
오른쪽 상단의 메뉴에서 Import Project 를 선택하십시오.
git의 install 디렉토리에서 Sales.dva 파일을 다운로드하고, 해당 파일을 선택합니다.

STEP 2: 지난 4 년간 판매 정보가 포함된 사전 제작된 대시보드 검토

위의 단계에서 임포트한 Sales 프로젝트를 선택합니다.
마케팅 분석가가 생성하여 공유한 콘텐츠를 검토합니다. 현재 시각화관점으로 보여지는 그래프입니다. 준비와설명 - Presentation Mode 관점으로도 가능합니다. 설명 탭을 선택하십시오.
캔버스의 왼쪽에서 오른쪽으로 검토할 수 있는 페이지 입니다. Customer Profitabliity는 Emma가 새로운 마케팅 프로젝트와 관련하여 특히 중요하게 생각합니다. Emma는 OAC를 사용하여 다른 방식의 시각화를 통해 다양하게 검토할 수 있습니다.
지점 별 매추 퍼포먼스 비교 캔버스에서, 마우스로 여러 사무실을 이동해 보십시요. 밴쿠버와 Perth지역에는 동일하게 117 개 사무소가 있지만 벤쿠버가 수익성은 훨씬 낮습니다. 이 지역은 마케팅 캠페인 성과 분석 등에 집중하게 될 것입니다. 앞으로의 상황에 대해 머신러닝이 분석한 사항을 논의하기 위해, 해미에게 노트를 남기겠습니다.

[]
해미에게 남길 노트를 생성합니다. - 오른쪽 상단의 note 아이콘을 선택하여 다음과 같이 메시지를 남깁니다. 해미님, 벤쿠버와 Perth 두 개의 판매 지점에서 왜 이런 수익성 차이가 나는지 분서해 줄 수 있으세요? 고객수는 117명으로 동일한데 수익성 차이가 좀 크네요..
다른 캔버스를 선택하여 검토해 보겠습니다.
생성 되었지만, 선택되지 않은 몇 가지 흥미로운 캔버스가 있음을 주목합니다. 상위 매출 나라분석 과 다이어그램 캔버스를 아래로 드래그 앤 드롭하십시오.

STEP 3: ADWC wallet을 업로드하고 새로운 ADWC 연결 생성

화면 왼쪽 상단의 왼쪽 햄버거 메뉴를 클릭하고, Data를 선택합니다.

차례대로 상단 메뉴에서 Connections 선택, Create 버튼을 선택하고 Connection아이콘을 선택합니다.

Type에서 Oracle Autonomous Data Warehouse Cloud를 선택합니다.
연결정보의 세부 사항을 다음과 같이 입력하고, Save 버튼 클릭합니다.
- Client Credentials 오른쪽의 Select...버튼을 클릭하고, 다운로드한 wallet.zip 파일을 선택합니다.

STEP 4: 데이터 셋 생성

상단 메뉴의 Data Sets 탭을 선택하고, Create-> Data Set 선택 합니다.
방금 생성한 adwc 연결 아이콘을 선택합니다.
ADWC_WS 스키마를 선택합니다.
AI_EXPLAIN_OUTPUT_CREDIT_SCORE_BIN 테이블을 선택하고, Add All 클릭하고, Add 클릭합니다.
다음 데이터 셋을 생성하기 위해 < 아이콘을 클릭합니다.
다시 Create 선택하고, 나머지 데이터 셋 생성작업을 반복합니다.
adwc 데이터 소스를 선택, ADWC_WS 스키마를 선택하여, 다음 4개의 테이블에 대해 위와 동일한 방법으로 테이터 셋 생성작업을 하십시요.

-   `AI_EXPLAIN_OUTPUT_MAX_CC_SPENT_AMOUNT`
-   `CREDIT_SCORING_100K_V`
-   `CREDIT_SCORE_NEW_PREDICTIONS`
-   `N1_LIFT_TABLE`

STEP 5: 좋은 신용 요소 분석 생성

왼쪽메뉴에서 Projects 선택하고, Create 버튼 클릭합니다..
Shift 키를 누른 상태에서 다음과 같이 선택하여 새 프로젝트에 추가합니다.
분석을 위해 각 변수들에 대한 TYPE 변환을 실행 하겠습니다. 준비 탭으로 이동하고 화면 아래 tab에서 N1_LIFT_TABLE 데이터셋을 클릭합니다.
QUANTILE_NUMBER 속성을 #[측정단위]에서 A[속성]으로 변경합니다.
다시 화면 아래 tab에서 CREDIT_SCORE_NEW_PREDICTIONS 데이터셋을 클릭합니다.
모든 컬럼을 A[속성]으로 변경합니다.
마지막으로 화면 아래 tab에서 CREDIT_SCORING_100K_V 데이터셋을 클릭합니다.
마찬가지로 모든 컬럼을 A[속성]으로 변경합니다.
왼쪽 메뉴를 보면 [준비] 작업에서 변경했던 변경 이력들이 순서대로 나열됩니다.
맨 아래 [스크립트 적용]을 클릭해야 모든 변경사항들이 적용됩니다.
변경했으면 화면 우측 상단의 [시각화] 탭을 클릭하여 이동합니다.
AI_EXPLAIN_OUTPUT_CREDIT_SCORE_BIN 에서 ATTRIBUTE_NAME 과 EXPLANATORY_VALUE를 선택하고 드래그하여 컨버스로 이동시킵니다.
RANK에서 마우스 오른버튼 클릭하여, Create Filter를 선택합니다.
Start = 0, End = 10 입력합니다..
EXPLANATORY_VALUE에서 오른버튼 클릭하여 "정렬" -> "내림차순"을 선택합니다.
캔버스 이름 캔버스 1을 Good Credit Factors로 변경합니다.
새 프로젝트를 저장합니다. 상단 오른쪽 'Save' 버튼을 클릭하고, 'Save As'를 선택 Credit Risk Analysis이름으로 프로젝트를 저장합니다.

STEP 6: 최대 CC 한도 분석

이번 분석은 위의 분석과 매우 유사합니다. 새 Canvas를 만들기 위해 페이지 하단의 + 기호를 클릭합니다.
다음과 같이 두개 필드를 ctrl + [마우스 클릭]으로 Multi-Select 하여 오늘쪽 캔버스로 드래그 합니다.
RANK 속성에서 마우스 오른버튼 클릭하여 Create Filter를 선택하고, Start = 0 과 End =10 값을 입력합니다.
EXPLANATORY_VALUE에서 마우스 오른버튼 클릭하여, '정렬' -> '내림차순' 메뉴를 선택합니다.
캔버스 이름을 Max CC Limit으로 변경합니다.

STEP 7: 누적 상승도 (Cumulative Lift) 분석

새 캔버스를 만들고 N1_LIFT_TABLE에서 '내 계산'을 마우스 오른쪽 단추로 클릭하여 '계산 추가'를 클릭합니다.
Calculation 이름으로 Chance로 입력하고, 값을 RSUM(.01)로 입력합니다.
아래의 필드를 ctrl + [마우스 클릭] 으로 Multi-Select 후 드래그하여 캔버스로 이동시킵니다.
시각화(visualization)를 선차트로 변경하고, 3 개의 값 (Chance,QUANTILE_NUMBER 및GAIN_CUMULATIVE)을 아래 표시된 위치로 이동시킵니다.
맨 왼쪽의 시각화(visualization) 팔레트를 클릭하고 텍스트 상자를 선택하고, 차트 위로 드래그 합니다.
텍스트 상자를 두 번 클릭하고 Cumulative Lift를 입력하고, 글꼴 크기를 20으로 설정합니다.
텍스트 상자를 다시 두 번 클릭하고 다음과 같이 입력합니다. (글꼴 크기를 12로 설정) :

누적 리프트(Cumulative lift)는 모델로 인해 예측된 값이 우연히 얻을 수 있는 예측 보다 얼마나 더 나은 결과를 도출할 수 있는지를 가늠해볼 수 있는 평가 metric 중 하나입니다. 
계산식 : (모델에서 예측한 'Good Credit'을 가진 고객의 확률) / (test data에서 실제로 'Good Credit'을 가진 고객의 확률) 
예를 들어 실제 전체 고객의 40%의 고객이 Good Credit 인데 모델이 그 중 75%를 정확하게 맞췄다면, lift는 75를 40으로 나눈 1.875가 됩니다. 

Lift는 data를 quantiles 이라고 하는 그룹으로 나누어 계산되는데 각 quantile은 동일한 개수의 row 수를 가지는 그룹입니다. quantile 이 높을 수록 'Good Credit' 즉 좋은 신용도로 평가받은 고객 군이 포진되어 있습니다. 따라서 이 예제에서는 quantile 이 100인 고객그룹은 가장 높은 확률로 좋은 신용도로 평가받은 고객군이 포진해 있겠네요. 

이 그래프에서 우리가 사용한 Cumulative Gain 이라는 컬럼은 Good Credit(좋은 신용도)를 가진 고객의 총 수에 대한 누적 된 고객수의 비율을 의미합니다. 예를 들어 100명의 고객 중 40명이 좋은 신용도이면 y축인 Cumulative Gain 은 누적 고객에 따라 1/40, 2/40 ... 40/40 의 비율로 올라간다면 x축인 quantile은 전체 고객을 100분위로 나누어 1/100, 2/100 ... 100/100의 비율로 올라갑니다. 따라서 이 곡선은 x축을 기준으로 상위분위에서 좀더 높고, 기울기가 급하게 상승해야 좋은 모델이라고 할 수 있습니다. 원래는 Best Line을 정하고 실제 모델에서 측정된 cumulative gain 그래프가 Best Line과 가장 가까운 것이 좋은 그래프입니다.

컨버스 이름을 Cumulative Lift으로 변경합니다.
주기적으로 프로젝트를 저장하십시오.

STEP 8: Create Demographic Analysis.

페이지 하단의 +아이콘에서 마우스 오른쪽 버튼으로 클릭하고, 새 캔버스를 만든 다음 CREDIT_SCORE_NEW_PREDICTIONS에서 My Calculations 마우스 오른쪽 버튼으로 클릭하고 Add Calculation..을 선택합니다.
새 계산의 이름을 Row Count로 저장하고, Aggregate아래에서 Count*를 두번 클릭합니다.
CREDIT_SCORE_NEW_PREDICTIONS을 확장하고PROB_GOOD_CREDIT와Row Count를 선택하여 캔버스 위로 드래그합니다.
시각화(visualization)를 Table로 변경하고 PROB_GOOD_CREDIT에서 마우스 오른버튼을 클릭하여 Create Filter를 선택합니다.
50 이하의 모든 값을 선택하고, 햄버거 메뉴 아이콘을 마우스 오른쪽 버튼으로 클릭하고 Exclude Selections를 선택합니다.
왼쪽에 있는 시각화(visualization) 메뉴를 선택하고, 새로운 Pie 차트 선택합니다.
아래와 같이 오른쪽으로 드래그 합니다.
Pie 차트 영역을 클릭하고, 왼쪽의 데이터 요소(Data Elements) 아이콘을 클릭하고 다음 그림과 같이 항목을 드래그합니다.
Pie 차트를 클릭하고 왼쪽의 Data Values의 값(Value)을 설정합니다.
선택 사항 - CREDIT_SCORE_NEW_PREDICTION 항목에서 EDUCATION_LEVEL, LOAN_TYPE, MARITAL_STATUS를 crtl+[마우스 클릭]으로 multi-select한 후 오른쪽 클릭하고 CREATE FILTER를 선택합니다.
왼쪽의 시각화(visualization) 아이콘을 선택하고 아래로 스크롤하여 Text Box를 선택한 다음 맨 위로 드래그하십시오.
텍스트 편집을 클릭하고 다양한 인구통계학적 요소를 고려한 고객신용도 평가 라는 제목을 입력합니다. 글꼴 크기를 20으로 설정하고, 다음을 추가합니다.

다양한 인구통계학적 요인에 대한 신용확률을 보여줍니다. 위의 필터를 조정하여 좋은신용도에 영향을 미치는 요인에 대해 다각도로 분석할 수 있습니다.

캔버스 이름을 인구통계학적 분석으로 지정합니다.

STEP 9: 신용점수 데이터의 다른 요인 분석

위에서 우리는CREDIT_SCORE_NEW_PREDICTIONS 테이블에 있는 좋은 신용을 예측하는 데 사용 된 요소의 하위 집합을 살펴 보았습니다. CREDIT_SCORING_100K_V 데이터 세트의 다른 요소를 분석하여 다른 요인을 분석할 수 있습니다.

새로운 캔버스를 만들고 왼쪽에 있는CREDIT_SCORING_100K_V를 확장하여PROB_GOOD_CREDIT,Row Count,Credit History를 캔버스 위로 드래그합니다. 시각화(visualization)를 'Pivot으로 설정하십시오.
PROB_GOOD_CREDIT에 필터를 추가하고, 필드를 마우스 오른쪽 단추로 클릭하여 50 이상의 모든 값을 클릭하십시오.
CREDIT_HISTORY를 오른쪽 클릭하고 상자 바깥 쪽을 클릭하여 모든 값이 기본값으로 선택되도록 합니다.
새 시각화(visualization)를 추가합니다 - 트리 맵(Treemap)을 선택하고 피벗 테이블 아래로 끌어 놓습니다.

[![](https://github.com/oracle/learning-library/raw/master/workshops/adwc4dev/images/IL-400/095.png)](https://github.com/oracle/learning-library/blob/master/workshops/adwc4dev/images/IL-400/095.png)

Treemap 시각화를 선택하고, 데이터 요소를 선택하십시오. 다음과 같이 항목을 드래그 합니다.

STEP 10: 보다 나은 분석을 위한 다양한 시각화

새 컨버스를 생성하고, FAMILY_SIZE, PROB_GOOD_CREDIT, ROW_COUNT 을 드래그하여 컨버스로 이동시킵니다. Network 시각화(visualization)를 선택합니다.
높은 확률만 집중하기 위하여, PROB_GOOD_CREDIT 에 필터를 만들고 50 이상을 선택합니다.
차원을 하나 더 추가합니다. - 다음과 같이 RESIDENTIAL STATUS를 선택, 드래그하여 Category로 넣습니다.
좋은 신용에 대한 완벽한 예측 가능성을 가진 사람들에 포커싱하겠습니다. 노드 100 에서 마우스 오른쪽 버튼으로 클릭하고 Keep Selected를 선택합니다.
도출된 결과를 통해, 2~3 명의 자녀를 둔 주택 소유자인 고객이 일반적으로 좋은 평판을 받았습니다.
이를 통해 우리는 개별 customer_id로 보다 심도있게 하여 마케팅 캠페인을 실행하거나 추가 분석을 수행 할 수 있습니다. Oracle Machine Learning과 결합된 다양한 시각화는 다양한 비즈니스 애플리케이션을 지원하는 흥미로운 데이터 패턴을 식별 할 수있는 방법을 제공합니다. 이 경우 Emma는 제한된 마케팅 예산을 판매 프로모션의 효과를 극대화하는 활동에 집중할 수 있습니다.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

실습 소개

실습 목표

사전 준비 사항

Steps

판매 이력 검토

STEP 1: Oracle Analytics Cloud에 로그인하고 Sales.dva 프로젝트 임포트

STEP 2: 지난 4 년간 판매 정보가 포함된 사전 제작된 대시보드 검토

STEP 3: ADWC wallet을 업로드하고 새로운 ADWC 연결 생성

STEP 4: 데이터 셋 생성

STEP 5: 좋은 신용 요소 분석 생성

STEP 6: 최대 CC 한도 분석

STEP 7: 누적 상승도 (Cumulative Lift) 분석

STEP 8: Create Demographic Analysis.

STEP 9: 신용점수 데이터의 다른 요인 분석

STEP 10: 보다 나은 분석을 위한 다양한 시각화

FilesExpand file tree

Lab400.md

Latest commit

History

Lab400.md

File metadata and controls

실습 소개

실습 목표

사전 준비 사항

Steps

판매 이력 검토

STEP 1: Oracle Analytics Cloud에 로그인하고 Sales.dva 프로젝트 임포트

STEP 2: 지난 4 년간 판매 정보가 포함된 사전 제작된 대시보드 검토

STEP 3: ADWC wallet을 업로드하고 새로운 ADWC 연결 생성

STEP 4: 데이터 셋 생성

STEP 5: 좋은 신용 요소 분석 생성

STEP 6: 최대 CC 한도 분석

STEP 7: 누적 상승도 (Cumulative Lift) 분석

STEP 8: Create Demographic Analysis.

STEP 9: 신용점수 데이터의 다른 요인 분석

STEP 10: 보다 나은 분석을 위한 다양한 시각화