이 실습에서는 마케팅 분석가 인 Emma의 인물로 가정하고 진행합니다. Emma는 Oracle Advanced Analytics를 사용하여 현재 및 과거 판매 패턴을 검토하고 해미 (데이터 과학자)의 머신러닝 학습 결과를 사용하여 중요한 고객을 대상으로하는 새로운 마케팅 프로젝트를 지원합니다. Emma는 팀원 중 일부와 협력하여 이미 Oracle Advanced Analytics를 사용하여 판매 데이터를 검토하고 있습니다. Emma는 보다 좋은 마케팅을 위하여 Data Visualization 컨텐트를 검토하려고합니다. 그녀는 다른 분석가의 콘텐츠를 가져 와서 판매 관점을 검토 한 다음 해미가 만든 신용평가 머신러닝 결과에 대한 시각화를 작성합니다.
Lab100의 Step7에서 생성한 Oracle Machine Learning 인스턴스를 사용하여 이번 실습을 진행합니다.
- Oracle Advanced Analytics에 로그인하고 Sales.dva 프로젝트 임포트
- 지난 4 년간 판매 정보가 포함된 사전 제작된 대시 보드를 검토
- ADWC wallet을 업로드하고 새로운 ADWC 연결 생성
- 새로운 credit_scoring_100k 데이터 파일 생성
- 신용 점수 데이터에 대한 콘텐츠 생성
- A Trial Account
-
오른쪽 끝에 있는 메뉴 아이콘을 클릭하고,
Oracle Analytics Cloud URL메뉴를 선택합니다.

-
오른쪽 상단의 메뉴 아이콘을 클릭하여 메뉴를 확장합니다.
-
기존 프로젝트를 가져와서 새 프로젝트를 만듭니다. 왼쪽에있는
Project를 선택하십시오. -
현재 작업 공간에서
All Projects를 선택하십시오. -
오른쪽 상단의 메뉴에서
Import Project를 선택하십시오. -
git의 install 디렉토리에서 Sales.dva 파일을 다운로드하고, 해당 파일을 선택합니다.
-
마케팅 분석가가 생성하여 공유한 콘텐츠를 검토합니다. 현재
시각화관점으로 보여지는 그래프입니다.준비와설명 - Presentation Mode관점으로도 가능합니다.설명탭을 선택하십시오. -
캔버스의 왼쪽에서 오른쪽으로 검토할 수 있는 페이지 입니다. Customer Profitabliity는 Emma가 새로운 마케팅 프로젝트와 관련하여 특히 중요하게 생각합니다. Emma는 OAC를 사용하여 다른 방식의 시각화를 통해 다양하게 검토할 수 있습니다.
-
지점 별 매추 퍼포먼스 비교캔버스에서, 마우스로 여러 사무실을 이동해 보십시요. 밴쿠버와 Perth지역에는 동일하게 117 개 사무소가 있지만 벤쿠버가 수익성은 훨씬 낮습니다. 이 지역은 마케팅 캠페인 성과 분석 등에 집중하게 될 것입니다. 앞으로의 상황에 대해 머신러닝이 분석한 사항을 논의하기 위해, 해미에게 노트를 남기겠습니다. -
해미에게 남길 노트를 생성합니다. - 오른쪽 상단의 note 아이콘을 선택하여 다음과 같이 메시지를 남깁니다.
해미님, 벤쿠버와 Perth 두 개의 판매 지점에서 왜 이런 수익성 차이가 나는지 분서해 줄 수 있으세요? 고객수는 117명으로 동일한데 수익성 차이가 좀 크네요.. -
생성 되었지만, 선택되지 않은 몇 가지 흥미로운 캔버스가 있음을 주목합니다.
상위 매출 나라분석과다이어그램캔버스를 아래로 드래그 앤 드롭하십시오.
- 화면 왼쪽 상단의 왼쪽 햄버거 메뉴를 클릭하고,
Data를 선택합니다.
- 차례대로 상단 메뉴에서
Connections선택,Create버튼을 선택하고Connection아이콘을 선택합니다.
-
연결정보의 세부 사항을 다음과 같이 입력하고, Save 버튼 클릭합니다.
- Client Credentials 오른쪽의 Select...버튼을 클릭하고, 다운로드한 wallet.zip 파일을 선택합니다.
-
AI_EXPLAIN_OUTPUT_CREDIT_SCORE_BIN테이블을 선택하고,Add All클릭하고,Add클릭합니다.

-
다음 데이터 셋을 생성하기 위해
<아이콘을 클릭합니다. -
adwc데이터 소스를 선택,ADWC_WS스키마를 선택하여, 다음 4개의 테이블에 대해 위와 동일한 방법으로 테이터 셋 생성작업을 하십시요.
- `AI_EXPLAIN_OUTPUT_MAX_CC_SPENT_AMOUNT`
- `CREDIT_SCORING_100K_V`
- `CREDIT_SCORE_NEW_PREDICTIONS`
- `N1_LIFT_TABLE`
-
왼쪽메뉴에서
Projects선택하고,Create버튼 클릭합니다.. -
분석을 위해 각 변수들에 대한 TYPE 변환을 실행 하겠습니다. 준비 탭으로 이동하고 화면 아래 tab에서
N1_LIFT_TABLE데이터셋을 클릭합니다.
-
다시 화면 아래 tab에서
CREDIT_SCORE_NEW_PREDICTIONS데이터셋을 클릭합니다. -
마지막으로 화면 아래 tab에서
CREDIT_SCORING_100K_V데이터셋을 클릭합니다. -
왼쪽 메뉴를 보면 [준비] 작업에서 변경했던 변경 이력들이 순서대로 나열됩니다.
-
맨 아래 [스크립트 적용]을 클릭해야 모든 변경사항들이 적용됩니다.
-
AI_EXPLAIN_OUTPUT_CREDIT_SCORE_BIN에서ATTRIBUTE_NAME과EXPLANATORY_VALUE를 선택하고 드래그하여 컨버스로 이동시킵니다.

-
RANK에서 마우스 오른버튼 클릭하여,Create Filter를 선택합니다. -
Start =
0, End =10입력합니다.. -
EXPLANATORY_VALUE에서 오른버튼 클릭하여 "정렬" -> "내림차순"을 선택합니다. -
캔버스 이름
캔버스 1을Good Credit Factors로 변경합니다. -
새 프로젝트를 저장합니다. 상단 오른쪽 'Save' 버튼을 클릭하고, 'Save As'를 선택
Credit Risk Analysis이름으로 프로젝트를 저장합니다.
-
이번 분석은 위의 분석과 매우 유사합니다. 새 Canvas를 만들기 위해 페이지 하단의 + 기호를 클릭합니다.
-
다음과 같이 두개 필드를 ctrl + [마우스 클릭]으로 Multi-Select 하여 오늘쪽 캔버스로 드래그 합니다.

-
RANK속성에서 마우스 오른버튼 클릭하여Create Filter를 선택하고,Start=0과End=10값을 입력합니다.
-
EXPLANATORY_VALUE에서 마우스 오른버튼 클릭하여, '정렬' -> '내림차순' 메뉴를 선택합니다. -
캔버스 이름을
Max CC Limit으로 변경합니다.
-
새 캔버스를 만들고 N1_LIFT_TABLE에서 '내 계산'을 마우스 오른쪽 단추로 클릭하여 '계산 추가'를 클릭합니다.
-
Calculation 이름으로
Chance로 입력하고, 값을RSUM(.01)로 입력합니다. -
아래의 필드를 ctrl + [마우스 클릭] 으로 Multi-Select 후 드래그하여 캔버스로 이동시킵니다.

-
시각화(visualization)를 선차트로 변경하고, 3 개의 값 (
Chance,QUANTILE_NUMBER및GAIN_CUMULATIVE)을 아래 표시된 위치로 이동시킵니다. -
맨 왼쪽의 시각화(visualization) 팔레트를 클릭하고 텍스트 상자를 선택하고, 차트 위로 드래그 합니다.

-
텍스트 상자를 다시 두 번 클릭하고 다음과 같이 입력합니다. (글꼴 크기를 12로 설정) :
누적 리프트(Cumulative lift)는 모델로 인해 예측된 값이 우연히 얻을 수 있는 예측 보다 얼마나 더 나은 결과를 도출할 수 있는지를 가늠해볼 수 있는 평가 metric 중 하나입니다.
계산식 : (모델에서 예측한 'Good Credit'을 가진 고객의 확률) / (test data에서 실제로 'Good Credit'을 가진 고객의 확률)
예를 들어 실제 전체 고객의 40%의 고객이 Good Credit 인데 모델이 그 중 75%를 정확하게 맞췄다면, lift는 75를 40으로 나눈 1.875가 됩니다.
Lift는 data를 quantiles 이라고 하는 그룹으로 나누어 계산되는데 각 quantile은 동일한 개수의 row 수를 가지는 그룹입니다. quantile 이 높을 수록 'Good Credit' 즉 좋은 신용도로 평가받은 고객 군이 포진되어 있습니다. 따라서 이 예제에서는 quantile 이 100인 고객그룹은 가장 높은 확률로 좋은 신용도로 평가받은 고객군이 포진해 있겠네요.
이 그래프에서 우리가 사용한 Cumulative Gain 이라는 컬럼은 Good Credit(좋은 신용도)를 가진 고객의 총 수에 대한 누적 된 고객수의 비율을 의미합니다. 예를 들어 100명의 고객 중 40명이 좋은 신용도이면 y축인 Cumulative Gain 은 누적 고객에 따라 1/40, 2/40 ... 40/40 의 비율로 올라간다면 x축인 quantile은 전체 고객을 100분위로 나누어 1/100, 2/100 ... 100/100의 비율로 올라갑니다. 따라서 이 곡선은 x축을 기준으로 상위분위에서 좀더 높고, 기울기가 급하게 상승해야 좋은 모델이라고 할 수 있습니다. 원래는 Best Line을 정하고 실제 모델에서 측정된 cumulative gain 그래프가 Best Line과 가장 가까운 것이 좋은 그래프입니다.
-
페이지 하단의
+아이콘에서 마우스 오른쪽 버튼으로 클릭하고, 새 캔버스를 만든 다음CREDIT_SCORE_NEW_PREDICTIONS에서My Calculations마우스 오른쪽 버튼으로 클릭하고Add Calculation..을 선택합니다.

-
CREDIT_SCORE_NEW_PREDICTIONS을 확장하고PROB_GOOD_CREDIT와Row Count를 선택하여 캔버스 위로 드래그합니다.

-
시각화(visualization)를
Table로 변경하고PROB_GOOD_CREDIT에서 마우스 오른버튼을 클릭하여Create Filter를 선택합니다. -
50 이하의 모든 값을 선택하고, 햄버거 메뉴 아이콘을 마우스 오른쪽 버튼으로 클릭하고
Exclude Selections를 선택합니다.

-
Pie 차트 영역을 클릭하고, 왼쪽의 데이터 요소(Data Elements) 아이콘을 클릭하고 다음 그림과 같이 항목을 드래그합니다.

-
Pie 차트를 클릭하고 왼쪽의
Data Values의 값(Value)을 설정합니다. -
선택 사항 - CREDIT_SCORE_NEW_PREDICTION 항목에서 EDUCATION_LEVEL, LOAN_TYPE, MARITAL_STATUS를 crtl+[마우스 클릭]으로 multi-select한 후 오른쪽 클릭하고
CREATE FILTER를 선택합니다. -
왼쪽의 시각화(visualization) 아이콘을 선택하고 아래로 스크롤하여
Text Box를 선택한 다음 맨 위로 드래그하십시오.
-
텍스트 편집을 클릭하고
다양한 인구통계학적 요소를 고려한 고객신용도 평가라는 제목을 입력합니다. 글꼴 크기를 20으로 설정하고, 다음을 추가합니다.
다양한 인구통계학적 요인에 대한 신용확률을 보여줍니다. 위의 필터를 조정하여 좋은신용도에 영향을 미치는 요인에 대해 다각도로 분석할 수 있습니다.
위에서 우리는CREDIT_SCORE_NEW_PREDICTIONS 테이블에 있는 좋은 신용을 예측하는 데 사용 된 요소의 하위 집합을 살펴 보았습니다. CREDIT_SCORING_100K_V 데이터 세트의 다른 요소를 분석하여 다른 요인을 분석할 수 있습니다.
-
새로운 캔버스를 만들고 왼쪽에 있는
CREDIT_SCORING_100K_V를 확장하여PROB_GOOD_CREDIT,Row Count,Credit History를 캔버스 위로 드래그합니다. 시각화(visualization)를 'Pivot으로 설정하십시오. -
PROB_GOOD_CREDIT에 필터를 추가하고, 필드를 마우스 오른쪽 단추로 클릭하여 50 이상의 모든 값을 클릭하십시오. -
CREDIT_HISTORY를 오른쪽 클릭하고 상자 바깥 쪽을 클릭하여 모든 값이 기본값으로 선택되도록 합니다.

-
새 시각화(visualization)를 추가합니다 - 트리 맵(Treemap)을 선택하고 피벗 테이블 아래로 끌어 놓습니다.
[](https://github.com/oracle/learning-library/blob/master/workshops/adwc4dev/images/IL-400/095.png)
-
새 컨버스를 생성하고,
FAMILY_SIZE,PROB_GOOD_CREDIT,ROW_COUNT을 드래그하여 컨버스로 이동시킵니다.Network시각화(visualization)를 선택합니다. -
높은 확률만 집중하기 위하여,
PROB_GOOD_CREDIT에 필터를 만들고 50 이상을 선택합니다. -
차원을 하나 더 추가합니다. - 다음과 같이
RESIDENTIAL STATUS를 선택, 드래그하여Category로 넣습니다. -
좋은 신용에 대한 완벽한 예측 가능성을 가진 사람들에 포커싱하겠습니다. 노드 100 에서 마우스 오른쪽 버튼으로 클릭하고
Keep Selected를 선택합니다.


-
도출된 결과를 통해, 2~3 명의 자녀를 둔 주택 소유자인 고객이 일반적으로 좋은 평판을 받았습니다.
-
이를 통해 우리는 개별 customer_id로 보다 심도있게 하여 마케팅 캠페인을 실행하거나 추가 분석을 수행 할 수 있습니다. Oracle Machine Learning과 결합된 다양한 시각화는 다양한 비즈니스 애플리케이션을 지원하는 흥미로운 데이터 패턴을 식별 할 수있는 방법을 제공합니다. 이 경우 Emma는 제한된 마케팅 예산을 판매 프로모션의 효과를 극대화하는 활동에 집중할 수 있습니다.

































































