상세 컨텐츠

본문 제목

JMP-Enhanced Datasets 2. Cost of Goods (1/3)

카테고리 없음

by e5b 2024. 3. 7. 23:19

본문

반응형

 

설명

  • JMP 측에서 통계 분석 수업에 활용하도록 만들어진 Data와 예제
  • 통계 분석을 통한 문제 해결 과정 강의 및 숙제용으로 설계
  • JMP 홈페이지에 현재 20가지 사례 데이터가 있음
  • https://www.jmp.com/en_nl/academic/course-materials/enhanced-datasets.html
  • 그중 두 번째 내용 Cost of Goods (Analysis Technique : Graphical Analyses)
 

Enhanced Datasets

 

www.jmp.com

 

 

 

 

예제 파일

 

    • 미국 노동통계국 가지고 있는 생필품(식료품과 공공요금) 가격의 역사적 데이터
    • 생필품의 가격 변화를 분석을 통해 정책 수립 시 활용한다고 함

 

Data Table 구성

    • Month-Year 이름의 Ordinal 형식의 Column과 Bananas에서부터 Gas_Home까지의 가격 데이터로 구성되어 있다.

 

 

 

풀이 1.

    • 질문 : Create a time series graph for each of the items. Provide a few short sentences describing some of the key features these graphs display for each item (e.g., Describe the general trend. Describe the variation around that general trend. Is the variation large/small? Is the variation consistent in any way, or is it sporadic? Are there time periods when the prices significant descrease/increase much more than other time periods? Any seasonal patterns? Any time periods where prices stand out as being very different from the rest?)
      • 각 상품에 대한 시계열 그래프를 그리고 상품의 가격 변화에 대한 의견을 제시하라 (예: 일반적인 추세 및 추세에 대한 변동(크기나 산포)을 설명하세요. 가격의 변화의 특이점 등)

 

 

    • 데이터 전처리
      • Data Table의  Month-Year Column을 우클릭하여 Column Info을 선택하여 보면 월-연도가 날짜 포맷으로 표시되어 있음을 알 수 있다.

 

      • 분기(Quarter) Column을 새로 생성하기 위해 위 Column을 우클릭\New Column Formula\Data Time\Quarter를 선택한다. 별도의 새로운 Column을 만들고 Formula를 만드는 수고 없이 간단한 수식에 대해서는 바로 새로운 Column을 만들 수 있는 것이 JMP의 장점 중 하나이다.

 

      • 동일하게 Year Column도 하나 추가로 생성한다. 그리고 Data Table의 좌측 Column list에 생성된 Year Column의 아이콘을 클릭하여 Nonimal로 변경한다.

 

 

  • Graph Builder를 열고 X축에는 Month-Year, Y 축에는 Bananas, Color에는 Quarter를 올려놓고 상단 아이콘을 Point와 Line Plot를 선택한다. 좌측 Line 메뉴에서 Missing Values 항목을 Connect Dashed로 선택한다. 이렇게 하면 중간에 데이터가 없는 부분이 점선으로 표시되어 어느 부분이 데이터가 Missing 되었는지 시각적으로 확인할 수 있다.

 

    • X축을 더블 클릭하면 축 서식 윈도우가 팝업 되는데 Tick/Bin Increment에서 Increment 를 1year로 한다. Graph Builder의 ▼를 클릭 Redo\Column Switcher를 선택하여 변경한 Column인 Bananas를 선택하고 변경할 Column인 Bananas~Gas Home까지 선택한다.

 

    • 추가로 상단 아이콘 중에서 Caption Box를 클릭하고 좌측 Caption Box의 메뉴에서 Summary Statistic 에서 표시할 통계량으로 Mean / 5 Number Summary를 추가한다. 여기서 5 Number Summary는 대표적인 통계량인 median / min / max / Q1 /Q3를 말한다. 그리고 Location 을 Axis Reference Line을 선택하면 위에 선택한 통계량 값이 그래프에 라인으로 표시가 된다.

 

    • 기간에 따른 통계량 값들이 어떻게 변하는지를 그래프에서 확인할 수 있도록 Graph Builder의 ▼를 클릭 Local Data Filter를 선택하고 Column은 Month-Year를 선택한다. Month-Year의 ▼클릭 Modeling Type을 Continouns로 바꾼다. 그러면 원하는 기간을 쉽게 변경할 수 있음을 알 수 있다.

 

    • 마지막으로 그래프의 불필요한 부분을 없애기 위해 Alt + ▼ 클릭하여 Title, Legend, Footer, X Axis Title, Y Axis Title을 선택 해제한 다음 Done을 눌러서 마무리한다.
.

 

 

    • 상품수가 많으므로 몇가지 상품만 분석한 결과는 다음과 같다. 
    • 풀이 : Bananas
      • 직관적으로 바나나 가격은 2088년도에 급상승하였고, 이후 점차 하락하다가 2021년 이후 다시 상승한 것을 알 수 있다.
      • Data Filter를 통해 2008년도 이전의 가격의 평균은 약 0.50에서 이후 평균은 약 0.59으로 상승된 것을 파악할 수 있다.
      • 2008/2009년 2018/2021년을 제외한 연도에는 가격의 변동이 크지 않음을 알 수 있다.

 

 

    • 풀이 : Orange
      • Orange의 가격은 연도별로 계속 상승하고 있음을 알 수 있다.
      • 분기별 가격 편차가 높다는 것도 알 수 있다.
      • 2/3분기에는 가격이 상승하고 1/4분기에는 가격이 떨어지는 경향이 있다.

 

 

    • 풀이 : Tomato
      • 가격의 상승은 2003~2023년 동안 크게 상승하지 않았지만, 특정 연도에서 가격이 급상승했음을 알 수 있다. 특히 1/4 분기에서 가격이 상승하는 경향을 보면 겨울철 수급에 의한 가격 상승이 아닐까 추정할 수 있다.

 

 

    • 풀이 : Bread
      • 2003년부터 2088년까지 가격이 상승하였다가 2020년까지 가격에 큰 변동이 없었다.
      • 이후 4년 동안 가격이 계속 급상승한 것을 알 수 있다.
      • 가격이 급상승되기 전에는 가격이 변동이 크지 않았음을 알 수 있다.

 

 

    • 풀이 : Milk
      • 2007년 가격이 급상승했다가 2009년 가격이 안정화되었다.
      • 다시 가격이 상승하여 2015년에 예전 수준으로 가격이 상승하였다가 2018년 다시 가격이 안정화되었다.
      • 이후 가격이 계속 상승하여 2023년 가격이 최대로 상승했다.

 

 

    • 풀이 : Eggs
      • 2015년까지 안정적인 가격 상승을 보였다.
      • 2015년 가격이 급상승하였다가 2016년 가격이 다시 회복하였다.
      • 이후 2022년부터 가격이 급상승하였다가 2023년 가격이 다시 회복하고 있다.
      • 2015/2023년 특정한 문제(Flu)로 가격이 급상승하였다가 이에 대한 대책이 나오고 가격이 하락하는 특징을 보이는 것으로 판단할 수 있다.

 

 

    • 풀이 : Chicken
      • 2013년까지 가격이 점차적으로 상승하였다
      • 이후 2020년까지 가격은 안정적으로 변동이 없었다.
      • 2020~2021년 가격이 요동치다가 이후 가격이 급상승했음을 알 수 있다.

 

 

 

    • 이런 식으로 Column Switcher를 통해 상품을 바꿔가면서 그래프 추이를 확인할 수 있고 Quarter 별로 색상을 구별하여 분기별 특징을 파악할 수 있다. 또한 Data Filter를 통해 날짜 변경하면서 평균 가격 및 변동성을 파악할 수 있다.

 

 

반응형