상세 컨텐츠

본문 제목

[JMP] 유용한 Cols 메뉴 (2/2)

카테고리 없음

by e5b 2024. 3. 18. 22:59

본문

반응형

 

설명

  • JMP 상단 메뉴 아래와 같다.

 

  • 그중 대부분은 Tables / DOE / Analysis / Graph 메뉴를 주로 사용한다. (내 기준)
  • 잘 알다시피 데이터 분석 시 가장 시간이 소요되고 지겨운 작업이 데이터 전처리 작업인데 Cols 메뉴를 알고 있으면 매우 쉽고 편리하게 데이터 전처리를 진행할 수 있다.
  • 그래서 Cols 메뉴에 대해 설명하고자 한다. 이번에는 특히 Utilities 메뉴에 대해 설명하고자 한다.

 

 

 

4. Utilies\Compress Selected Columns

    • 파일을 압축해 준다.
    • Column의 숫자의 자릿수가 크거나 Formula를 사용하여 계산 값의 자릿수가 클 경우 이를 압축해 준다.
.
 

 

 

 

5. Utilies\Text to Column

    • 엑셀의 텍스트 나누기 기능과 동일한 기능이다.
.
    • Make Indicator Columns를 선택하면 카테고리에 따른 여부를 0과 1로 표시할 수 있고 추가로 Include Missing 체크박스를 선택하면 공란까지 조건에 반영된다.
    • 예를 들어 Car Physical Data라는 Data Table에는 Country Column이 있는데 USA, JAPAN, Other로 구성되어 있다. 이름의 Column을 각각 만들고 해당 여부를 0과 1로 표시하게 된다.

 

 

 

6. Utilies\Combine Columns

    • 앞선 Text to Columns와 반대의 기능이다. 여러 개의 Column을 하나의 Column으로 합치는 기능이다.
    • 구분 기호(Delimiter)를 추가할 수 있다.
    • 해당 기능은 Numeric / Character 형식의 Column도 사용할 수 있고 두 형식의 조합으로 사용할 수 있다.
    • 이를 통해 다양한 조건을 구성하여 데이터 분석 시에 필터링 기능으로 유용하게 사용할 수 있다.

 

 

 

7. Utilies\Make Binning Formula

    • Numeric Column을 사용자가 원하는 구간으로 구분하여 Character 형식의 Column을 생성해 준다.
    • 이를 Data Filtering으로 활용하거나 각각 나눠서 분석 시 사용되는 By 항목으로 사용할 수 있기에 유용하다.
    • 아래 Cars 1993라는 이름의 Data Table에서 Minimun Price 이름의 Column은 6.7~45.4의 분포를 가지고 있다. 이를 0~10 / 10~25 / 25~40 / 40 이상으로 구분 지어지는 Column을 만들고자 한다.

 

    • Cols\Utilities\Make Binning Formula를 선택하면 아래와 같은 윈도가 나타난다.

 

    • 오른쪽 상단 + / - 버튼을 클릭하여 Binning 개수를 설정하고, 빨간색 라인을 움직이거나 오른쪽에서 숫자를 수정하여 원하는 구분을 설정하면 된다.

 

    • Make Formula Column 버튼을 클릭하면 아래와 같이 구분된 Column이 생성되었음을 확인할 수 있다.

 

    • 동일한 간격 / 원하는 구분 개수 / 평균과 표준편차에 따른 구분 등 일반적인 구분 조건에 대해서는 ▼(프로파일러) 기능에 추가되어 있어 쉽게 형성이 가능하다.

 

 

 

8. Utilies\New Column by Text Matching

    • Character 형식의 Column에 대해 전화번호 중간에 -(하이픈)을 넣거나 영어 또는 한글 글자만 추출하거나 특정 단어만 추출하는 등의 정규식을 사용하여 새로운 Column을 생성한다.
    • 하단 + 버튼을 누르면 기본적으로 Built-in 되어 있는 정규식 리스트가 있어 바로 사용하거나 불러와서 수정하여 사용할 수 있습니다.
    • 아래 CrabSatellites 이름의 Data Table에서 Spine Column과 Width Column을 Combine 하여 test라는 Column을 생성하였다. 여기서 해당 기능을 사용하면 문자만 추출된 새로운 컬럼을 만들고자 한다.

 

    • New Column by text Macthing을 실행하고 + 버튼을 클릭하면 여러 정규식 리스트가 나온다. 여기서 Words라는 정규식을 선택하고 OK를 선택한다

 

    • Words 정규식을 선택하고 OK를 선택하면 새로운 Column이 형성된다. 여기서 Regex 항목에서 정규식을 변경할 수 있다. 기존 Column에서 숫자와 기호 / 가 제거된 문자로만 이루어진 Column이 생성되었음을 확인할 수 있다.

 

 

 

9. Utilies\Labels to Codes

    • Character 형식의 Column을 Code 값으로 변환시켜줍니다.
    • 내용이 긴 Character 형식의 Column을 Group / Frequancy / By / Weight 등의 형식으로 구분하여 데이터를 분석할 시 메모리를 확보하기 위해 해당 값을 간단한 Code 값으로 만들어주는 기능입니다.  

 

 

반응형