e5b JMP
검색
메뉴
고정 헤더 영역
글 제목
메뉴
좋아요
-
댓글달기
-
공유하기
메뉴 레이어
e5b JMP
메뉴 리스트
홈
태그
방명록
분류 전체보기
(58)
검색 레이어
e5b JMP
검색 영역
컨텐츠 검색
블로그 내 검색
상세 컨텐츠
본문 제목
[JMP] 유용한 Cols 메뉴 (2/2)
카테고리 없음
by
e5b
2024. 3. 18. 22:59
본문
좋아요
-
댓글달기
0
반응형
설명
JMP 상단 메뉴 아래와 같다.
그중 대부분은 Tables / DOE / Analysis / Graph 메뉴를 주로 사용한다. (내 기준)
잘 알다시피 데이터 분석 시 가장 시간이 소요되고 지겨운 작업이 데이터 전처리 작업인데 Cols 메뉴를 알고 있으면 매우 쉽고 편리하게 데이터 전처리를 진행할 수 있다.
그래서 Cols 메뉴에 대해 설명하고자 한다. 이번에는 특히 Utilities 메뉴에 대해 설명하고자 한다.
4. Utilies\Compress Selected Columns
파일을 압축해 준다.
Column의 숫자의 자릿수가 크거나 Formula를 사용하여 계산 값의 자릿수가 클 경우 이를 압축해 준다.
.
8~9개의 Formula가 반영된 파일이 5.2M였는데 Compress Selected Columns 기능을 사용하면 4.8M로 줄어들었음을 확인할 수 있었다. 큰 데이터를 다루는 경우에는 해당 기능이 메모리 확보에 유용하다.
자세한 내용은 아래 링크를 참조
https://www.jmp.com/support/help/en/17.2/index.shtml#page/jmp/compress-selected-columns-in-data-tables.shtml
5. Utilies\Text to Column
엑셀의 텍스트 나누기 기능과 동일한 기능이다.
.
Make Indicator Columns를 선택하면 카테고리에 따른 여부를 0과 1로 표시할 수 있고 추가로 Include Missing 체크박스를 선택하면 공란까지 조건에 반영된다.
예를 들어 Car Physical Data라는 Data Table에는 Country Column이 있는데 USA, JAPAN, Other로 구성되어 있다. 이름의 Column을 각각 만들고 해당 여부를 0과 1로 표시하게 된다.
6. Utilies\Combine Columns
앞선 Text to Columns와 반대의 기능이다. 여러 개의 Column을 하나의 Column으로 합치는 기능이다.
구분 기호(Delimiter)를 추가할 수 있다.
해당 기능은 Numeric / Character 형식의 Column도 사용할 수 있고 두 형식의 조합으로 사용할 수 있다.
이를 통해 다양한 조건을 구성하여 데이터 분석 시에 필터링 기능으로 유용하게 사용할 수 있다.
7. Utilies\Make Binning Formula
Numeric Column을 사용자가 원하는 구간으로 구분하여 Character 형식의 Column을 생성해 준다.
이를 Data Filtering으로 활용하거나 각각 나눠서 분석 시 사용되는 By 항목으로 사용할 수 있기에 유용하다.
아래 Cars 1993라는 이름의 Data Table에서 Minimun Price 이름의 Column은 6.7~45.4의 분포를 가지고 있다. 이를 0~10 / 10~25 / 25~40 / 40 이상으로 구분 지어지는 Column을 만들고자 한다.
Cols\Utilities\Make Binning Formula를 선택하면 아래와 같은 윈도가 나타난다.
오른쪽 상단 + / - 버튼을 클릭하여 Binning 개수를 설정하고, 빨간색 라인을 움직이거나 오른쪽에서 숫자를 수정하여 원하는 구분을 설정하면 된다.
Make Formula Column 버튼을 클릭하면 아래와 같이 구분된 Column이 생성되었음을 확인할 수 있다.
동일한 간격 / 원하는 구분 개수 / 평균과 표준편차에 따른 구분 등 일반적인 구분 조건에 대해서는 ▼(프로파일러) 기능에 추가되어 있어 쉽게 형성이 가능하다.
8. Utilies\New Column by Text Matching
Character 형식의 Column에 대해 전화번호 중간에 -(하이픈)을 넣거나 영어 또는 한글 글자만 추출하거나 특정 단어만 추출하는 등의 정규식을 사용하여 새로운 Column을 생성한다.
하단 + 버튼을 누르면 기본적으로 Built-in 되어 있는 정규식 리스트가 있어 바로 사용하거나 불러와서 수정하여 사용할 수 있습니다.
아래 CrabSatellites 이름의 Data Table에서 Spine Column과 Width Column을 Combine 하여 test라는 Column을 생성하였다. 여기서 해당 기능을 사용하면 문자만 추출된 새로운 컬럼을 만들고자 한다.
New Column by text Macthing을 실행하고 + 버튼을 클릭하면 여러 정규식 리스트가 나온다. 여기서 Words라는 정규식을 선택하고 OK를 선택한다
Words 정규식을 선택하고 OK를 선택하면 새로운 Column이 형성된다. 여기서 Regex 항목에서 정규식을 변경할 수 있다. 기존 Column에서 숫자와 기호 / 가 제거된 문자로만 이루어진 Column이 생성되었음을 확인할 수 있다.
9. Utilies\Labels to Codes
Character 형식의 Column을 Code 값으로 변환시켜줍니다.
내용이 긴 Character 형식의 Column을 Group / Frequancy / By / Weight 등의 형식으로 구분하여 데이터를 분석할 시 메모리를 확보하기 위해 해당 값을 간단한 Code 값으로 만들어주는 기능입니다.
반응형
공유하기
게시글 관리
e5b JMP
추가 정보
인기글
최신글
티스토리툴바