SPSS에서 사용하는 분석법, 브라이틱스에서는 어떻게 할까? 프로젝트 8주차 이야기

안녕하세요 여러분 이번 주 역시 개인 프로젝트 때문에 엉덩이가 터질 때까지 앉아 있었어요.지난주까지 분석한 것을 바탕으로 이번 주에는 보고서 정리를 시작하려고 했지만 인간의 욕심은 끝이 없다고 하네요, 이번 주에는 무려 계획에 없던 분석을 즉흥적으로 진행했습니다!제 MBTI가 NFP입니다. (TMI)

왜 즉흥적으로 했냐고요?사실 요즘 사회조사분석사 실기공부를 하면서 SPSS를 공부하고 있는데 이번에는 정말 제대로 공부하면서 지금까지 완벽하게 이해하지 못했던 분석방법을 배우고 있습니다.

그리고 저는 브라이틱스 열혈 팬이기 때문에 ‘SPSS에서 가능한 것은 당연히 브라이틱스에서도 할 수 있다!’라고 생각하고 새로운 분석 방법을 공부하는 대로 제 개인 프로젝트에 최대한 적용시키려고 노력하고 있습니다.물론 아직은 서툴지만 하하하.

그래서 오늘은 제 프로젝트 진행 상황도 보여드리면서 동시에 전공자뿐만 아니라 사회과학, 경영계열 학생들도 많이 사용하는 SPSS와 비교하여 브라이틱스의 용이성을 설명하고자 합니다!

우선 본격적으로 이번 주에 분석을 시작하기 전에 사고 통계 데이터를 분석하기 쉽게 편집해 주었습니다.각 데이터별로 사고건수, 사망자수, 부상자수 변수가 따로 있었지만 실제 3가지 변수를 통해 사고의 심각성을 평가하거나 상황적 요소를 추론할 수 있다면 하나하나 살려두되 단순히 사고, 사망, 부상만으로는 유의미한 해석이 불가능하다고 평가했습니다.

이러한 과정을 SPSS로 진행하면 변수 계산 기능을 통해 실행됩니다.SPSS에서 변수계산법을 배운 분이라면 브라이틱스에서도 문제없이 변수를 추가할 수 있습니다.(웃음)

브라이틱스에서는요.

AddFunction Columns 함수를 추가합니다.

addcolumn 부분의 칼럼명을 “all”로 설정하여 간단하게 조건을 작성하세요!

오른쪽 끝에 깔끔하게 새로운 칼럼이 생겼죠?기존 사고 건수, 사망자 수, 부상자 수 데이터도 만일을 대비해 남겨두고 있습니다.

여기까지는 SPSS와 비슷하지만 빼놓을 수 없는 브라이틱스만의 기특한 점이 있습니다.시각화!

일단 SPSS 차트 그리는 것부터 볼까요?

사실 아직 SPSS로 차트를 그린 적은 없지만 저 같은 초보자가 접하기에는 조금 어렵습니다.설정창도 기초적인 지식이 없으면 복잡하게 느껴질 수 있습니다. 무엇보다 예쁘지 않아요.

SPSS 나에게 왜그래..

자, 그럼 브라이틱스의 경우를 보도록 하겠습니다.브라이틱스 엔 데이터에 바로 적용할 수 있는 차트 종류가 5조 5억 개~가 아니라 32개!

나는 연도별로 구분하기 위해 Column을 선택해 주었습니다.

차트 세팅은 x축은 달, y축은 새로 만든 변수를 넣고 Colorby를 통해 연도별로 나눠드렸습니다!

그 결과 짜잔 2019년을 제외하고는 5월에 가장 많은 사고가 발생했음을 알 수 있습니다.2019년에도 가장 많은 사고가 난 6월과 근소한 차이를 보이고 있습니다. 왜 그럴까요?상황적 요소는 좀 더 알아봐야겠지만 아무래도 5월은 소풍, 어린이날, 체육대회 등 아이들을 대상으로 하는 행사가 많기 때문에 학교 앞 교통량이 많아지고 동시에 아이들도 조금 즐겁기 때문에…? 그렇지 않을까 추측하고 있습니다.결과 해석에 대해서는 좀 더 시간을 두고 생각해봐야 할 것 같습니다.

아무튼 사고 통계 데이터는 다 이런 식으로 다듬어 줬어요.

그리고 또 설문조사 데이터의 늪에 빠져 버렸습니다.먼저 카이제곱테스트에 도전해봤습니다.카이제곱테스트는 교차분석이라고 합니다.변수 간의 독립성을 검정하는 방법입니다.

H0:X와 Y는 서로 독립하다(서로 관련이 없다) H1:X와 Y는 서로 독립적이지 않다(서로 관련이 있다)를 기본 가설로 세워서 시작하는데,

나는 이번에 child(자녀 유무) 변수와 n_child(친척 중 자녀 유무) 변수와 사고 민감도, 법률 개선 인식의 독립성을 각각 검정해 보았습니다.내친김에 면허 유무 변수와 성별 변수까지 같이 돌려봤습니다.

서로 독립이라는 귀무 가설을 기각하려면 P-value 값이 유의 수준인 0.05보다 작게 나와야 합니다.저는 사고 민감도와 법률 개선 인식 모두 4가지 변수 중 자녀 유무에만 유의한다고 나왔습니다(p값 각각 0.006, 0.03).

이는 한번에 다양한 변수를 넣어 분석할 수 있다는 점에서 SPSS와 비슷하지만 다양한 변수에 대한 결과를 한꺼번에 모아볼 수 있다는 점에서 브라이틱스가 좀 더 편리할 것 같습니다.사심 100% 맞습니다

그다음은 Two Samplet-test를 실시했습니다.Two Samplet-test는 특정 변수에 대해 값이 두 변수를 기준으로 유의한 차이가 있는지 알아보는 방법입니다.

responsecolums에 차이가 있는지 궁금한 변수를 넣어두고 그 기준이 되는 두 값을 가지고 있는 변수를 FactorColumn에 넣습니다.먼저 면허 유무에 따라 감도와 개선 인식에 차이가 있는지 먼저 살펴보았는데, 이 역시 유의 확률이 유의 수준 0.05보다 작은 결과만 살립니다.법률 개선에 대한 인식은 면허 유무에 따라 차이가 있다고 합니다!

성별을 기준으로 돌려봤는데 여기 역시 법률 개선 인식만 유의미한 결과가 나왔네요!

이외에도 자녀 유무, 친척 중 자녀 유무 변수를 기준으로 해 보았으나 유의미한 결과는 없었습니다.쉽게 살아가면 재미없는 빙고

이번 포스팅은 어땠나요?오해하실까봐 말씀드리지만 저는 당연히 SPSS에 악감정은 없습니다. (웃음) SPSS도 평생 안고 갈 파트너입니다.(필연) 다만 제 기준 분석 플랫폼의 원톱은 브라이틱스이기 때문에 더 많은 분들이 브라이틱스의 편의성을 알아주셨으면 하는 바람에서 기초적인 분석이 SPSS와 브라이틱스에서 각각 어떻게 진행되는지 비교한 거죠 ㅎ 아무튼! 이번 주도 너무 덜컹 분석을 마쳤어요.다음 주에도 재미있는 분석 이야기로 만나러 올 테니 기대해 주세요.~~~

  • 본 포스팅은 삼성SDS Brightics 서포터즈 활동의 일환으로 직접 활동하여 작성한 글입니다.

error: Content is protected !!