본문 바로가기

Computer55

[확률과 통계] f-value와 ANOVA의 의미 https://youtu.be/VZ6WPnI82Z8 여러 표본 집단의 차이 연구 조사/연구 진행 시 여러 표본 집단의 차이를 비교한 필요가 있음. 주로 표본 평균의 차이를 비교하고자 함. 가령, 음식 A, B가 몸무게에 어떤 영향을 주는지 확인하기 위한 실험 방법은? 구성원들 간 차이가 없는 표본 집단을 그룹 1 (대조군), 그룹 2 (음식A) 그룹 3 (음식B)로 나누고, 몸무게 평균값을 비교함. 그런데 각 표본집단의 오차가 존재함. F-value의 의미: 차이 / 불확실도 통계적으로 비교할 때에는 세 표본 그룹의 평균값 차이를 계산하면서, 동시에 표본 그룹의 평균값들은 오차를 수반한다는 사실을 함께 염두해야 함. -> 표본 평균 차이의 통계적 지표: 차이 / 불확실도 (즉, F-value는 본질적으로.. 2021. 8. 27.
[확률과 통계] t-value의 의미와 스튜던트의 t-test https://youtu.be/J2sv6NNu1-M 검정 통계량이란? 모집단, 모수, 표본, 표본 통계량에 대한 설명은 지난 영상에서 다루었음. 모집단은 관심을 가진 집단 전체, 모수는 이런 모집단의 특성을 나타내는 지표. 모수를 알고 싶으나 알기 힘들기 때문에 표본을 추출함. 무작위 추출이 가장 중요. 표본 추출해 얻은 것이 표본 통계량. 표본 통계량은 추정치이기 때문에 추정 오차가 생김. 표본 통계량의 표준 편차 = '표준 오차' 검정 통계량: '통계적으로 비교 분석한다'라고 할 때 사용하는 t, z, F, x^2등을 통칭. 통계적 가설의 진위여부를 검정하기 위해 '표본으로부터 계산'하는 통계량 표본 통계량을 2차 가공한 것 (표본 통계량에 뭔가를 곱하거나 더하거나 했다는 뜻) t-value의 의미:.. 2021. 8. 26.
[확률과 통계] 표본, 표준 오차 https://youtu.be/bIYBi8HjXAQ 통계학의 목적 1. 데이터의 기술 2. 모르는 것의 예측과 추측 통계적 추론: Big Picture 모집단과 표본 집단 검정을 위한 통계학을 이해하기 위해선 모집단, 표본 집단에 대한 이해는 매우 필수적임. 모집단과 모수 모집단: 정보를 얻고자 하는 관심대상의 전체집단. 수학적으로 알려진 분포(ex. 정규분포)를 따를 수 있음. 모수: 모집단의 분포가 가지는 특성값 -> 모집단의 분포를 묘사할 수 있음. 평균, 분산, 표준편차, 모비율 등 모수를 정확히 아는 것은 불가능하다. 어떻게 하면 추론할 수 있을까? 표본 집단과 표본 통계량 표본: 모집단의 부분집합 표본을 추출하는 이유: 모수는 얻고 싶지만, 모집단을 전수조사하기는 어려움. 표본의 가장 중요한 .. 2021. 8. 26.
[확률과 통계] 베이즈 정리 https://youtu.be/euH9C61ywEM 베이즈 정리의 공식 P(H|E) = P(E|H)*P(H)/P(E) 이 공식에는 네 개의 확률이 포함되어 있음. 그 중에서 P(H), P(H|E)가 핵심인데, 각각 사전확률, 사후확률이라고 불린다. 베이즈 정리는 사전확률과 사후확률의 관계에 대해 설명하는 것임 베이즈 정리를 이해하기 어려웠던 이유 확률에 대한 관점의 변화가 필요: 전통적인 관점(빈도주의)와 새로운 관점(베이지안 주의)간 차이가 있음. '동전의 앞면이 나올 확률이 50%다' -> 빈도주의: 100번 동전 던지면 50회 앞면 나온다. -> 베이지안 주의: 동전의 앞면이 나왔다는 주장의 신뢰도가 50%이다. 용어 정리 P(H|E) = P(E|H)*P(H)/P(E) E, H가 구체적으로 의미하는.. 2021. 8. 26.
[Do it! 구글 애널리틱스] 3장. 데이터 수집을 위한 기본 설정 바꾸기(2) 03-3 필터로 불필요한 데이터 걸러내기 필터를 활용하면 분석의 편의와 분석 결과의 정확도를 높일 수 있음 - 순도 높은 데이터 만들기 데이터는 많을수록 좋다? 반은 맞고 반은 틀림. 좋은 데이터가 많을 수록 좋은 것. - 사내 트래픽 차단하기 웹 사이트 관리자 (=나)는 웹 사이트에 많이 방문할 수밖에 없음. 따라서 내 아이피를 차단하는 것이 필요함. 1. 내 계정 - 원하는 속성 - Test View 로 보기, 2. 톱니바퀴 설정버튼 누르고 '보기' - '필터' 누르기. 3. '필터 추가' 누르기 4. '필터 이름', '필터 유형', '필터 입력란', '필터 패턴' 설정. '저장' 누르기. 참고로 본인 컴퓨터의 IP는 네이버, 구글에 '내 아이피 확인'을 검색하면 확인할 수 있음. * 필터 패턴에 I.. 2021. 8. 11.
[Do it! 구글 애널리틱스] 3장. 데이터 수집을 위한 기본 설정 바꾸기(1) 03-1 인구 통계 및 관심 분야 인구 통계, 관심 분야의 경우 개인정보와 관련되어 있어 직접 활성화시키지 않으면 꺼져있음. - 인구 통계 인구 통계: 성별, 연령 사용자 범위를 좁혀서, 핵심 사용자 중심으로 문제에 접근 가능. - 관심 분야 관심 분야: 웹 콘텐츠에서 사용자가 선호하는 주제 (쇼핑, 비즈니스, IT, 여행, 미용, 스포츠 등) GA는 관심도 카테고리 & 구매 계획까지 제공함 - 구글이 사용자를 파악하는 방법 사용자가 직접 본인의 정보를 입력하는 것이 아닌, 사용자를 예측하는 알고리즘을 가지고 있음. 구글의 광고 데이터에 기반하여 예측함. 광고 설정 (google.com) 로그인 - Google 계정 하나의 계정으로 모든 Google 서비스를 Google 계정으로 로그인 accounts... 2021. 8. 11.