Two-way ANOVA

JiHun
Two-way ANOVA란? 독립변수가 2개 + α 인 ANOVA 독립변수가 2개라는 것은 무슨 뜻일까? 앞의 예제를 생각해보면, Payment Method라는 첫번째 독립변수에 더하여 Contract라는 두번째 독립변수가 등장 즉, Payment Method의 네가지 그룹에 따라 종속 변수인 Total Charges가 변화할 것이라고 예측하고, 동시에, Contract의 세가지 그룹에 따라 종속변수인 Total Charges가 변화할 것이라고 예측하는 것임 여기서 독립변수는 Main effect(주효과)가 있다고 함 즉, Two-way ANOVA에서는 Main effect가 2개임 그렇다면 여기서 α는 무엇인가?

One-way ANOVA

JiHun
유튜브 Sapientia a Dei 채널에서 공부한 내용을 정리하였습니다. One-way ANOVA 비교할 집단이 세 개 이상인 경우 t-test를 세 번하면 될 것 같았으나 할 수 없음 1종오류에 빠짐 따라서, 우리는 새로운 방법을 배워야 함 그 새로운 통계 방법이 바로 One-way ANOVA임 One-way는 독립변수가 하나라는 뜻 ANOVA는 Analysis of Variance의 약자 한국말로는 분산분석이라고 함 변수 독립변수 독립인 변수 - 무엇으로부터 독립일까요?

t-test

JiHun
t-test 모집단의 표준편차가 알려지지 않았을 때, 정규분포의 모집단에서 모은 샘플(표본)의 평균값에 대해 가설검정 방법 t-test 목적 목적 : 두개의 집단이 같은지 다른지 비교하기 위해 사용한다. 그런데, 여기서 ‘집단’이라는 표현이 다소 애매하다. 통계에서 일반적으로 집단이란 샘플(표본)을 이야기 한다 그러나 샘플(표본)만 존재하는 것은 아니다 모집단(영어로 population)이라는 것도 있다 모집단 중에 일부를 표본으로 뽑아서 연구하거나 조사한다.

통계 기초

JiHun
유튜브 Sapientia a Dei 채널에서 공부한 내용을 정리하였습니다. 통계적인 사고방식이란? “어떤 사건이 우연히 발생할 확률이 얼마일까?” 라고 묻는 것 평균 자료의 중심값으로서 자료의 특성을 대표하는 값 분산 내가 가진 자료(데이터)가 평균값을 중심으로 퍼져있는 평균적인 거리 p-값이란? p-value : probability value, 즉 p-값이란 확률값이다. p-값이 0.05보다 작다는 것은 어떤 사건이 우연히 발생할 확률이 5% 보다 작다는 의미가 된다.

Kafka 기본개념 및 생태계

JiHun
Before Kafka 엔드투엔드(end-to-end) 연결 방식의 아키텍처 데이터 연동의 복잡성 증가(하드웨어, 운영체제, 장애 등) 각기 다른 데이터 파이프라인 연결 구조 확장에 엄청난 노력 필요 모든 시스템으로 데이터를 전송 실시간 처리도 가능한 것 데이터가 갑자기 많아지더라도 확장이 용이한 시스템이 필요함 After Kafka 프로듀서/컨슈머 분리 메시지 데이터를 여러 컨슈머에게 허용 높은 처리량을 위한 메시지 최적화 스케일 아웃 가능 관련 생태계 제공 Kafka broker 실행된 카프카 애플리케이견 서버 중 1대

쿠베플로우

JiHun
쿠베플로우가 필요한 이유 Kubeflow Kubernetes 용 ML 툴킷이다 다음 다이어그램은 Kubernetes를 기반으로 ML 시스템의 구성 요소를 배열하기 위한 플랫폼으로서 Kubeflow를 보여준다. 쿠베플로우의 디자인과 핵심 컴포넌트 쿠베플로우는 다음 3가지 기능으로 정의할 수 있다. 조합가능성(Composability) 쿠베플로우의 핵심 구성 요소는 이미 머신러닝 실무자들에게 익숙한 데이터과학 도구를 사용한다. 이들은 기계 학습의 특정 단계를 용이하게 하기 위해 독립적으로 사용되거나 엔드 투 엔드 파이프라인을 형성하기 위해 함께 구성될 수 있다. 이식성(Potability) 컨테이너 기반 설계를 갖추고 Kubernetes 및 클라우드 네이티브 아키텍쳐를 활용함으로써 Kubeflow는 특정 개발환경에 종속될 피요가 없다.

linux 명령어 정리

JiHun
관리자 권한 얻기 root 권한 실행(sudo) $ sudo reboot $ sudo halt root 사용자로 전환 $ sudo su - root 리눅스 파일 시스템 root home : 윈도우의 사용자 폴더와 같음, 사용자 추가할때마다 home에 디렉토리가 만들어짐 bin : 실행 파일을 두는 곳 mnt, media : 리눅스나 유닉스는 루트로부터 파생되는 특정 디렉토리에 장치들을 엮어쓰게됨. 엮어쓰는 장치의 디렉토리로 과거에는 mnt(마운트)를 썼었음. 만약에 CD-ROM을 연결해 쓰고 싶을 때 CD-ROM 데이터를 어떻게 읽냐면 자기 혼자 루트를 갖는게 아니라 루트에서 어느 디렉토리에 연결해서 쓰게됨 그게 mnt 디렉토리이다.

리눅스 쉘스크립트(변수, 값, 문자)

JiHun
리눅스 쉘 스크립트 유닉스 환경에서 간단한 프로그램을 작성하거나, 유닉스 명령어들을 조합해서 사용할 수 있도록 도와주는 프로그램 도구 #!/bin/bash val=“hello” if [ $val == “hello” ]; then echo “hello” elif [ $val == “hi” ]; then echo “hi” else echo “else” fi 변수 변수 선언은 “=“를 사용 name=“hero” age=30 echo ${hero} echo $age 변수 선언시 공백이 없도록 한다!!! name = hero(X) 변수 $0 - The name of the Bash script.

CRUD 게시판 만들기

JiHun
MVC 패턴 설명 루비 온 레일즈를 이용해 게시판을 만들면서 MVC 패턴을 만들어보고 DB와 연결해 CRUD를 실습 우리가 브라우저에서 jocoding.com/board라고 붙이면 Router에서는 이 board를 읽어서 Controller에게 게시판이 왔다고 전달해준다. 그러면 Controller에서는 Model을 통해 DB 정보를 불어와서 게시글 정보를 가져온다, 그리고 View를 통해서 그 게시물에 HTML, CSS 요소를 첨가해 준 뒤에 우리가 보는 화면으로 전송해준다. POST 우리가 만든 Form 화면이 Client Side에 떠 있을 텐데 우리가 제목과 내용 정보를 채워주고 /create라는 주소로 보내줬습니다.

AWS RDS로 데이터베이스 구축 및 Heidi SQL를 이용해 AWS RDS 접속

JiHun
Amazon RDS 생성 MySQL 선택 MySQL에 접속할 때 사용하는 id, password 설정 고급 설정 구성, VPC 및 서브넷 그룹은 기본 설정 그대로 사용 퍼블릭 액세스 가능성을 ‘예’로 설정하면 전 세계 어디에서나 데이터베이스 주소를 이용해서 접근 가능하다. 반면에 VPC라는 일종의 내부망 기능을 이용해서 자신이 만든 EC2에서만 접근하도록 만들고 싶다면 ‘아니오’로 설정한다. 간단히 테스트 목적으로 사용할 경우 ‘예’로 설정한다. 삭제 방지 활성화 체크 파라미터 그룹 생성 데이터베이스가 한글 처리를 할 수 있도록 파라미터 그룹 생성